-
Notifications
You must be signed in to change notification settings - Fork 0
Releases: lxcshine/DocMind
Releases · lxcshine/DocMind
v0.1.2
@lxcshine
lxcshine
db4e1ed
This commit was created on GitHub.com and signed with GitHub’s verified signature.
核心架构改进
- doc_handler.py — 修复异步处理 bug
- 从 threading.Thread + asyncio.new_event_loop() 改为 FastAPI BackgroundTasks
- 解决了连接泄漏、错误吞没、与 uvicorn 事件循环不兼容的问题
- documents.py — 配合异步重构
- 更新文档处理 API 使用 BackgroundTasks 模式
- 修复了文件上传后 seek(0) 失败的问题
- raganything.py — 新增模型自动下载功能
- 添加 MinerU 模型自动检查和下载逻辑( _ensure_mineru_ready() )
- 修复 Windows MAX_PATH 260 字符限制问题(使用短路径)
基础设施改进
- state_db.py — 存储层重构
- 从内存 defaultdict / JSON 文件迁移到 SQLite
- 解决了多进程安全性、数据持久化问题
- batch_embedding.py — 性能优化
- 添加批量 embedding 服务,减少 API 调用 90%+
- 支持单次请求最多 2048 个文本
- context_manager.py — 上下文管理优化
- 从固定 token 预算改为自适应预算分配器
- 改进了分层摘要和上下文压缩逻辑
总结:主要修复了异步处理架构(从线程改为 BackgroundTasks)、存储层(从 JSON 改为 SQLite)、Windows 兼容性问题,并添加了知识图谱可视化、评估框架、MCP 集成等新功能。
Assets 2
v0.1.1
@lxcshine
lxcshine
fc4344a
This commit was created on GitHub.com and signed with GitHub’s verified signature.
主要内容包括6大核心特性 :
- ContextManager v2 - 解决 50 轮对话后遗忘问题
- MCP Server 集成 - 7 Tools + 2 Resources + 1 Prompt
- 三档文档处理模式 - Fast/Standard/Full
- 五模式 RAG 查询 - naive/local/global/hybrid/mix
- 自适应检索 - RF-Mem 启发的双路径策略
- Agentic 检索 - PageIndex 风格的工具调用
改进 :前端设计系统、后端 BatchProcessor、Docker 资源限制、Nginx 优化等
Bug 修复 :17 个关键问题,涵盖核心功能、文档处理、前端、Docker 部署