-
Notifications
You must be signed in to change notification settings - Fork 2
Milestones
List view
**预计工期**: 1 天 (AI 时间:6-8 小时) **目标**: 实现 Web Dashboard 的 X-Ray 功能,可视化检索过程 **核心功能**: - ✅ explain(query, doc_id) API 实现 - ✅ 返回详细得分分解:BM25 分数、向量相似度、关键词匹配 - ✅ Web X-Ray 面板(得分可视化、关键词高亮) - ✅ CLI explain 命令 **验收标准**: - 用户能看到 "为什么这个文档排第一" - X-Ray 面板显示 BM25/Vector/Combined 三个分数 - 匹配的关键词高亮显示 - CLI 和 Web 都能调用 explain
No due date•0/7 issues closed**预计工期**: 1 天 (AI 时间:4-6 小时) **目标**: 实现增量编译,只处理变更文件,大幅提升性能 **核心功能**: - ✅ 文件内容 SHA-256 哈希跟踪 - ✅ 增量 build:跳过未变更文件 - ✅ 更新已存在文档(删除旧索引,插入新索引) - ✅ 编译进度显示和缓存 **验收标准**: - 修改 1 个文件,build 只处理该文件 - 增量 build < 1s(对比全量 build 10s) - Scout 延迟 < 20ms(添加 LRU 缓存)
No due date•0/5 issues closed**预计工期**: 1 天 (AI 时间:5-7 小时) **目标**: 从 JSON 文件存储迁移到 LanceDB,支持向量索引 **核心功能**: - ✅ LanceDB 替换 JSON 存储 - ✅ 定义 LanceDB Schema(id, title, summary, content, vector, keywords) - ✅ 向量索引和检索 - ✅ 批量插入和查询优化 **验收标准**: - 所有数据存储在 LanceDB 中 - 向量检索由 LanceDB 加速 - 支持更大数据量(10,000+ 文档) - Scout 延迟 < 100ms(从 JSON 的 >500ms 优化)
No due date•4/5 issues closed**预计工期**: 1 天 (AI 时间:6-8 小时) **目标**: 实现语义搜索能力,混合 BM25 + 向量相似度 **核心功能**: - ✅ FastEmbed 本地模型集成 - ✅ 为 title + summary 生成向量(BGE-small-en) - ✅ 向量相似度计算(Cosine Similarity) - ✅ 混合排序:score = 0.7 * bm25 + 0.3 * vector **验收标准**: - 搜 "damage entity" 能找到 "applyDamage"(语义匹配) - 混合检索 Top-3 准确率 > 80% - Scout 延迟 < 500ms
No due date•6/6 issues closed**预计工期**: 1 天 (AI 时间:5-7 小时) **目标**: 从简单文本匹配升级到 BM25 算法,提升检索准确性 **核心功能**: - ✅ Tantivy 全文索引集成 - ✅ BM25 排序算法实现 - ✅ 关键词提取(代码块中的函数名、类名) - ✅ 为 title、summary、content、keywords 建立索引 **验收标准**: - 搜 "heal player" 能找到 "applyDamage"(即使没有精确匹配) - 搜索结果按 BM25 分数排序 - Top-3 准确率 > 70%(对比简单文本匹配)
No due date•5/5 issues closed**预计工期**: 1 天 (AI 时间:6-8 小时) **目标**: 从整文档提取升级到语义切片,支持真实 Minecraft 文档检索 **核心功能**: - ✅ 按二级标题(##)语义切片文档 - ✅ 改进 Summary 生成(提取首段,保留代码块) - ✅ 切片独立存储和检索 - ✅ 导入 Minecraft 基岩版文档 **验收标准**: - 一个包含 3 个二级标题的文档被切分为 3 个独立检索单元 - 搜 "createItem" 能定位到 API 函数切片,而非整文档 - Minecraft 文档成功构建和检索
No due date•7/7 issues closed