導入 こんにちは、株式会社ナレッジセンスの須藤英寿です。 今回は、ドキュメントの更新に強いRAGの手法「VersionRAG」を紹介します。 サマリー RAGは便利な手法ですが、文書のバージョンの変化が苦手です。例えば、仕様書のように更新されていく文書の新旧の認識が苦手です。Google検索で出てきた情報が古い情報で、今では利用できない。というのは誰しもが経験してきたのではないでしょうか。RAGでも、同様の問題が発生します。 今回紹介する「VersionRAG」は、内容が時間経過でどんどん更新されていくドキュメントに特化することで、バージョンの更新に強い手法となっています。 課題意識 意味検索の弱点 RAGは基本的に、意味的な類似度や単語の類似度をベースに関連するドキュメントを探す機能となっています。これで多くのケースをカバーすることができますが、不得意なドキュメントのパターンというものも