1.はじめに ここ数日作っていたローカルPDF検索エンジン「kugutsushi-search」について書きます。これは、PDFドキュメントを検索するためのベクトル検索エンジンで、特にRaspberry Pi 4Bのようなスペックが控えめな環境でも、100GB超の書籍PDF群を全文検索できるようにしました。さらに、同じくRaspberry Pi上で動くDiscordボットとn8nと組み合わせて、RAG(Retrieval-Augmented Generation)システムのバックエンドとしても使えるようにしています。 この数年、大規模言語モデル(LLM)の進化に伴って、RAG技術が注目されていますよね。RAGは、LLMの知識を外部知識で補強して、より正確な回答を生成する手法です。このプロジェクトでは、RAGシステムの外部知識として、手元にある書籍PDF群を活用できないかと考えました。特に、