[フレーム]
はてなブックマークアプリ

サクサク読めて、
アプリ限定の機能も多数!

アプリで開く

気に入った記事をブックマーク

  • 気に入った記事を保存できます
    保存した記事の一覧は、はてなブックマークで確認・編集ができます
  • 記事を読んだ感想やメモを書き残せます
  • 非公開でブックマークすることもできます
適切な情報に変更

エントリーの編集

loading...

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。

タイトルガイドライン

このページのオーナーなので以下のアクションを実行できます

タイトル、本文などの情報を
再取得することができます
コメントを非表示にできます コメント表示の設定

ブックマークしました

ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください

Twitterで共有

ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します

158users がブックマーク コメント 18

ガイドラインをご確認の上、良識あるコメントにご協力ください

0 / 0
入力したタグを追加

現在プライベートモードです 設定を変更する

おすすめタグタグについて

よく使うタグ

LLMを悩ませる"Excel文書"をうまく扱う方法

ガイドラインをご確認の上、良識あるコメントにご協力ください

0 / 0
入力したタグを追加

現在プライベートモードです 設定を変更する

おすすめタグタグについて

よく使うタグ

はてなブックマーク

はてなブックマークで
関心をシェアしよう

みんなの興味と感想が集まることで
新しい発見や、深堀りがもっと楽しく

ユーザー登録

アカウントをお持ちの方はログインページ

記事へのコメント18

  • 注目コメント
  • 新着コメント
shields-pikes
弊社では、様々なフォーマットのExcelをLLMで正確に読ませたい、という依頼は断っている。こんなの構築したところで、特殊例によるエラーだらけだし、AIの方が劇的に進化するので、開発してもその価値は2年も持たない。

その他
turanukimaru
Excel仕様書をLLMに食わせてプログラムを生成できないか?って上司に言われていやそれは無理と応えた(試した)んだけど納得して貰えてない。テキストで手順を食わせると生成できるんだからテキストで良いじゃん...

その他
skypenguins
今までの「OA化」「IT化」「電子化」では紙の文書の「見た目だけ」をそのままディジタル化してて、セマンティックス無視してきた(非構造化で機械可読が不可能)から、こういう不毛な作業が必要になるんだよな

その他
urtz
pdfとかsvgにして視覚情報を確定させて、食わせるしか。つか、LLMが食い易い新たなフォーマットがExcelには必要

その他
arrowKato
PDFにして処理が割と現実解というのは闇が深い

その他
masadream
PDF化して食わせる。結局やってることOCRと本質的に変わらんね...なんでもExcelでやってきて、見て見ぬふりしてきたツケをそろそろ払う時期が来てるのかも。

その他
rgfx
Excel方眼紙をAIに食わせる時は方眼紙(PDF)として渡した方が良い、それはそう

その他
skypenguins
skypenguins 今までの「OA化」「IT化」「電子化」では紙の文書の「見た目だけ」をそのままディジタル化してて、セマンティックス無視してきた(非構造化で機械可読が不可能)から、こういう不毛な作業が必要になるんだよな

2024年12月09日 リンク

その他
misshiki
"RAGとLLMのシステムで扱いの難しい"Excel文書"をうまく扱うための手法をいくつか紹介さ"

その他
eroyama
汎用方眼紙アプリケーション

その他
cl-gaku
スクショでも食わせたほうがまだましそう

その他
urtz
urtz pdfとかsvgにして視覚情報を確定させて、食わせるしか。つか、LLMが食い易い新たなフォーマットがExcelには必要

2024年12月09日 リンク

その他
arrowKato
arrowKato PDFにして処理が割と現実解というのは闇が深い

2024年12月09日 リンク

その他
yarumato
"RAGで読み取りづらいExcel文書。openpyxlやpandasを使ってxlsxをそのままパース(文字列のみ抽出)か、PDFに変換(ページの区切りをちゃんとしないと)してPDFや画像として扱う。"

その他
stealthinu
Excelの文書をRAGでうまく扱えない問題。すごくよくある。そして良い汎用的な解決策がなく、案件ごと、なんなら文書ごとの対応が必要になってしまう。

その他
turanukimaru
turanukimaru Excel仕様書をLLMに食わせてプログラムを生成できないか?って上司に言われていやそれは無理と応えた(試した)んだけど納得して貰えてない。テキストで手順を食わせると生成できるんだからテキストで良いじゃん...

2024年12月09日 リンク

その他
takeda25
まだ隣の席のLLM君に「ちょっとこのExcelのグラフをこれこれこういう感じに直してくれない?」と頼める感じじゃないのか。

その他
mmddkk
Excel方眼紙みたいなクソエクセルファイルをたくさん学習させることによって、将来はAIが自動でいい感じに処理するようになるのかな。

その他
ytn
Excel文書死すべし(絶賛量産中

その他
shields-pikes
shields-pikes 弊社では、様々なフォーマットのExcelをLLMで正確に読ませたい、という依頼は断っている。こんなの構築したところで、特殊例によるエラーだらけだし、AIの方が劇的に進化するので、開発してもその価値は2年も持たない。

2024年12月09日 リンク

その他
hurafula
libreofficeをサーバにしてAPIを叩くのいいですね!最終的な手段として覚えておきます。ありがとうございます

その他
sgo2
コピーでクリップボードに入るメタ形式画像は使えないのだろうか

その他
homaju
openpyxl使って抽出する方法が色々使えそう まだ、オブジェクトには使えないのは残念

その他

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

リンクを埋め込む

以下のコードをコピーしてサイトに埋め込むことができます

プレビュー
アプリのスクリーンショット
いまの話題をアプリでチェック!
  • バナー広告なし
  • ミュート機能あり
  • ダークモード搭載
アプリをダウンロード

関連記事

usersに達しました!

さんが1番目にブックマークした記事「LLMを悩ませる"Exc...」が注目されています。

気持ちをシェアしよう

ツイートする

LLMを悩ませる"Excel文書"をうまく扱う方法

はじめに 株式会社ファースト・オートメーションCTOの田中(しろくま)です! 弊社では製造業向けのRAGを... はじめに 株式会社ファースト・オートメーションCTOの田中(しろくま)です! 弊社では製造業向けのRAGを使ったチャットボットの開発を行っていますが、 RAGで読み取りづらいなと感じているドキュメントが"Excel文書"です。 LLMを悩ませる"Excel文書"とは ここで"Excel文書"と呼んでいるドキュメントは、 「構造化されたテーブルを保存しているExcelファイル」 ではなく、 「 セルに文書を書いたり、オブジェクトや画像を挿入することで、いわゆる一般的な文書を作成しているExcelファイル 」 のことを呼んでいます。 そもそも一般的な文書作成においてはExcelではなく、Wordを使えばよいのでは?と思われるかもですが、以下の点でExcelで文書の資料を作成することはそれなりに便利な部分があると思っています。 枠を使って、グルーピングすることでドキュメントの構成が見やすくなる

ブックマークしたユーザー

  • donotthinkfeel2025年07月22日 donotthinkfeel
  • techtech05212025年06月13日 techtech0521
  • beeworks2025年06月03日 beeworks
  • cheeperword2025年06月02日 cheeperword
  • of_ton2025年04月04日 of_ton
  • ohiro182025年02月12日 ohiro18
  • umotas2025年02月01日 umotas
  • vine_hate2025年01月21日 vine_hate
  • heatman2025年01月08日 heatman
  • stereocat2025年01月01日 stereocat
  • knj29182025年01月01日 knj2918
  • masadream2024年12月31日 masadream
  • yug12242024年12月12日 yug1224
  • ButterflyFish2024年12月11日 ButterflyFish
  • sumie_n_y2024年12月10日 sumie_n_y
  • rgfx2024年12月10日 rgfx
  • cutc-mt2024年12月10日 cutc-mt
  • hatakazu932024年12月10日 hatakazu93
すべてのユーザーの
詳細を表示します

ブックマークしたすべてのユーザー

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

同時期にブックマークされた記事

いま人気の記事 - 企業メディア

企業メディアをもっと読む

はてなブックマーク

公式Twitter

はてなのサービス

Copyright © 2005-2025 Hatena. All Rights Reserved.
設定を変更しましたx

AltStyle によって変換されたページ (->オリジナル) /