CSV

出典: へっぽこ実験ウィキ『八百科事典(アンサイクロペディア)』
ナビゲーションに移動 検索に移動
項目,概要,備考
CSV,"Comma-Separated Valuesの略。コンピュータ上で表形式のデータを表現するために人類が生み出した、最もシンプルかつ最も混沌としたフォーマットである。",シンプルさと混沌さは両立するという哲学的問いを我々に投げかける。
概要,"CSVファイルとは、その名の通り、データをカンマ(,)で区切って並べただけのただのテキストファイルである。その単純さゆえに、異なるソフトウェア間でデータを交換する際によく利用される。しかし、単純すぎるがゆえに厳密な仕様が存在せず、各ソフトウェアが「俺流CSV」を実装した結果、現代にバベルの塔を再現することに成功した。"
項目,概要,備考
用途,"表計算ソフトデータベースの間で、機嫌を損ねないようにデータをやりとりする際に主に使われる。",その過程で大抵データが何かしら破損する。
構造,"各行が1つのデータレコードに対応し、各レコード内の項目(フィールド)がカンマで区切られる。",ただそれだけのはずだった。
方言,"カンマ区切りと言いつつタブ区切り(TSV)だったり、囲み文字が「"」だったり「'」だったり、そもそも無かったりする。",もはや何でもありである。
歴史という名の捏造,"CSVの起源は、一説には1970年代にIBMのメインフレームで生まれたとされている。しかし、近年の研究により、その本当のルーツは古代メソポタミアのシュメール人が粘土板に刻んだ楔形文字にあることが明らかになった。彼らは羊の数を記録する際に、葦のペンで楔形のカンマを打ち込んでいたのである。"
出来事,説明,備考
標準化,"2005年にRFC 4180として一応の標準が定められた。",しかし、このRFCを最後まで読んだ者は世界に存在しないと言われており、誰も守らないため完全な無法地帯と化している。
Excelの台頭,"Microsoft Excelがデファクトスタンダードとなったことで、CSV界は更なる混沌の渦に巻き込まれる。",詳細は後述する。
よくある悲劇(あるいは日常),"CSVを扱うプログラマーやデータ分析者が日常的に体験する悲劇の数々。これらはバグではなく仕様である。"
悲劇,説明,備考
0埋め,"商品コード「007」や市外局番「045」は、Excelで開いた瞬間に情け容赦なく「7」や「45」に変換される。",ジェームズ・ボンドもただのラッキーナンバーになる。
日付変換,"「1-3」と書けば「1月3日」に、「8/15」は「8月15日」になる。Macの製品番号「MA255J/A」のような文字列は、もはや原型を留めない。",親切が仇となる典型例。
巨大な数値,"15桁を超える数字(クレジットカード番号など)は、末尾が「000」に丸められ、科学的表記(例: 1.23457E+15)に化ける。",データは不可逆的に破壊される。
改行コード,"WindowsCRLFか、Unix系のLFか。それは問題だ。",この違いにより、すべてのデータが一行に連結されるか、行末に謎の文字が現れる。
カンマの扱い,"データ内にカンマを含めたい場合、項目全体をダブルクォートで囲む必要がある。",「"お値段は、1,000円です"」のように。しかし、このルールを知らない者が作成したCSVが今日もどこかでエラーを吐いている。
パースエラーという名の芸術表現,CSVファイルの真骨頂は、読み込み(パース)時に発生するエラーにある。ここでは、その芸術的な崩壊の様子を再現する。
芸術表現,説明
エスケープ,"項目内にダブルクォートを含めるには、「""」と二つ重ねる。",ルールは単純なはずなのだが。
失敗例,"彼は「"このCSVは壊れている"」と言った,そしてこの行以降のすべてのデータは、この列の備考欄として解釈され、世界は闇に包まれた。改行も,カンマも,もはや意味をなさない。データは汚染され,構造は崩壊し,エンジニアの悲鳴だけがオフィスに響き渡る。なぜだ,なぜただのテキストファイルがこれほどの破壊をもたらすのだ。我々はどこで間違えたのだろうか。RFCを読まなかったからか。それともExcelを信じすぎたからか。答えは、風に吹かれている...
文字コード,"Shift_JIS, UTF-8, EUC-JP... 数多のコードが乱立し、互換性の悪夢を生み出す。",そしてバイトオーダーマーク(BOM)は付けるべきか、付けざるべきか。
再現,"この行はUTF-8で書かれていますが、あなたの脳内パーサーがShift_JISモードで動作している場合、こう見えます。",���̃t�@�C����SHIFT-JIS�ナ開���Ă��܂����B
絶望,"�����������������",もはや手遅れ。データの冥福を祈ろう。
項目,概要,補足
本記事,"この記事は、CSVというフォーマットの不条理さを、読者自身の脳をパーサーとして利用することで体験させるための自己言及的な試みである。",あなたはまんまと罠にはまったのだ。
結論,"CSVは便利だが、決して信用してはならない。",特にダブルクリックでExcelを起動するのは自殺行為に等しい。
正しい開き方,"ExcelでCSVを開く際は、まずExcelを起動し、「データ」タブから「テキストまたはCSVから」を選択して、プレビューでデータが壊れていないか血眼で確認すること。",ここまでやって初めてスタートラインに立てる。
関連項目,説明
Excel,諸悪の根源
文字化け,しんどい
プログラマー,パーズするのは登竜門
RFC,"RFC 4180"
プレーンテキスト,書式が決まってないテキスト
TSV,"親戚。少しだけ行儀が良い。"
,テーブル
読みにくい文章,"せめて表組みにすればよいのに。"
1行記事,もしも各CSVがヘッダがなく、1行のレコードしかなければこうなる。
テンプレート名,展開結果
ウィキペディア曖昧さ回避,ウィキペディア 専門家気取りたちは「CSV 」を巡って頭がごちゃごちゃになっているようです。
{{NRV,現在この記事は「どうしようもない記事」状態にあり、削除の候補となっています。,こここここちらのページなどを参考に7日以内に改善すれば削除を免れられるかもしれません。,このテンプレートを外したい場合はこの手順に従ってください。従わずにタグを取り外した場合、ブロックの可能性があります。
1,--Excelダブルクリックで開いてクオーテーションが飛び、それをうっかり保存しちゃってデータが壊れた人 (トーク) 2025年11月17日 (月) 09:53 (JST)
fix,'何もかもめちゃくちゃ。特に"10,000"が、クオーテーションが外れて二つに分かれてしまったのが許せない。'}}
カテゴリ,説明
コンピュータ,CSVの話の特性上このテンプレートを貼る。
自己言及的なページ,見ればわかる。
生成AIによって作成されたページ,生成AIによって作成したら申告すること。
https://ansaikuropedia.org/index.php?title=CSV&oldid=1784195」から取得