« TinySegmenter: Javascriptだけで分かち書き |
メイン
| Linuxデスクトップ上でYahooかな漢字変換経由で日本語入力を実現するラッパーライブラリ »
2008年05月24日
肥大化して破綻するオープンソースプロジェクト
一時期オープンソースがはやった時期がありましたが、今はどうなんでしょう?
当時はオープンソースでバラ色の人生みたく過大評価されていたような記憶があります。
過大評価は言い過ぎですが、いまこうやってブログをかけるのもオープンソースの
おかげであることは間違いありません。
しかし、すべてのオープンソースプロジェクトが成功したかというと、簡単に
YES といえないような気がします。こういう話を某エンジニアとしたら、彼も
同じような視点(というかその方の場合は実経験かもしれませんが)を持ってて、
なんか話が盛り上がってしまいました。
その問題点とは肥大化です。オープンソースは誰でもプロジェクトに参加できるのですが、
ディベロッパーの技術もピンキリなため、時にはどーでもいい拡張がコミットされてしまう
ことがあります。その最たるものが周辺技術との統合。ホニャララメタデータをMySQLに保存,
○しろまる○しろまるバックエンドとの統合,
○しろまる○しろまるモジュールによるオブジェクト化 等々..
こういう拡張は、とっつきやすいし具体的な成果になって見栄えはいいんですが、
メンテナンス性が悪くなり、rpmやdeb のパッケージャーは相当苦しみます。周辺技術が肥大化し、
万人が必要としないコードの断片のためだけに大量の人的リソースが費やされてしまいます。
コアの開発者のためのメーリングリストで周辺技術のくだらない質問が飛び交うようになり、
やる気が萎えます。さらにたちの悪いのは、OSSほにゃらら〜で予算をもらって、既存OSSの周辺技術を
やってるケース.. 成果はあることは間違いないのですが...
形態素解析 ChaSen も一時期そのような経緯を辿りました。形態素解析エンジンの
クライアント/サーバー化 (Unix だけならいいけど、まじめにポータビリティを考えると死ぬ、
ChaSen 2.4.0 から廃止),
注釈機能 (入力テキストのあるタグで囲まれた部分の形態素解析をスキップする),
日本語の文区切り (単に 「。」等で区切るという処理)等々.. それぞれは、便利かもしれませんが、
こればっかりやってると、肝心の形態素解析のコアアルゴリズムが疎かになってしまいます。
で、往々にしてこういう周辺技術に質問が集中するんですよね。(なぜでしょう?)
安易な拡張が入らないようにするには、ガチガチにAPIを用意して、他の世界とできるだけ
疎結合になるような設計にすることでしょうか。今となっては当たり前のことかもしれませんが。
投稿者 taku : 2008年05月24日 15:57
トラックバック
このエントリーのトラックバックURL:
http://chasen.org/~taku/blog/mt-tb.cgi/239