ブログ

皆の声がCCシグナルを形作る:フィードバックへの回答

6月に私たちはCCシグナルの提案に対する一般からのフィードバック募集期間を設けました。CCシグナルは、AI時代におけるコモンズの持続と、知識の継続的な共有を確保するために設計された、プレファレンス・シグナルの枠組みです。

その目的は、大規模なデータセットの保有者が、AI学習モデルで自身のデータがどのように使用されるかについて基準を設定できるようにすることです。たとえば、データセットの保有者は、そのデータを使用するAI学習に対し、元のソースへの帰属表示(クレジット)を義務付けたり、生成されたAIモデルがオープンであることを要求したいと願うかも知れません。CCライセンスと同様に、CCシグナルは「一部の権利を保持する」という考えに基づいており、クリエイターや知識の保有者が、自身の作品がどのように使われるかについて意味のある選択肢を持つべきだという考えに基づいています。詳細については、私たちのウェブサイトで見ることができます。

キックオフイベント以来、私たちは皆様からのフィードバックに耳を傾けてきました。何百人ものクリエイター、図書館司書、技術者、法律専門家、そしてオープンな活動の推進者から意見を受け取りました。皆さんの声は、それが肯定的なものであれ、懐疑的なものであれ、不満に満ちたものであれ、好奇心に満ちたものであれ、CCシグナルの発展を形作る上で不可欠なものです。皆様からお寄せいただいた意見の要点と、そのフィードバックがどのように取り入れられ、対処されているかについて説明します。

いただいた意見の概要

様々な意見交換を通じて、以下のいくつかのテーマが浮上しました。

CCがクリエイターよりもAI企業を優先しているという懸念。 CCシグナルが、クリエイターを十分に保護することなく、AI学習に正当性を与えているように見える、という懸念が度々聞かれました。

CCライセンスとAI学習に関する混乱と意見の相違。 CCライセンスが、一部のクリエイターが期待した方法で解釈されたり、執行されたりしていないことへの不満が聞かれました。

オプトアウトに対する強い要望。 多くの人が、CCシグナルの草案にオプトアウトの選択肢が含まれていないことに疑問を呈しました。

AI開発者に丁寧に働きかけるだけでは不十分だという意見。 AI企業が著作権、ライセンス、さらにはrobots.txt のような技術的プロトコルさえも無視しているという広範な証拠があるため、CCシグナルが実際に機能するのかという疑念が聞かれました。

AIの社会における役割に対するより広範な批判。 CCコミュニティ全体には、AIに対する様々な見解があります。多くの人がAIに反対する立場を明確にしています。このような意見を持つ人々にとって、CCシグナルのような技術的な枠組みは、より強力な法律や規制がなければ不十分だと感じられます。

このツールの対象者とユースケースについて明確にしてきませんでした。 アーティストのような個人クリエイターのニーズは、機関や集団レベルで活動する人々のニーズとは全く異なるのは当然です。現在構想されているCCシグナルが、個人クリエイターの多様なニーズを満たしていないことが、はっきりと伝わりました。

明確化への要求。 多くの人が、実装や相互運用性に関する詳細、そしてCCシグナルがより広範なミッションの一環として持つ長期的なビジョンについて、より多くの情報を求めていました。

これらの問題は、特に作品が同意なく使用されていると感じ、対抗策を求めているアーティストやクリエイターの皆さんにとって、いかに深刻であるかを私たちは理解しています。その不満は現実のものであり、私たちはそれを真剣に受け止めています。

今後の取り組み

✔️ CCの立場を明確化します。 CCが「どちらかの側についた」あるいはAI企業の影響を受けているのではないかと心配されている方が多いことは承知しています。私たちは、CCシグナルの原動力が、知識の保有者のための実用的なツールを開発することによって、コモンズを守り、維持することであることを明確にしたいと思います。今後は、私たちの指針となる原則や立場を、プロダクトの決定に反映されるような形で明確にしていきます。

✔️ メッセージングと教育を強化します。 CCライセンスとCCシグナルがどのように相互作用しうるか、シグナルが実際にどのように機能しうるかの例、そしてAIにおける著作権の問題について、より深く掘り下げるためのリソースを拡大することに尽力します。まだご覧になっていない方は、CCライセンスとAI学習を理解するための法律入門をご覧ください。CCコミュニティがAIとコモンズ全般についてより多くの情報を得るほど、コモンズを守るコミュニティとして、私たちはより効果的に活動することができます。

✔️ CCシグナルのユースケースを明確にします。現段階のCCシグナルは、個人クリエイターではなく、大規模なオープンデータセットの保有者に役立つように設計されています。皆様のフィードバックにより、この設計が、ウェブサイトを持つ人なら誰でも利用できる技術プロトコルを活用するという私たちの決定と両立させるのは容易ではないことに気づくことができました。その結果、CCシグナルの対象者が不明確になっていました。今後のプロダクト開発の段階を決定するにあたり、私たちは、目標と目的を実践するために、特定のユースケースに焦点を当てることを計画しています。

✔️ グローバルな連携を深め、プロダクト開発にステークホルダーを招きます。私たちは、反復的なプロセスを通じてCCシグナルの将来について知見を得るため、今後も多様な関係者と対話を続けていく予定です。今年の残りの期間は、パイロット導入者と共に CC シグナルの統合の可能性を探り、テストすることに注力します。この取り組みから得られる知見を、将来的なCCシグナルのより広範な導入を検討する際に活用したいと考えています。

✔️ 開発における透明性を維持します。 GitHubのリポジトリは常に公開され、最新の状態に保たれます。また、一般公開するロードマップを作成中で、進捗についてはブログやバーチャルでのタウンホールを通じて定期的にお知らせします。このフィードバックのサイクルはこれで終わりではなく、CCシグナルの今後の進化の過程に組み込まれます。

今後の展望

コモンズの未来は、オープンさ、公平性、そして主体性という共通の価値観を反映したツールにかかっています。多くの方が、依然として懐疑的であることは承知しています。

CCシグナルはまだ最終形ではありません。それは、ルールが急速に変化している時代に、新たな選択肢の層を構築する実験です。私たちは、コモンズに真に役立つものにたどり着くまで、耳を傾け、調整し、協力し続けます。

時間を割いて、私たちに意見を書き、疑問を投げかけ、挑戦し、そして支持してくださったすべての方々に感謝します。引き続きご協力をお願いします。力を合わせることで、クリエイティブ・コモンズが常にそうであったように、コミュニティと共に、コモンズのための存在であり続けることを確実にできます。

2025年8月27日

このブログ投稿は Creative Commons による “We Asked, You Answered: How Your Feedback Shapes CC Signals” を翻訳したものです。

翻訳に際して Gemini の出力を参考にしました。

(担当:豊倉)

9/21(日) CCJPシンポジウム「生成AIの学習における著作物の無断利用をめぐって」開催のお知らせ

【開催主旨】
生成AIの開発にあたり、他人のイラストやニュース記事などの著作物を生成AIの学習データとして無断で利用してもよいかについて、問題があるとしてどう対処すべきかについて、さまざまな意見や動きがあります。クリエイティブ・コモンズ・ジャパンでは、年次イベントのテーマとしてこの点を取り上げて議論する機会を設けます。また、米国に本部をおくクリエイティブ・コモンズ(*1)が対処策として最近提案したCCシグナルの特徴やその背景にある考え方について紹介します。

法律的な観点からは、日本にはAI天国と称されることもある著作権法上の規定が存在し、生成AIの学習に他人の著作物を無断で利用することが幅広く認められています。ただし、規定が適用されない「著作権者の利益を不当に害することになる場合」がどこまでを指すかについての法解釈は専門家の間でも意見の相違があります。また、そのような規定から「オプトアウト」するべくAI学習への利用を禁止する意思表明をする動きもあります。無断利用を違法化することを求める意見も存在しています。

倫理的観点からの批判も様々に存在しています。また、主要なAI開発企業の中にはデータ提供者に対して対価を支払う仕組みを用意し、無断利用や経済的搾取についての批判へ対処する動きもあります。検索エンジンなどの行動を制御するためのrobots.txt への記載など、一定の仕組みを通じて学習データ利用への諾否を表明していればそれをデータ収集時等に反映する場合もあります。CCシグナルもまた、このようなAI利用に関する意向表明の手段の一種として提唱されており、現在世界中から意見を募集しています。

立場、意見や専門領域に関わらず建設的な議論に参加したい方の幅広いご参加をお待ちしています。

なお、本イベントはクリエイティブ・コモンズ・ジャパンの2024年の活動成果報告として実施するものです。イベントの最後には、本テーマに限らないクリエイティブ・コモンズ・ジャパンの活動の紹介があります。

*1 クリエイティブ・コモンズは米国に本拠をおく非営利法人で、クリエイティブ・コモンズ・ジャパンやその母体であるNPO法人コモンスフィアとは別の法人です。

【開催概要】
CCJPシンポジウム「生成AIの学習における著作物の無断利用をめぐって」
主催:クリエイティブ・コモンズ・ジャパン
後援:国際大学グローバル・コミュニケーション・センター(GLOCOM)、オープン・ナレッジ・ジャパン
日時:9月21日(日) 16:00-18:10
場所:オンライン(WebEx)、および対面(国際大学グローバル・コミュニケーション・センター)
参加料:無料
参加申し込み:Googleフォームからお申し込みをお願いします。

登壇者:
・小沢高広(二人組漫画家「うめ」原作担当/日本漫画家協会常務理事)
・庄司昌彦(武蔵大学社会学部メディア社会学科教授)
・豊倉幹人(クリエイティブ・コモンズ・ジャパン事務局)
・渡辺智暁(クリエイティブ・コモンズ・ジャパン/コモンスフィア理事長)(モデレーター兼)

【プログラム(暫定版)】
※(注記)当日までに変更になる可能性があることをご了承ください。
・挨拶と話題設定(10分)
・冒頭発表(15分x2名)
・CCシグナルの紹介(10分)
・パネル討論および質疑(60分)
・まとめ(10分)
・クリエイティブ・コモンズ・ジャパンの2024年度活動報告(10分)

お問合せ・ご連絡先:
お申し込み期限後のキャンセルなどのご連絡は info at creativecommons.jp までメールでのご連絡をお願いします。( at は@マークに変換してください)

CCシグナルの紹介:AI時代の新たな社会契約

by Creative Commons

クリエイティブ・コモンズ(CC)は、AI 時代における互恵性の向上と創造性のコモンズの持続を目指して設計された、意思表示のための新たなフレームワーク「CCシグナルプロジェクト」の一般公開を開始します。CCシグナルの開発は、共有された利益に基づく、より公平で持続可能な AI エコシステムを構築するための重要な一歩です。この取り組みは、長期にわたる協議と分析の集大成であり、新たなフェーズへと移行するにあたり、広く一般からの意見を求めています。

人工知能(AI)が知識の創造、共有、再利用のあり方を変容させる中、私たちは知識へのアクセスと共有された創造性の未来を左右する岐路に立っています。一方の道はデータ抽出とオープン性の浸食へと至る道で、もう一方の道はペイウォールに囲まれた閉鎖的なインターネットへと続く道です。CCシグナルは、コモンズの細やかな価値観に根差し、その集団によって表明されるもうひとつの道を提示します。

CCライセンスや、オンラインでオープンライセンス化された数百億の作品が生み出されたのと同じ原則に基づき、CCシグナルは、データセット保有者が、公共の利益を考慮して設計された、限定的ではあるものの意味のある選択肢の中から、自身のコンテンツが機械によってどのように再利用されるかについての意向を表明できるようにするものです。これは技術的・法的ツールであると同時に、社会的な提案でもあります。すなわち、データを共有する者と、それをAIモデルの学習に利用する者との間の新たな協定を求めるものです。

「CCシグナルは、AI 時代においてコモンズを維持するために設計されています」と、クリエイティブ・コモンズCEOの Anna Tumadóttir は述べています。「CCライセンスがオープンなウェブの構築に貢献したように、私たちはCCシグナルが互恵性に基づいたオープンなAIエコシステムの形成に役立つと信じています。」

CCシグナルは、変化にはシステムレベルでの連携が不可欠であるという認識に基づいています。このツールは、法的、技術的、規範的な文脈において柔軟に対応し、機械と人間の両方が読み取れるように設計されています。しかし、CCシグナルの核心は、集団の力を結集することにあります。CCシグナルの強制力は、法的に拘束力を持つ場合もあれば、規範的なものにとどまる場合もありますが、その適用は常に「私たちは与え、受け取り、再び与え、そして私たちは皆、共に歩む」という倫理的な意味を伴います。

「知識がオープンであり続ける未来を私たちが望むならば、集団的に新たなギブ・アンド・テイクを主張する必要があります」と、クリエイティブ・コモンズの法務顧問である Sarah Hinchliff Pearson は述べました。「機械の時代において、一個人の意思表示は取るに足らないものかもしれません。しかし、力を合わせれば、私たちは異なる道を求めることができるのです。」

フィードバックを募集しています

CCシグナルおよび初期の設計に関する詳細は、CCのウェブサイトでご確認いただけます。私たちは、パートナーやコミュニティと協力し、透明性をもってCCシグナルの開発に取り組みます。2025年11月のアルファ版ローンチに向けて、今後数ヶ月間、皆様からのフィードバックとご意見を積極的に募集します。

ご参加ください

議論に参加し、フィードバックを共有してください

現在のCCシグナルの提案にフィードバックを提供するには、CCシグナルの GitHub リポジトリにアクセスしてください。いくつかの方法で参加できます。

CCシグナルの技術的な実装について読む
CCシグナルプロジェクトに関する議論に参加する
直接的な編集提案については、イシュー(Issue)を作成する

CCシグナル会合に参加する

CCシグナルフレームワークについての簡単な説明の後、皆様のフィードバックの共有や質問をする会合です。コミュニティのみなさまのご参加をお待ちしています。

2025年7月15日(火)
午後6時〜7時 (UTC)
登録はこちら

2025年7月29日(火)
午後1時〜2時 (UTC)
登録はこちら

2025年8月15日(金)
午後3時〜4時 (UTC)
登録はこちら

このムーブメントを支援する

CCは非営利団体です。寄付を通じてCCシグナルの構築を支援することができます。¹

AI時代は、新たなツール、新たな規範、新たな協力の形を要求しています。CCシグナルとともに、私たちは共有された知識が引き続き繁栄する未来を構築します。ぜひご参加ください。

投稿日:2025年6月25日

このブログ投稿は Creative Commons による "Introducing CC Signals: A New Social Contract for the Age of AI" を翻訳したものです。

なお、CCJPはCCとは別の日本の非営利団体である顧問スフィアによって運営されています。コモンスフィアへの寄付はこちら
https://creativecommons.jp/donate/ ↩︎

翻訳に際して Gemini の出力を参考にしました。

(担当:豊倉)

AI時代の互恵性

by Anna Tumadóttir

Reciprocal Roof (Shed) by Ziggy Liloia は CC BY-NC 2.0 の下で提供されています。

ここ数年で多くのことが変化し、クリエイティブ・コモンズ(CC)が、私たちの価値観をより強く打ち出す時が来ています。最近発表された私たちの戦略計画を支えているのは、互恵性への新たな呼びかけです。中立性は現状維持にしか役立ちません。オープンな実践と知識共有を通じてより公平な世界のために戦うことに中立性はありません。

CCの設立以来、ライセンスには2つの側面がありました。1つは、特定のアイテムについてどのような権利が与えられるかを、明示的で法的に厳密な言葉で記述する法的側面です。しかし、同様に、2つ
目として、CCアイコンを適用する際に伝わる社会的な側面もあります。このアイコンは、証し、バッジ、そして私たちが共にいることのシンボルとして機能し、それこそが私たちが共有する理由なのです。科学研究であれ、教育資料であれ、詩であれ、CCライセンスでマークされている場合、それは互恵性に基づく社会的な合意も伴っています。

しかし、生成AIの主流化に伴い、その社会的な合意が疑問視され、脅威にさらされ、より広範なコモンズに連鎖的な影響を及ぼしています。商業的な基盤モデルを構築する現在の手法には、互恵性が欠けています。お金持ちになるためにライチョウの写真を共有する人はいませんし、有名になるためにHuldufólk(隠れた人々)に関する記事を投稿する人もいません。知識の共有が目的だからです。しかし、その共有された知識が不透明に摂取され、クレジットが付与されず、ユーザー体験が損なわれるほどにクローラーがサーバー活動(と関連費用)を増大させる時、人々は貢献を続ける意欲を失ってしまいます。

オープンムーブメントは、共有された知識に誰もがアクセスでき、それらを利用し、そこから学べることを常に目指してきました。私たちは科学的な発見を遅らせたいとは考えていません。新しい技術を用いて、より迅速に学び、発見し、革新できるのであれば、それは素晴らしいことです。ただしそれは、私たちが本当に「共に」取り組んでいる限りにおいての話です。

私たちが究極的に求め、そして必要不可欠だと考えているのは、強く、回復力があり、成長し、(機械にも人間にも)有用なコモンズ、つまり率直に言えば、あらゆる望ましい特性を備えたものです。しかし、私たちのオープンなインフラが成熟するにつれて、それらはますます当然のことと見なされるようになり、「これは私たち全員のためのものだ」という感覚が「誰もがこれを受ける権利がある」という感覚に取って代わられます。これらは同じように聞こえますが、実際はそうではありません。なぜなら、当然だという権利意識には誤用が伴い、社会契約が破綻し、互恵性が失われ、最終的にはその素晴らしい効果が弱まるからです。

AI時代における互恵性とは、クリエイターやデータ管理者とAIモデル構築者の間で、相互に有益な関係を築くことです。コモンズから不均衡な利益を得ているAIモデル構築者にとって、互恵性とは、コミュニティや文脈に即した形でコモンズに還元する手段です。

(そして、すでにお分かりかもしれませんが、この記事は政策や法律についてではなく、人々を中心に据えることについてです)。

ここで、私たちの価値観が問われます。私たちは中立的な立場で傍観することで、「これは皆のためのものだ」という言葉がコモンズからの利益が著しく不公平な形で少数の人々に集中する意味で扱われるような事態を招くことを許容することはできません。また、私たちの共有する知識が吸い上げられ、私たちから遠ざけられることも容認できません。

共有の背後にある社会契約を維持するためには、互恵性がAIエコシステムに組み込まれる必要があると私たちは信じています。もしあなたがコモンズから利益を得ているのなら、そしてコモンズに還元するべき立場にあるのなら、そうすべきです。なぜなら、コモンズはすべての人々のためのものであり、それは私たち全員が、適切な方法で貢献することによってコモンズの価値を維持する必要があることを意味するからです。

個々人がコモンズとの間で等価的な交換を行う義務は、これまでにもありませんでしたし、これからもあるべきではありません。では、社会に還元する方法として何が適切なのでしょうか?多くの可能性が浮かびます。例えば、次のようなものがあります。

データ保有者がAI学習に関する自身の意向を表明できるようにすることで、互恵性を達成する手段として主体性を高めること
可能な時には、アトリビューションという形でのクレジット表示を行う
オープンインフラの支援
協力的なデータセット開発
モデルの重みやその他のコンポーネントをコモンズへ提供する

私達が「コモンズを守る」という話をするとき、それはコモンズを持続させ、発展させ、そして社会契約が未来の世代の人々にとって損なわれることなく継承されるようにすることを含意します。そして、それを実現するためには、互恵性が必要な時なのです。

CCが私たちの価値観をより強く打ち出す活動の一環として、私たちは「プレファレンスシグナル(意向を示すシグナル)」に基づく社会的なプロトコルを策定し、実行に移します。これは、データを管理する側と、それを生成AIのために再利用する側との間のシンプルな協定です。CCライセンスと同様に、このプロトコルも善意の行為者を対象とし、互恵性の原則に基づいて共有とアクセスに関する新たな社会規範を確立することを目的としています。現在、私たちは価値観を共にするパートナーと積極的に協力し、共有された知識が生成AIの学習に利用される際に、この互恵性を具体的な行動として実現するためのフレームワークの試験運用を進めています。この取り組みを推進するため、ぜひオープンインフラストラクチャーサークルへのご参加をご検討ください。

投稿日:2025年4月2日

このブログ投稿は Anna Tumadóttir による "Reciprocity in the Age of AI" を翻訳したものです。

「プレファレンスシグナル」について「AI学習のためのプレファレンス・シグナルの可能性を探る」という翻訳記事も公開していますので、より詳しく知りたい方はそちらもご覧ください。

翻訳に際して Gemini の出力を参考にしました。

(担当:豊倉)

なぜAIを含むデジタル公共財はオープンデータに依存すべきなのか

by Cable Green, Creative Commons
2025年1月27日

クリエイティブ・コモンズ(CC)は、(道徳的、倫理的、プライバシーの観点から)共有すべきでないデータや、(法的、その他の理由から)共有できないデータもあることを認識した上で、知識の生産を促進するためにオープンデータの作成、共有、利用を奨励することに価値があると考えています。オープンコミュニティが教育、科学、文化のためのデジタル公共財や公共のインフラサービスを想像し、設計し、構築し続ける中で、これらの財やサービスは、可能かつ適切な場合はいつでも、オープンデータを作成し、共有し、そしてそれを基に構築されるべきです。

Open Data by Auregann is licensed under CC BY-SA 3.0.

オープンデータとデジタル公共財(DPG)

CCはデジタル公共財アライアンス(DPGA)のメンバーであり、CCの法的ツールはデジタル公共財(DPG)として認められています。DPGとは、「オープンソースソフトウェア、オープンスタンダード、オープンデータ、オープンAIシステム、オープンコンテンツコレクションのうち、プライバシーやその他の適用可能なベストプラクティスを遵守し、害を及ぼさず、国連の2030年持続可能な開発目標(SDGs)の達成に高い関連性を持つもの」と定義されています。世界最大級の課題を解決したいのであれば、政府や他の資金提供者はDPGに投資し、開発し、オープンライセンスで提供し、共有し、活用する必要があります。

データは経済の活力を生み出す主要な要素であり、公共の利益に貢献するポテンシャルを持つことが実証されていることから、オープンデータはDPGにとって重要です。公共部門においては、データは政策立案や公共サービスに情報を提供することで、限られた資源を最も必要としている人々に分配するのに役立ちます。また、政府の説明責任を追及する手段を提供し、社会イノベーションを促進します。つまり、データは人々の生活を向上させる可能性を秘めているのです。データが閉鎖されていたり何かしらの理由で利用できない場合、一般の人々はこのような恩恵を受けることができません。

CCは最近、DPG標準の一部としてオープンデータの整合性を維持するために活動しているDPGAの小委員会の一員として活動しました。DPG標準に対するこの重要なアップデートは、オープンライセンスを持つオープンデータセットおよびコンテンツコレクションのみがDPGとして認められることを保証するために導入されました。この新しい要件は、オープンデータセットとコンテンツコレクションがデジタル公共財として認められるためには、以下の基準を満たす必要があることを意味します。

包括的なオープンライセンス:
データセット/コンテンツコレクション全体が、適切なオープンライセンスのもとにあること。複数のライセンスが混在するコレクション(ミックスライセンス)は今後認められません。
アクセス可能で発見しやすいこと:
すべてのデータセットおよびコンテンツコレクションのDPGはオープンライセンスのもとで提供され、一意のURLなど明確で一元化された場所から容易にアクセスできること。
許容されるアクセス制限:
ユーザーを差別したり、地理やその他の要因に基づいて使用を制限したりしない限り、ログイン、登録、APIキー、スロットリングなどの一定のアクセス制限は許可されます。

DPGAは次のように述べています。

「この新しい要件は、ユーザーが知的財産権の侵害を懸念することなく安心してソリューションを活用できるようにすることで、すべてのDPGに対する信頼と信用が高まるように設計されています。アクセスと利用を簡素化することは、DPGを真にオープンで利用しやすくし、広く普及させるというDPGAの目標に沿うものです。…それは法的不確実性のない、イノベーションが繁栄できる環境とエコシステムの育成に役立ちます。」

AIとオープンデータ

AIと、AIが世界的な課題の解決に役立つ公共財となる可能性についてCCが検討している中で、オープンデータも同様に重要な役割を果たすと考えています。

CCは、AIが急速に発展している分野であることを認識しており、AIに関する定義、推奨事項、ガイダンス、警告を作成するための皆さんの熱心な取り組みに感謝しています。コミュニティによる2年間の協議の後、オープンソース・イニシアティブ(OSI)は2024年10月28日にオープンソースAIの定義(OSAID)のバージョン1.0をリリースしました。この定義は、AIシステムにとってオープンとは何かについて議論を始めるための重要な一歩です。しかしOSAIDのデータ共有の要件は、特にAIモデルのための学習データを共有すべきかどうか、またどのように共有すべきかについては依然として議論の余地があります。

CCは、オープンデータセットの構築と公開が難しいからといって、それを奨励すべきでないということにはならないと考えています。学習データを共有すべきでない、あるいは共有できない場合には、そのデータはクローズドと定義し、データセットの内容を説明する詳細な要約と再現性のための指示を提供することを推奨します。データをオープンな形で共有できる場合には、そうすべきです。

私たちはDPGAのCEOである Liv Marte Nordhaug 氏が最近投稿した下記の言葉に賛同します。

「AIシステムに関しては、他のカテゴリーのDPGよりも寛容なAIシステムへのアプローチを進めることで、オープンデータ運動やDPGのカテゴリーとしてのオープンデータを不用意に損うことがないようにする必要があります。学習データに関する高い基準を維持すると、DPG標準の基準を満たすAIシステムの数を減らす可能性があります。しかし、SDGsとの関連性、プラットフォームからの独立性、「害を与えない」ことを設計に組み込むことは、DPGを他のオープンソース・ソリューションとは一線を画す特徴であり、そうした理由から、(AIの)学習データを含めることが必要なのです。」

今後の取り組み

CCは、AIモデルがデジタル公共財として認められるための基準を策定するにあたり、DPGAやその他のパートナーと協力し続けます。この分野において、私たちはオープンデータセットを推進し、AIモデルのすべてのコンポーネントをオープンな形で公開しなくても、各コンポーネントがデジタル公共財として認められるような階層型アプローチの検討を提唱していきます。この度更新された推奨事項とガイドラインは、オープンデータセットを利用・共有し、完全にオープンなAIシステムの価値を認識するもので、それらはAIが公共の利益に貢献することを保証する上で重要な役割を果たすでしょう。

参考資料

このブログ投稿は Cable Green と Creative Commons による "Why Digital Public Goods, including AI, Should Depend on Open Data" を翻訳したものです。

(担当:豊倉)

CCJP年次報告書(2023年度分)のお知らせ

クリエイティブ・コモンズ・ジャパン(CCJP)の主に2023年度の活動、注目している動向などを年次報告書としてとりまとめましたのでここに公開いたします。

2024年8月16日に最近一年ほどのCCJPやグローバルのCCの活動を紹介すると共に、AIとデジタルアーカイブなど複数分野に横断的に存在する来歴情報などのニーズについて議論するイベントを開催しました。このイベントの主なスライド資料を元に、CCJP年次報告書として公表させていただきます。末尾にはCCJPの母体であるNPO法人コモンスフィアの会計報告なども記載しています。ぜひ一度ご覧いただけたら幸いです。
報告書: オンラインスライド版 (Google Slides), PDF版

8/16(金) AI、DA分野の著作権に似た制度課題検討とCCJP年次報告会2024 開催のお知らせ

クリエイティブ・コモンズ・ジャパン(CCJP)では、最近一年ほどのCCJPやグローバルのCCの活動を紹介すると共に、生成AIやデジタル・アーカイブの領域を横断するような話題を議論するイベントを開催します。

このイベントでは年次報告会として私たちCCJPが普段どのような活動をしており、グローバルのCCではどのような動きがあるかをお伝えするとともに、オープン化にまつわる近年のトピックをひとつとりあげて「特集」的に議論いたします。

今年のイベントでとりあげるトピックはデジタル・アーカイブや生成AIにおいて、著作権制度に類似しつつも、制度外で扱われるかもしれない課題です。例えば次のような事象からそれらが伺えます。

・デジタル・アーカイブの運営者が、パブリックドメインの資料について、CCライセンスの下にアーカイブ資料を提供する場合があること
・AIの学習データとして自分の著作物が利用されることについて許諾したり、拒否したり、何らかの条件を課したいと考え、CCライセンスが使われることがあること
・様々な由来・来歴情報のニーズがあり、虚構と現実の記録、AI生成物と創作物、などを区別しやすくすることや、AIの学習に使われたデータの概要を示すことなどが求められるようになってきていること

これらの多くに共通するのは著作者・著作権者以外の関係者、著作権法上には規定のない出典などについてのいわば「メタデータ」の扱いですが、そのような情報の表示義務以外にも、利用・使用に関する制約の意向なども存在しています。こうした課題の種類や広がりについて検討し、また、解決方法として法的、技術的、社会的ものが議論され、あるいは導入されてきていることからこれらをとりあげて議論します。

クリエイティブ・コモンズ・ジャパンがこれまでとりあげてきたイベントのテーマの中でも今回のテーマは整理が難しく、ややわかりにくい、公開での勉強会といった性質の議論になる可能性があることをご承知おきください。また、関係がある動向や解決策についてご存じの方からの情報提供なども歓迎いたします。

【開催概要】
「AI、DA分野の著作権に似た制度課題検討とCCJP年次報告会2024」
日時:8月16日 (金) 18:30-20:30
参加料:無料
開催形式:オンライン(Webex)(※(注記)今回はオフラインの会場はありません)
お申し込み:(お申し込み受付は終了いたしました。)

【プログラム(暫定版)】
※(注記)当日までに変更になる可能性があることをご了承ください。
18:30-18:35 開会/主旨説明
18:35-19:00 CCJP国内の活動報告、クリエイティブ・コモンズのグローバルの動向・活動などの報告
19:00-20:27 特集セッション:AI、DA分野の著作権に似た制度課題の検討
20:27-20:30 閉会挨拶

パブリックドメインの資料を利用する際に所蔵機関について言及することを利用者に促すには

本記事のPDF版はこちら

Ocean Coast by Maurice Denis、パブリック・ドメイン・マーク、スウェーデン国立美術館

はじめに

本ガイドラインは、デジタル化されたパブリックドメインの文化遺産資料の利用に関して、それを所蔵する文化遺産所蔵機関が自身への言及を利用者に促したい場合のデザイン上のアイディアと実施例を提供するものです。本ガイドラインはパブリックドメイン資料をオープンに共有する所蔵機関を対象としていますが、文化遺産の電子資料に関連する著作権ライセンス問題に関心のあるすべての人にとって有益であると考えます。

背景

オープンカルチャーの広まり

文化遺産所蔵機関は、所蔵する資料を保存し共有することで、地域社会にとって欠かすことのできない役割を担っています。そしてインターネットとそれに伴うデジタル革命によって、所蔵機関が相次いで収蔵品をオンラインで公開し始めました。つまり、著作権の制約がない、またはほとんどない状態で、無料でアクセス、利用、再利用できるように広く公開されるようになったのです。クリエイティブ・コモンズの「Open Culture Voices」シリーズで多くの専門家が述べているように、オープン化は地域社会や一般市民に対して計り知れないほどの恩恵をもたらします。クリエイティブ・コモンズ(CC)ライセンスとパブリック・ドメイン・ツールは、「オープン」を実現するための重要な要素です。

パブリックドメイン作品のデジタル複製を公開するときに使えるCCライセンスはない

デジタル化され、オンラインで利用できるようになった多くの文化遺産は、著作権の保護期間を過ぎている、あるいはそもそも保護されていなかったパブリックドメインのものであり、著作権の許諾なく、誰でもどのような目的でも利用することができます。CCでは、パブリックドメイン作品の忠実なデジタル複製は、パブリックドメインとすべきであり、新たな著作権や関連する権利を生じさせてはならないと強く主張しています(和訳版はこちら)。同じ文脈で、ライセンスは著作権で保護されているコンテンツに関してのみ使用できるものであるため、パブリックドメイン作品のデジタル複製物を公開する際にCCライセンスを使用することはできません。それらを共有するには、現在、パブリックドメインに置くためのツール(CC0)の利用を推奨しています。

広く実践されているが問題のある「PD BY」

しかしながら、非常に多くの所蔵機関がCC0ではないCCライセンスを使って、パブリックドメイン資料の忠実な複製を公開しています。これは「PD BY」とも呼ばれることがあります。なぜこのようなことが広まったのでしょうか?それは、多くの所蔵機関が、文化遺産を保存、修復、デジタル化、共有しているのが自分たちであることを周知したいと考えているためです。そしてこれらの所蔵機関は利用者にクレジットを表記することを求める手段としてCCライセンスを使用しているのです。一方でCC0は帰属の表示を義務付けていません。私たちが作成した「 Needs Assessment Report: Are the Creative Commons Public Domain Tools Fit-for-Purpose in the Cultural Heritage Sector?」の資料でも、アンケートに回答した所蔵機関の約53%が、利用者にクレジット表記をしてもらう方法を求めていると答えており、素材が再利用・共有される際に所蔵機関がクレジット表記を受ける方法が無いことが、CC0で足りていない主なニーズであることが明らかになっています。

パブリックドメイン資料のより良い共有方法について

多くのコレクションが複雑な歴史的・法的背景を経て所蔵機関の管理下にあることを私たちは認識しています。私たちが先住民の文化遺産をオープンに共有することに関連して述べたように、対象物の著作権の状態は、正当な所有権や管理者を決定することはもってのほか、アクセスや利用の可能性を決定する唯一の方法では決してありません。

Sharing Public Domain Collections CC-BY ?!!? by Brigitte Vézina は "The Scream" をリミックスしたものです。本作品はCC BY 4.0のもとで提供されています。
"The Scream" Edvard Munch (1893), Public Domain, National Museum Oslo

管理している所蔵機関をCCライセンスで参照するのは
得策ではない

私たちは、所蔵機関が自分たちのコレクションからのパブリックドメインのデジタルなオブジェクトが利用される際に、自分たちが言及されること望むことに概ね共感しており、功績を認めるべき内容についてはユーザーはそのことをクレジット表記するべきだと考えます。しかし私たちは、実際にそれを行う手段としてCCライセンスを使用することに、以下の4つの主な理由から強く反対します:

資料の著作権状態が不明確になってしまう
資料へのアクセスや利用条件について利用者に混乱と誤解が生じる
ライセンスが無効となり法的強制力がない状況を作り出してしまう
CCの帰属表示ガイドラインとライセンス表記では、著作物のタイトル、作者または作成者、ライセンス、および出典(通常はURL)のみの記載を要求しているため、必ずしも所蔵機関の記載につながるとは限らない

所蔵機関は何をすべきか?

2022年、Deborah De Angelis(CC Italy)と渡辺智暁(CC Japan)が率いる CC Open Culture Platform のワーキンググループは、この問題を詳細に調査し「PD BY 」の問題に対処するための技術的、法的、社会的介入に関する提案を作成しました。

そしてワーキンググループの挙げた社会的介入策に触発され、私たちは、オープンライセンスまたはパブリックドメインの資料を利用する人々が資料を提供している所蔵機関に言及することを簡単かつ魅力的にするために、所蔵機関が導入できるシンプルなデザインアイデアを開発しました。Behavioural Insights Team の EASTモデル(「ナッジ」によって行動変容を起こしたり、特定の結果を促したりするためのシンプルなフレームワーク)を使って、適切な場面で所蔵機関が包括的な「典拠ステートメント」を提供するためのいくつかの方法を提案します。これらのユーザー・エクスペリエンスに関するアイデアは、CCライセンスやその他ツールと組み合わせて使用することができます。提案する機能の実装方法に関するHTML/CSSコードを含む技術的なガイドラインは提供しませんが、このリソースが各所蔵機関の技術環境に実装可能なデザインの青写真となることを願っています。

所蔵機関のためのクリエイティブ・コモンズの
ガイドライン

どのような情報を含めるべきか?

適切なステートメントには、以下の情報を含めるべきです:

タイトル
著者または作成者
ライセンスまたは許諾
所蔵機関
出典

こちらはその例です:

Ocean Coast by Maurice Denis、パブリック・ドメイン・マーク、スウェーデン国立美術館
https://collection.nationalmuseum.se/eMP/eMuseumPlus?service=ExternalInterface&module=collection&objectId=23187

所蔵機関はどのようにユーザーを促すことができるか?

所蔵機関は Behavioral Insights Team の EASTモデルを使って、ユーザーを誘導したり言及を促すことができます:

Easy(簡単) – 人々が参照しやすいようにする。
Attractive(魅力的) – 人々がやりたくなるようなものにする。
Social(社会的) – 行動を社会的価値につなげる。
Timely(タイムリー) – 適切なタイミングで情報を提供する。

所蔵機関がEASTモデルを適用するための簡単で戦略的な方法をまとめると以下ようになります:

Easy(簡単)にする方法

ワンクリックで参照先をコピーできるようにする
参考文献のテキストを自動ハイライトする

Attractive(魅力的)にする方法

資料を使ってくれることに感謝の意を述べる
ユーザーにとって情報をわかりやすく提供する
すべての情報を同時に提供する

Social(社会的)にする方法

ダウンロード数の共有
参照情報のコピー回数の共有
適切な参考文献の例を示す
ユーザーにソーシャルメディア上で機関のタグ付けを促す
出典を示すことで信頼を築く

Timely(タイムリー)にする方法

資料がダウンロードされたときにポップアップを表示する
ダウンロードしたファイルと一緒に参照情報を提供する
参照情報をメールで送信する
ユーザーアカウントを提供し、ユーザーが自身のダウンロード履歴を見られるようにする

実際にナッジの実装例を見てみましょう

このセクションでは、これらの戦略が実際にどのように実装されるか、4つのデザイン案を提示します:

コピーボタン
自動ポップアップ
テキストファイルをダウンロードするオプション
ダウンロード履歴が参照できるユーザープロフィール

典拠ステートメントを簡単にコピーできるボタン

ポップアップで典拠ステートメントを表示

資料と一緒にテキストファイルをダウンロードする

ダウンロード履歴が残るユーザープロフィール

設計のためのデータ整理

このセクションでは、(すべて JSON-LD で動作する)限定的なフレームワークと、典拠ステートメントを含めるのに適した構造を提供するプラットフォームの例を挙げます。

JSON-LD とは?

JSON-LD は軽量のリンクトデータ形式です。リンクトデータとはウェブサイト間で標準ベースの機械可読データのネットワークを構築する方法で、ウェブ上で情報を公開したり利用したりすることを可能にします。JSON-LD は人が読み書きしやすく、すでに成功している JSON フォーマットをベースにしています。JSON-LD は、JSON データをウェブのスケールで相互運用するための方法を提供します。JSON-LD は以下のプラットフォームの例に共通する標準であり、主要な検索エンジンによって推奨され、Internationalized Resource Identifier(RDI)を使用しています。

データフレームワーク

Schema.org の「CreativeWork」

Schema.org は、インターネット上の構造化データのためのスキーマを作成し、維持し、普及させることをミッションとする共同的なコミュニティによる活動です。スキーマは「タイプ」の集合であり、それぞれが項目の集合に関連付けられ、階層構造になっています。検索エンジンの発見性を高めるための最良の選択肢です。

CreativeWork のタイプには、以下のような数多くの項目があります:

名前(タイトル)
著者および作成者
ライセンスと構造化データライセンス
発行者
URL
著作権表示とクレジット

これらの項目は、コレクションのデータを標準化された機械可読な方法で構造化することを可能にします。入力データは、別の項目、例えば著作権表示やクレジットの項目を入力するために使用できます。

IIIF の「requiredStatement」

International Image Interoperability Framework(IIIF)は、コレクション管理のための世界標準であり、世界中の文化遺産機関で広く利用されています。

IIIFの「requiredStatement」は、資料が表示または利用される際に表示する必要があるテキストです。例えば、著作権や所有権に関する記述、所有機関や公開した機関への言及、そのほか利用者に表示することが重要であると判断されるテキストを何であれ提供することができます。

IIIFの権利表明のための「クックブック」は、ソースコードのガイドラインと実装方法を提供しています。

クリエイティブ・コモンズは所蔵機関に対し、利用者に参照してもらいたいすべての情報を「requiredStatement」に含めることを推奨しています。これには、タイトル、作成者または作者、提供機関名、著作権の状態、使用されているライセンスまたはパブリックドメインツール、出典が含まれます。

ccREL について

The Creative Commons Rights Expression Language(ccREL)は、著作権のライセンス条項や関連情報を機械可読的に表現するためのクリエイティブ・コモンズの標準です。ccRELは、World Wide Web Consortium の Resource Description Framework(RDF)に基づいています。2008年に提案されましたが、それ以来この標準への支持は著しく減少しています。現在は検索エンジンでの発見性向上のために ccREL を使用することは推奨されていません。検索エンジンでの発見性向上のためには Schema.org の「CreativeWork 」の使用をお勧めします。

共有のためのプラットフォーム

所蔵機関が所蔵するデジタル・オブジェクトを共有するためのプラットフォームは数多く存在します。ここでは、このガイドラインで提示されているデザインアイデアの一部をすでに実装している2つのプラットフォームを紹介します。

Europeana

Europeana は、ヨーロッパの文化遺産コレクションの統合プラットフォームです。公開されている API やその他のツールを使用してデジタルコレクションに関する情報を収集し、ヨーロッパのデジタル化されたコレクションへのアクセスと要覧を世界に提供しています。

このプラットフォームは、ユーザーが資料をダウンロードする際にステートメントを提供します。このステートメントには提供機関からの情報が入力され、Europeana への投稿に最低限必要なメタデータの一部となります。現在は提供機関へのレファレンスが含まれるようになっています。ステートメントは以下のフォーマットに従っています:

[タイトル] by [作成者] – [年] – [提供者], [国] – [権利に関するステートメント]

ウィキメディア・コモンズ

ウィキメディア・コモンズは、ウィキメディアが提供する画像、音声、動画を含むメディアファイルのコレクションです。アップロード者が資料のメタデータに帰属表示情報を追加した場合、その情報が利用者に対して表示されます。帰属表示に関する情報はメタデータ情報に書き込むことができ、資料のタイトル、作成者、出版機関、著作権ライセンスまたはパブリックドメインツールの情報を入力することができます。これは「Other fields = {{Credit line}}」のセクションに含めるのがベストです。

追加のサポート

これらのデザインのいずれかを実装する予定はありますか?このガイドラインを発展・改善させる方法(特に技術的な面で)についてご意見はありますか?この資料を他の言語で提供したいですか?

その場合は:

info@creativecommons.org までご連絡ください。
オープン・カルチャー・プラットフォームに参加して仲間と交流しましょう
私達が提供している翻訳ボランティアのプロセスに登録しましょう

謝辞

このガイドラインは、オープン・カルチャー・コーディネーターの Connor Benedict とクリエイティブ・コモンズの政策・オープン・カルチャー担当ディレクターの Brigitte Vézina によって作成されました。また本ガイドラインの作成にあたって、 Deborah De Angelis (CCイタリア)と渡辺智暁(CCジャパン)が率いるオープン・カルチャー・プラットフォームのワーキンググループのメンバーや、他のクリエイティブ・コモンズコミュニティのメンバー、クリエイティブ・コモンズのスタッフからの有益なフィードバックを受けることができましたことを深く感謝します。

画像のクレジット

Ocean Coast by Maurice Denis, Public Domain Mark, Swedish National Museum
Sharing Public Domain Collections CC-BY ?!!? by Brigitte Vézina is a remix of "The Scream" by Edvard Munch (1893), Public Domain, National Museum Oslo. Licensed CC BY 4.0
Download by Andi wiyanto from Noun Project (CC BY 3.0)
Zoom In by Andi wiyanto from Noun Project (CC BY 3.0)

その他のクレジット

本資料は Creative Commons による “NUDGING USERS TO REFERENCE INSTITUTIONS WHEN USING PUBLIC DOMAIN MATERIALS” を翻訳したものです。

元の資料のライセンス表示:Creative Commons 2024 | Creative Commons Attribution License 4.0 (CC BY 4.0)

本資料はクリエイティブ・コモンズ表示 4.0 ライセンスの下に提供されています。

翻訳に際して DeepL の出力を参考にしました。

5/21(火) 生成AIと著作権法制度の未来イベント開催のお知らせ

※(注記)本イベントのお申込みは終了いたしました。

クリエイティブ・コモンズ・ジャパン(CCJP)では、生成AIと著作権法・制度の未来について議論するイベントを開催いたします。生成AIによって文化とシェアの関係、クリエイターとデジタル技術の関係など、クリエイティブ・コモンズ・ジャパンが議論してきた領域で数々の論点が浮上しています。法律の専門家だけでなくクリエイター、技術者、一般市民、法学以外の政策研究者など様々な方の意見も踏まえて議論することの重要性もしばしば指摘されるところです。
そこで本イベントでは、デジタル技術や創作活動、文化におけるシェアの役割、著作権法や制度の未来について考えたい方の幅広いご参加を歓迎します。また、今後の幅広い議論に資するような中長期的な課題や問いを議論することを目指したいと思います。

【開催概要】
「生成AIから考える著作権法・制度の中長期課題」

主催:クリエイティブ・コモンズ・ジャパン
後援:国際大学グローバル・コミュニケーション・センター(GLOCOM)
日時:5月21日(火)18:30-20:00
参加料:無料。(事後開催の懇親会は有料)
登壇者:
・奥邨弘司(慶應義塾大学大学院法務研究科教授)
・中川譲(イラストレーター、宝塚大学特任教授)
・増田雅史(弁護士、森・濱田松本法律事務所パートナー)*
・渡辺智暁(国際大学GLOCOM 主幹研究員/教授/研究部長)(モデレーター兼担)*
(*印はCCJPメンバー)

開催形式:ハイブリッド形式
(オンラインはWebEx、オフラインは港区六本木にある国際大学GLOCOM)
お申し込み:オンラインフォームより事前登録をお願いします。
※(注記)本イベントのお申込みは終了いたしました。

TAROC オープンカルチャーの推奨に向けて

TAROCとは、”Towards a Recommendation on Open Culture”の略語で、「オープンカルチャーに関する勧告に向けて」を意味します。TAROCは、クリエイティブ·コモンズが主導するコミュニティ・イニシアチブ(共同体構想)で、オープン文化の価値、目的、メカニズムを目的とする、積極的で肯定的で影響力のある国際的な勧告文書の作成を支援することを目的としています。これにより、より広範な文化および情報政策を活性化および支援する手段として、文化を世界的にオープンに共有することに繋がります。

このTAROCを紹介するWebページが英語、日本語などで公開されていますので、ご覧ください。

英語ページ: TOWARDS A RECOMMENDATION ON OPEN CULTURE
日本語ページ: TAROC オープンカルチャーの推奨に向けて
関連英語ページ: CC CELEBRATES 20 YEARS OF THE UNESCO CONVENTION ON SAFEGUARDING INTANGIBLE HERITAGE

(担当: 前川)

いただいた意見の概要

今後の取り組み

今後の展望

フィードバックを募集しています

ご参加ください

議論に参加し、フィードバックを共有してください

CCシグナル会合に参加する

このムーブメントを支援する

オープンデータとデジタル公共財(DPG)

AIとオープンデータ

今後の取り組み

はじめに

背景

オープンカルチャーの広まり

パブリックドメイン作品のデジタル複製を公開するときに使えるCCライセンスはない

広く実践されているが問題のある「PD BY」

管理している所蔵機関をCCライセンスで参照するのは得策ではない

所蔵機関は何をすべきか?

所蔵機関のためのクリエイティブ・コモンズのガイドライン

どのような情報を含めるべきか?

所蔵機関はどのようにユーザーを促すことができるか?

Easy(簡単)にする方法

Attractive(魅力的)にする方法

Social(社会的)にする方法

Timely(タイムリー)にする方法

実際にナッジの実装例を見てみましょう

典拠ステートメントを簡単にコピーできるボタン

ポップアップで典拠ステートメントを表示

資料と一緒にテキストファイルをダウンロードする

ダウンロード履歴が残るユーザープロフィール

設計のためのデータ整理

データフレームワーク

Schema.org の 「CreativeWork」

IIIF の 「requiredStatement」

共有のためのプラットフォーム

Europeana

ウィキメディア・コモンズ

追加のサポート

謝辞

画像のクレジット

その他のクレジット

管理している所蔵機関をCCライセンスで参照するのは
得策ではない

所蔵機関のためのクリエイティブ・コモンズの
ガイドライン

Schema.org の「CreativeWork」

IIIF の「requiredStatement」