アブストラクト 大規模言語モデル(LLM)は、ブラウジング、音声アシスタント、コーディングアシスタントツールを含む、我々の生活における多くのドメインで活用されており、非常に大きな社会的インパクトをもたらす可能性を持っています。[1, 2, 3, 4, 5, 6, 7]このシステムカードでは、モデルのGPTファミリーの最新のLLMであるGPT-4を分析します。[8, 9, 10]最初に、モデルの制限(例: 実際は誤っているのにそれらしいテキストを生成する)と能力(例: 不法なアドバイスを提供する適合性の増加、二重使用の能力におけるパフォーマンス、リスクのある不意の挙動)によって生じる安全性の課題をハイライトします。次に、OpenAIがGPT-4の開発を準備するために導入した安全性プロセスのハイレベルの概要を説明します。これは、計測、モデルレベルの変更、製品、システムレベルの介入(モニタリング