エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください
Twitterで共有ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
プロンプトインジェクションについて情報収集している過程で、プロンプトインジェクションで遊べる「Gan... プロンプトインジェクションについて情報収集している過程で、プロンプトインジェクションで遊べる「Gandalf」というサイトを見つけました。 これはスイスのAI セキュリティ企業「LAKERA」が提供しているサイトで、ユーザーは魔法使いAIのGandalfくんにプロンプトインジェクションを使ってパスワードを引き出すゲームを楽しめます。 問題は難易度別にレベル1〜8の8問。Gandalfくんはパスワードを破られるごとにレベルアップし、よりプロンプトインジェクション対策を強固にしていきます。 内部的にはChatGPTモデルが使われており、日本語でも解くことができます。 私はレベル7まで解くことができたので、下記にそのwriteup(解き方)をまとめます。今から遊びたい人はネタバレ注意です! なお、日本語で遊ぶ際は、漢字変換中の誤送信に注意してください。エンターキーを押すとプロンプトが送信される仕様