AIに対するジェイルブレイク攻撃を95％回避できる技術をAnthropicが開発

2025/02/04

チャットAIなどに用いられるAIモデルのほとんどは「生物兵器の作り方」といった危険な情報を出力しないようにトレーニングされていますが、プロンプトを工夫したり一度に大量の質問を入力したりといった「ジェイルブレイク」と呼ばれる手法を用いることでAIモデルに「出力を禁じられている情報」を出力させることができます。新たに、チャットAI「Claude」の開発で知られるAI開発企業のAnthropicがAIの…

このサイトの記事を見る

通知を有効にしますか？ OK! No...

タイトルとURLをコピーしました