AI開発者は、AIが有害な情報を出力することがないようさまざまな安全対策を施しています。ところが、厳密に思える安全対策でも「チーズの作り方」といった一見無害な情報で微調整されることで突破されてしまう可能性があることが明らかになりました。続きを読む……
このサイトの記事を見る
AIに「チーズ作り」などの無害な情報を学習させると化学兵器の作り方を学んでしまうことがAnthropicの研究で明らかに
AI開発者は、AIが有害な情報を出力することがないようさまざまな安全対策を施しています。ところが、厳密に思える安全対策でも「チーズの作り方」といった一見無害な情報で微調整されることで突破されてしまう可能性があることが明らかになりました。続きを読む……
このサイトの記事を見る