GIGAZINE Claude Opus 4が開発中にユーザーを「個人情報を漏らすぞ」と脅迫する挙動が見られるも安全性強化で改善される、悪質利用をメールで内部告発する事例も
Anthropicは、2025年5月23日にAIモデル「Claude Opus 4」をリリースするにあたり、AIの安全性に関する新たな基準を導入したことを明らかにしました。このASL-3が導入された背景には、化学・生物・放射性物質・核兵器(...
GIGAZINE
GIGAZINE
GIGAZINE
GIGAZINE
GIGAZINE
GIGAZINE
GIGAZINE
GIGAZINE
GIGAZINE
GIGAZINE
GIGAZINE
GIGAZINE
GIGAZINE
GIGAZINE
GIGAZINE
GIGAZINE
GIGAZINE
GIGAZINE
GIGAZINE
GIGAZINE