OpenAIがAIエージェントの性能を測定するベンチマークテスト「EVMbench」を発表しました。EVMbenchは仮想通貨ブロックチェーンのスマートコントラクトに存在する脆弱(ぜいじゃく)性の「検知能力」「修正能力」「悪用能力」を測定するテストで、すでにOpenAIやGoogleやAnthropicのAIでの測定結果が公開されています。続きを読む……
このサイトの記事を見る
OpenAIがAIの仮想通貨に対する攻撃・防御能力を測定できるベンチマークテスト「EVMbench」を発表
OpenAIがAIエージェントの性能を測定するベンチマークテスト「EVMbench」を発表しました。EVMbenchは仮想通貨ブロックチェーンのスマートコントラクトに存在する脆弱(ぜいじゃく)性の「検知能力」「修正能力」「悪用能力」を測定するテストで、すでにOpenAIやGoogleやAnthropicのAIでの測定結果が公開されています。続きを読む……
このサイトの記事を見る