AIの性能を測定するベンチマークには「日常タスクの実行精度を検証するテスト」や「計算問題の解答精度を検証するテスト」など多くの種類が存在しています。Maxim Lott氏は各種AIのIQテストの結果や政治的な質問に対する回答をまとめたウェブサイト「Tracking AI」を公開してAIの性能を客観的に比較できるようにしています。続きを読む……
このサイトの記事を見る
GPT-5やGrok 4など各種AIのIQテスト対決の結果が公開中&各AIが政治的に左寄りなのか右寄りなのかテストした結果も公開中

