スポンサーリンク

Alibabaの視覚言語AIモデル「Qwen3-VL」は2時間ある映像に挿入されたフレームを99.5%の精度で特定可能

中国のIT大手・Alibaba(阿里巴巴:アリババ)が、AIモデル「Qwen」シリーズで最も高性能な視覚言語モデルである「Qwen3-VL」の技術レポートを公開しました。様々なベンチマークを行った結果、Qwen3-VLは「視覚的な数学タスク」を得意とするほか、言語網羅率もQwen2.5のほぼ4倍の39言語に増加し、そのうち32の言語でOCR精度が70%超えとなっていることが報告されています。続きを…

このサイトの記事を見る

通知を有効にしますか? OK! No...
タイトルとURLをコピーしました