ソフトウェア,

スポンサーリンク
GIGAZINE

iPhoneでも動作する日本語AIモデル「TinySwallow-1.5B」を日本に拠点を置くSakana AIがリリース、大規模言語モデルから知識蒸留して小規模かつ高性能なAIモデルを実現

日本に拠点を置くAI企業の「Sakana AI」が小規模日本語言語モデル「TinySwallow-1.5B」を2025年1月30日(木)に発表しました。TinySwallow-1.5Bは小規模かつ高性能なAIモデルを実現する知識蒸留手法「T...
GIGAZINE

DeepSeek-R1がオープンソースでなければならなかった理由、そしてなぜOpenAIを倒せないのか

中国のAI企業・DeepSeekが2025年1月20日にリリースした推論モデルの「DeepSeek-R1-Zero」と「DeepSeek-R1」は、OpenAIの推論モデル・o1相当の性能でありながらo1と比べてトレーニングコストが非常に低...
GIGAZINE

わかりやすい目標を掲げたせいで本来の目的が見失われる「ソビエトの靴工場の原理」

「世界初のwiki」ことWikiWikiWebで、目に見えやすい目標を安易に設定したことにより本末転倒の結果を招いた事例として、旧ソビエト連邦の靴工場のエピソードが紹介されています。続きを読む......
GIGAZINE

DeepSeekの推論モデル「DeepSeek-R1」をOpenAIのo1&o3と比較することで明らかになったこととは?

ほとんどのAIベンチマークはAIの出力精度(スキル)を測定するものですが、スキルはAIの知能を表すものではありません。スキルではなくAIの知能を測定するため、AIがスキルを効率的に習得する能力を測定するベンチマークが「ARC-AGI」です。...
GIGAZINE

GPT-4oやDeepSeek-V3よりも高性能なAIモデル「Qwen2.5-Max」を中国IT大手のAlibabaがリリース

Alibaba CloudのAI研究チームであるQwenが、AIモデル「Qwen2.5-Max」を2025年1月28日にリリースしました。Qwen2.5-Maxは複数のテストでGPT-4oやDeepSeek-V3を上回るスコアを記録していま...
GIGAZINE

「DeepSeek-R1」は中国に関するデリケートな話題の85%に回答することを拒否、ただし簡単に制限を回避できるとの指摘

OpenAIの推論モデルである「o1」と比べ、コストがわずか3%でありながら同等のパフォーマンスを発揮可能な「DeepSeek-R1」の登場で、開発元であるDeepSeekへの注目が高まっています。しかし、DeepSeekは中国の企業である...
GIGAZINE

DeepSeek-R1がMicrosoftのAzure AIとGitHubモデル経由で利用可能に

Microsoftが2025年1月29日に、中国のAI企業・DeepSeekが開発したDeepSeek-R1をAI開発のための統合プラットフォームであるAzure AI FoundryとGitHubモデルに導入したことを発表しました。続きを...
GIGAZINE

DeepSeekがOpenAIのデータを「蒸留」してAIを開発していた可能性が浮上、OpenAIは「証拠がある」と発言

「中国発のAI企業であり業界で注目を集めるDeepSeekは、OpenAIの利用規約違反に相当するデータの『蒸留』を行った上で独自のAIモデルのトレーニングに使用していた」と、OpenAIが発表しました。OpenAIは証拠もつかんでいるとの...
GIGAZINE

目的に合ったAIモデルを探せるツール「Lumigator」をMozilla.aiがリリース

AIの急速な発達により、さまざまな分野において高度なパフォーマンスを発揮する言語モデルがいくつも誕生しています。しかし、言語モデルには得意、不得意があるため、特定のユースケースに適したモデルを選択することは、開発者にとって困難な課題となって...
GIGAZINE

ジャック・ドーシー率いる決済サービス「Block」がAIエージェント「Goose」を発表

Twitterの創業者として知られるジャック・ドーシー氏の率いる決済サービス「Block」が、独自のオープンソースAIエージェント「Goose(codename goose)」を発表しました。続きを読む......
GIGAZINE

DeepSeek-R1のサイズを最大80%削減した動的量子化モデルが公開中

中国のAI企業がリリースしたDeepSeek-R1は、OpenAIの推論モデル・o1相当の性能を持ちながら、モデルデータがオープンソースとして公開されていることが特徴です。ダニエル・ハン氏とマイケル・ハン氏の兄弟2人で運用されるAI開発チー...
GIGAZINE

DeepSeek-R1の出現は「スプートニクショック」というよりも「Google登場に等しい」との評価

2025年1月20日、DeepSeekが推論モデルの「DeepSeek-R1-Zero」と「DeepSeek-R1」をMITライセンスの下でオープンソースとして公開しました。「R1」のトレーニングコストはOpenAIの推論モデル「o1」の約...
GIGAZINE

2025年1月のWindows 11の更新でPCのオーディオ機能に不具合が発生、ウェブカメラやBluetoothも

Microsoftが2025年1月に配信したWindows 11 24H2のアップデートであるKB5050009により、サウンド出力やBluetooth接続が機能しなくなってしまう問題が発生していることが判明しました。続きを読む......
GIGAZINE

低コストで超高性能な「DeepSeek-R1」に似たAIモデルを誰でも開発できるようにオープンでない部分を補完するプロジェクト「Open-R1」をHugging Faceが始動

中国のAI企業が2025年1月20日(月)にリリースしたAIモデル「DeepSeek-R1」は、「OpenAI o1」と同等の性能を備えつつ学習コストや運用コストが低いことを特徴としています。このDeepSeek-R1は、モデルデータが無料...
GIGAZINE

Linuxのコードをたった30行修正するだけでデータセンターの電力消費量を最大30%削減可能、実際にLinux 6.13から反映される

「データセンターがデータトラフィックを処理する方法はもっと効率的にすることができる」として、カナダ・ウォータールー大学のマーティン・カーステン教授が提案したコード修正が、Linux 6.13で反映されます。修正により、主要データセンターのエ...
GIGAZINE

話題の中国AI企業「DeepSeek」の創設者兼CEOであるLiang Wenfengへのインタビューからイノベーションの秘訣を探る

低コストで高パフォーマンスなAIモデルを発表したことで、App Storeの無料アプリランキングで1位を獲得したり、AIチップメーカーの株価が急落したりと、AI業界で話題の中国企業が「DeepSeek」です。そんなDeepSeekを、同社の...
GIGAZINE

DeepSeekはなぜこんな大騒ぎになっていて一体何がそんなにスゴいのか

2025年1月20日、DeepSeekが推論モデルの「DeepSeek-R1-Zero」と「DeepSeek-R1」をMITライセンスの下でオープンソースとして公開しました。「R1」のトレーニングコストはOpenAIの推論モデル「o1」の約...
GIGAZINE

DeepSeekはどのようにしてOpenAIの3%のコストでo1を超えたのか?

中国のAI企業・DeepSeekが2025年1月にリリースしたオープンソースモデル「DeepSeek R1」はAI業界に衝撃をもたらし、そのインパクトは株式市場をも揺るがしています。特に注目されているR1のコストパフォーマンスについて、IT...
GIGAZINE

DeepSeekの登場で株価が下落したNVIDIAが「DeepSeekの推論にも相当のNVIDIAチップが必要」と主張し自社の価値をアピール

大企業が多額のコストと時間を費やして完成させたAIモデルよりも優れているとされる「R1」を中国AI企業のDeepSeekが発表し、既存のモデルよりもはるかに少ないコストでトレーニングしたことが判明したために、投資家の間でトレーニングに使用さ...
GIGAZINE

中国のAI「DeepSeek」ショックでハイテク株がパニック売りに、NVIDIAの時価総額が91兆円消し飛んで暴落記録を2倍以上更新

中国のAI企業・DeepSeekが2025年1月にリリースした、OpenAI o1相当のオープンソースモデル「DeepSeek-R1」により中国製AIの台頭が懸念され、NVIDIAの株価が一時約17%暴落して同社の時価総額が5888億ドル(...
スポンサーリンク
通知を有効にしますか? OK! No...