AI, 動画,

スポンサーリンク
GIGAZINE

データを収集しないProtonのチャットAI「Lumo」にファイル管理可能な「Projects」が追加される

プライバシー特化型メールサービス「Proton Mail」で知られるテクノロジー企業のProtonはチャットAI「Lumo」も展開しています。2026年1月13日にはLumo 1.3がリリースされ、プライバシーを保ちつつ各種ファイルを入力し...
GIGAZINE

Googleの動画生成AI「Veo 3.1」がアップデートされてキャラクターの一貫性が向上し4Kアップスケーリングにも対応

Googleが動画生成AI「Veo 3.1」のアップデートを2026年1月13日に発表しました。参考画像を元に動画を作成する機能が改良されたほか、キャラクターの一貫性向上や4Kアップスケーリング機能の追加などが行われています。続きを読む.....
GIGAZINE

私たちが完全に理解している最も複雑なAIモデルとは何か?

驚異的な発展を続けるAI技術に対して、「なんだかよくわからない」という印象を持つ人は決して少なくはありませんが、AIをよく知る人でさえ同じ考えに至るようです。AIに関する教育的デジタルコンテンツを制作するWelch Labsが「現代のAIを...
GIGAZINE

動画生成AI「LTX-2」登場、ローカル動作するオープンモデルでNVIDIAによる「4K動画生成パイプライン」もあり

AI開発企業のLightricksがオープンソースのオーディオ・ビデオ生成モデル「LTX-2」をリリースしました。LTX-2ではハイエンドな個人用PCでローカル実行することが可能で、環境音や会話音声を含む動画を生成できます。続きを読む......
GIGAZINE

日本語特化の小型AIモデル「LFM2.5-1.2B-JP」を含むオンデバイス重視のオープンモデル「LFM2.5」シリーズが登場

AI開発企業のLiquid AIがデバイス上でのローカル動作を焦点に当てた小型AIモデル「LFM2.5」を2026年1月5日に公開しました。LFM2.5シリーズには日本語特化の「LFM2.5-1.2B-JP」も含まれており、どのモデルも無料...
GIGAZINE

AIにスナック自販機の経営を任せたらPlayStationの無償配布や魚の入荷を始めて大赤字

AI企業のAnthropicは自動販売機に自社製AIを組み込んで経営を任せる「Project Vend」という実験を行っています。2025年6月の初期報告に続いて、2025年12月18日には機能改善などを取り入れたフェーズ2の実験結果が公開...
GIGAZINE

いろんな音が混ざった動画や音声から目的の音だけを分離できるAI「SAM Audio」をMetaが公開

Metaが音声分離AI「SAM Audio」を公開しました。SAM Audioには音声や動画を入力可能で、「文章で指示して特定の音を抜き出す」「動画内の『音声を発している被写体』を指定して音声を抜き出す」「動画内の特定のタイミングで鳴ってい...
GIGAZINE

Amazonがプライム・ビデオでAI要約動画を導入も滅茶苦茶なナレーションを生成してしまい急遽撤去

Amazonがプライム・ビデオでシリーズ作品の振り返り動画などを生成できる「Video Recaps」という機能を導入しました。しかし、このVideo Recapsが生成する動画には間違った内容が含まれることが明らかになり、Amazonは同...
GIGAZINE

Alibabaが多言語の音声を認識してリアルタイム会話が可能なAIモデル「Qwen3-Omni-Flash」のアップグレード版を発表

中国の大手テクノロジー企業・AlibabaのAI研究チームである「Qwen」が、多言語の音声を認識してリアルタイムの会話が可能なAIモデル「Qwen3-Omni-Flash」のアップグレード版である「Qwen3-Omni-Flash-202...
GIGAZINE

Gemini 3 Proは文書・空間・画面・動画理解で最先端パフォーマンスを実現

2025年11月にリリースされた「Gemini 3 Pro」について、Google DeepMindが「文書・空間・画面・映像の理解で最先端のパフォーマンスを実現する」という資料を公開しています。続きを読む......
GIGAZINE

動画生成AI「Runway Gen-4.5」が登場、OpenAIのSora 2やGoogleのVeo 3より高性能

AI開発企業のRunwayが動画生成AI「Runway Gen-4.5」を2025年12月1日に発表しました。Runway Gen-4.5はプロンプト追従性や物理現象の再現性能が向上しており、GoogleのVeo 3やOpenAIの Sor...
GIGAZINE

GoogleがGemini 3 Proとサードパーティーモデルを活用するエージェントファーストコーディングツール「Google Antigravity」をWindows・macOS・Linux向けに無料パブリックプレビューとして発表

GoogleがAIエージェント開発プラットフォームの「Google Antigravity」を発表しました。Googleの優れたAIモデルを活用した、AI搭載の統合開発環境(IDE)エクスペリエンスです。続きを読む......
GIGAZINE

Googleが気象予報モデルの「WeatherNext 2」を発表、1時間単位での高解像度予測が可能な最も高度で効率的なAIモデル

現地時間の2025年11月17日、Googleが最も高度で効率的とアピールする気象予報AIモデル「WeatherNext 2」を発表しました。WeatherNext 2は前モデルのWeatherNextと比較して、8倍高速に気象予報を生成で...
GIGAZINE

Googleが広告イメージ自動生成AIの「Pomelli」を発表

Googleが、広告用の画像生成ツール「Pomelli」を発表しました。ブランドの特徴を自動認識して適切な画像を生成可能で、ブランドの認知力を高めることができます。続きを読む......
GIGAZINE

MicrosoftがAIキャラクター「Mico」を発表、Officeのイルカのような存在になれるのか

MicrosoftがAIコンパニオンの「Mico」を発表しました。Micoはユーザーの音声入力に合わせて表情を変えたり色を変えたりして反応してくれます。続きを読む......
GIGAZINE

ショート動画を爆速で作成できる無料でオープンソースのAIモデル「Ovi」誕生、「テキスト」「テキスト+画像」で動画と音声を同時に生成可能

テキスト単体、あるいはテキスト+画像で5秒の動画を作成できるAIモデル「Ovi」が誕生しました。オープンソースで公開されており、自分で環境を構築すれば無料で使用することができます。続きを読む......
スポンサーリンク
通知を有効にしますか? OK! No...