AI, 動画,

スポンサーリンク
GIGAZINE

いろんな音が混ざった動画や音声から目的の音だけを分離できるAI「SAM Audio」をMetaが公開

Metaが音声分離AI「SAM Audio」を公開しました。SAM Audioには音声や動画を入力可能で、「文章で指示して特定の音を抜き出す」「動画内の『音声を発している被写体』を指定して音声を抜き出す」「動画内の特定のタイミングで鳴ってい...
GIGAZINE

Amazonがプライム・ビデオでAI要約動画を導入も滅茶苦茶なナレーションを生成してしまい急遽撤去

Amazonがプライム・ビデオでシリーズ作品の振り返り動画などを生成できる「Video Recaps」という機能を導入しました。しかし、このVideo Recapsが生成する動画には間違った内容が含まれることが明らかになり、Amazonは同...
GIGAZINE

Alibabaが多言語の音声を認識してリアルタイム会話が可能なAIモデル「Qwen3-Omni-Flash」のアップグレード版を発表

中国の大手テクノロジー企業・AlibabaのAI研究チームである「Qwen」が、多言語の音声を認識してリアルタイムの会話が可能なAIモデル「Qwen3-Omni-Flash」のアップグレード版である「Qwen3-Omni-Flash-202...
GIGAZINE

Gemini 3 Proは文書・空間・画面・動画理解で最先端パフォーマンスを実現

2025年11月にリリースされた「Gemini 3 Pro」について、Google DeepMindが「文書・空間・画面・映像の理解で最先端のパフォーマンスを実現する」という資料を公開しています。続きを読む......
GIGAZINE

動画生成AI「Runway Gen-4.5」が登場、OpenAIのSora 2やGoogleのVeo 3より高性能

AI開発企業のRunwayが動画生成AI「Runway Gen-4.5」を2025年12月1日に発表しました。Runway Gen-4.5はプロンプト追従性や物理現象の再現性能が向上しており、GoogleのVeo 3やOpenAIの Sor...
GIGAZINE

GoogleがGemini 3 Proとサードパーティーモデルを活用するエージェントファーストコーディングツール「Google Antigravity」をWindows・macOS・Linux向けに無料パブリックプレビューとして発表

GoogleがAIエージェント開発プラットフォームの「Google Antigravity」を発表しました。Googleの優れたAIモデルを活用した、AI搭載の統合開発環境(IDE)エクスペリエンスです。続きを読む......
GIGAZINE

Googleが気象予報モデルの「WeatherNext 2」を発表、1時間単位での高解像度予測が可能な最も高度で効率的なAIモデル

現地時間の2025年11月17日、Googleが最も高度で効率的とアピールする気象予報AIモデル「WeatherNext 2」を発表しました。WeatherNext 2は前モデルのWeatherNextと比較して、8倍高速に気象予報を生成で...
GIGAZINE

Googleが広告イメージ自動生成AIの「Pomelli」を発表

Googleが、広告用の画像生成ツール「Pomelli」を発表しました。ブランドの特徴を自動認識して適切な画像を生成可能で、ブランドの認知力を高めることができます。続きを読む......
GIGAZINE

MicrosoftがAIキャラクター「Mico」を発表、Officeのイルカのような存在になれるのか

MicrosoftがAIコンパニオンの「Mico」を発表しました。Micoはユーザーの音声入力に合わせて表情を変えたり色を変えたりして反応してくれます。続きを読む......
GIGAZINE

ショート動画を爆速で作成できる無料でオープンソースのAIモデル「Ovi」誕生、「テキスト」「テキスト+画像」で動画と音声を同時に生成可能

テキスト単体、あるいはテキスト+画像で5秒の動画を作成できるAIモデル「Ovi」が誕生しました。オープンソースで公開されており、自分で環境を構築すれば無料で使用することができます。続きを読む......
スポンサーリンク
通知を有効にしますか? OK! No...