AI, 動画,

いろんな音が混ざった動画や音声から目的の音だけを分離できるAI「SAM Audio」をMetaが公開

Metaが音声分離AI「SAM Audio」を公開しました。SAM Audioには音声や動画を入力可能で、「文章で指示して特定の音を抜き出す」「動画内の『音声を発している被写体』を指定して音声を抜き出す」「動画内の特定のタイミングで鳴ってい...

2025/12/17

GIGAZINE

Amazonがプライム・ビデオでシリーズ作品の振り返り動画などを生成できる「Video Recaps」という機能を導入しました。しかし、このVideo Recapsが生成する動画には間違った内容が含まれることが明らかになり、Amazonは同...

2025/12/12

GIGAZINE

中国の大手テクノロジー企業・AlibabaのAI研究チームである「Qwen」が、多言語の音声を認識してリアルタイムの会話が可能なAIモデル「Qwen3-Omni-Flash」のアップグレード版である「Qwen3-Omni-Flash-202...

2025/12/12

GIGAZINE

2025年11月にリリースされた「Gemini 3 Pro」について、Google DeepMindが「文書・空間・画面・映像の理解で最先端のパフォーマンスを実現する」という資料を公開しています。続きを読む......

2025/12/08

GIGAZINE

AI開発企業のRunwayが動画生成AI「Runway Gen-4.5」を2025年12月1日に発表しました。Runway Gen-4.5はプロンプト追従性や物理現象の再現性能が向上しており、GoogleのVeo 3やOpenAIの Sor...

2025/12/02

GIGAZINE

GoogleがAIエージェント開発プラットフォームの「Google Antigravity」を発表しました。Googleの優れたAIモデルを活用した、AI搭載の統合開発環境(IDE)エクスペリエンスです。続きを読む......

2025/11/19

GIGAZINE

現地時間の2025年11月17日、Googleが最も高度で効率的とアピールする気象予報AIモデル「WeatherNext 2」を発表しました。WeatherNext 2は前モデルのWeatherNextと比較して、8倍高速に気象予報を生成で...

2025/11/18

GIGAZINE

Googleが、広告用の画像生成ツール「Pomelli」を発表しました。ブランドの特徴を自動認識して適切な画像を生成可能で、ブランドの認知力を高めることができます。続きを読む......

2025/10/29

GIGAZINE

MicrosoftがAIコンパニオンの「Mico」を発表しました。Micoはユーザーの音声入力に合わせて表情を変えたり色を変えたりして反応してくれます。続きを読む......

2025/10/24

GIGAZINE

テキスト単体、あるいはテキスト＋画像で5秒の動画を作成できるAIモデル「Ovi」が誕生しました。オープンソースで公開されており、自分で環境を構築すれば無料で使用することができます。続きを読む......

2025/10/23

GIGAZINE