ソフトウェア, 動画,

スポンサーリンク
GIGAZINE

Anthropicが軽量コスト重視の「Claude Haiku 4.5」を発表、Claude Sonnet 4と同等のパフォーマンスを3分の1のコストと2倍以上の速度で実現

現地時間の2025年10月16日、AI開発企業のAnthropicが「Claude Haiku 4.5」を発表しました。2025年5月時点では最先端のAIモデルだったClaude Sonnet 4と同等のコーディングパフォーマンスを、わずか...
GIGAZINE

Googleが動画生成AI「Veo 3.1」をリリース、1分以上の動画生成に対応&音声品質の向上など

現地時間の2025年10月15日、Googleが動画生成AIの「Veo 3.1」を発表しました。Veo 3.1はVeo 3をベースに開発された最先端動画生成AIで、画像から動画への変換時におけるプロンプトへの追従性が向上し、オーディオビジュ...
GIGAZINE

個人のあらゆるデータを1つのタイムラインに並べるオープンソースツール「Timelinize」

写真やテキストメッセージ、メール、日記、SNSの投稿、ワークアウト、連絡先など、個人のデータをすべてタイムライン上に並べて記録するオープンソースツール「Timelinize」が公開されています。対応OSはWindows、macOS、Linu...
GIGAZINE

Googleがブラウザ操作に特化したAIモデル「Gemini 2.5 Computer Use」をプレビューリリース、フォーム入力やログイン操作をAIエージェントが自動で実行

2025年10月7日、Googleがウェブブラウザの操作に特化したAIエージェント「Gemini 2.5 Computer Use」を発表しました。Gemini 2.5 Computer Useはフォームへの入力、ドロップダウンやフィルター...
GIGAZINE

MicrosoftがなんとWindows11インストール時にローカルアカウントを作成するコマンドを削除、今後はMicrosoftアカウントとネット接続必須に

Microsoftが、Windows 11のWindows Insider向けベータチャネルに「Windows 11 Insider Previewビルド 26120.6772 (KB5065797)」をリリースすることを発表しました。この...
GIGAZINE

Googleの次世代AIチャットボット「Gemini 3 Pro(仮)」がGoogle AI Studioでテスト中、出力結果はこんな感じ

Googleは、AIチャットボット「Gemini」の次世代モデルとなる「Gemini 3」を開発しているといわれています。Googleが提供するAIモデルの無料開発環境「Google AI Studio」のA/BテストでこのGemini 3...
GIGAZINE

NVIDIAが音声から3Dアバターの顔アニメーションを生成する「Audio2Face」をオープンソース化、音声にぴったり合うリップシンクを実現

NVIDIAが、音声に基づいて3Dアバターのリアルな顔アニメーションを生成するAI搭載ツール「Audio2Face」をオープンソース化しました。これにより、開発者はAudio2Faceとその基盤となるフレームワークを利用して、ゲームやアプリ...
GIGAZINE

GoogleとQualcommがPC向けAndroidを2026年にリリースする予定を明らかに

Qualcommが開催したイベント「Snapdragon Summit 2025」で、Qualcommのクリスティアーノ・アモンCEOとGoogleのデバイスおよびサービス担当バイスプレジデントであるリック・オスターロー氏が、PC向けにAn...
GIGAZINE

Alibabaがリアルタイムで音声会話できるAIモデル「Qwen3-Omni」やGPT-5と同等性能の画像認識AIモデル「Qwen3-VL」を公開、他にも言語モデルや画像編集モデルを一挙大量公開

中国に拠点を置く大手テクノロジー企業「Alibaba」のAI研究チーム「Qwen」が、自然言語でリアルタイム応答できるAIモデル「Qwen3-Omni」を2025年9月22日に発表しました。さらに、9月22日~24日の短期間に「Qwen3-...
GIGAZINE

Google ChromeにAIチャットボットを統合した「Gemini in Chrome」が有料ユーザー以外にも開放へ

「Google Chrome史上最大のアップデート」とGoogleが表現するアップデートがChromeに適用されます。これまで、Chromeに統合したAIチャットボットを直接呼び出せる「Gemini in Chrome」は「Google A...
GIGAZINE

MacBookを開けたり閉じたりするときにオナラの音を再生する恐るべきアプリ「FartScrollLid」

AppleのMacBookには、2019年にリリースされた16インチMacBook Proから、ディスプレイの開閉動作を担うヒンジに角度を認識するためのセンサーが搭載されています。ディスプレイの開閉角度をPC上で検知できることを利用して、開...
GIGAZINE

1枚の画像から生成した3Dシーンの中で視点が移動する動画を生成可能な「HunyuanWorld-Voyager」

中国の大手IT企業であるテンセントが、単一の画像から世界の整合性が取れた3Dシーンを生成するAIフレームワーク「HunyuanWorld-Voyager」をGitHubで公開しました。HunyuanWorld-Voyagerはコンテキストを...
GIGAZINE

ドライブスルーに音声AIによる注文システムを導入した大手ファストフードチェーンがAIの活用法を再考している

ファストフードチェーンのタコベルは、2024年から500以上の店舗のドライブスルーで音声AIによる注文システムを導入しています。ただし、すべての顧客がドライブスルーでAIとやり取りすることを好んでいるわけではなく、タコベル側もAIの活用法に...
GIGAZINE

無料で見られるPythonのドキュメンタリー映像「Python: The Documentary | An origin story」がYouTubeで配信中

プログラミング言語「Python」を題材にしたドキュメンタリー映像「Python: The Documentary | An origin story」が2025年8月29日(金)、YouTubeで公開されました。誰でも無料で視聴可能です。...
GIGAZINE

VLCの開発者が手がける超低遅延動画ストリーミングを可能にするオープンソースキット「Kyber」とは?

VideoLAN/VLCプロジェクトのリード開発者として知られるJBことジャン=バティスト・ケンプ氏が、動画伝送における遅延を可能な限り低減するために設計されたリアルタイム制御SDK「Kyber」を発表しています。KyberはFFmpegや...
GIGAZINE

Photoshopに生成AIを使った新しい画像編集機能が追加、最大8メガピクセルまで高画質化する「生成アップスケール」機能や数クリックで自然な合成を可能にする「調和」機能など

Adobeが画像編集ソフト・Photoshopの7月期アップデートを発表し、生成AIを使って画像を最大8メガピクセルまで高画質化できる「生成アップスケール」機能や画像オブジェクトを分析して自動調整する「調和」機能などの新機能を導入したと発表...
GIGAZINE

ほぼすべてのデバイスをファイルサーバーに変える「copyparty」、転送が中断してもレジュームで続きから可能&HTTP・WebDAV・FTP・TFTP・SMB/CIFSをサポート

ほぼすべてのデバイスを、任意のウェブブラウザを使用して利用可能なファイルサーバーに変えることができるのが「copyparty」です。続きを読む......
GIGAZINE

Copilotがタブ内容から文脈を理解してアイデアを示してくれる「Copilot Mode」がMicrosoft Edgeに登場

ブラウジングの方法は「タブを開いて、何かを検索して、ページの中身を読む」の繰り返しで根本的にはここ数十年変化がありませんでしたが、「AIによってウェブとの関わり方の転換点が訪れている」ということで、Microsoftがウェブブラウザ「Mic...
GIGAZINE

OpenAIが次世代AIの「GPT-5」を2025年8月にリリースか

AI業界のパイオニアであるOpenAIが、早ければ2025年8月にも新しい大規模言語モデル(LLM)の「GPT-5」をリリースする予定であると、テクノロジーメディアのThe Vergeが報じました。続きを読む......
GIGAZINE

ライブ動画をリアルタイムで変換するAI動画モデル「MirageLSD」リリース、実例はこんな感じ

AIスタートアップのDecartが、テキストプロンプトに基づいて動画編集を高速かつ制御可能に行うために設計された、新しい拡散ベースのAI動画編集モデル「MirageLSD」を発表しました。MirageLSDは、テキストから動画を生成する従来...
スポンサーリンク
通知を有効にしますか? OK! No...