ソフトウェア, 動画,

スポンサーリンク
GIGAZINE

現実世界の様子やUIを理解してタスクをこなせるマルチモーダルAIエージェントの基盤モデル「Magma」をMicrosoftが発表

Microsoftが2025年2月に、現実世界の様子やデバイス上のスクリーンを認識して行動できるマルチモーダルAIエージェントの基盤モデルである「Magma」を発表しました。続きを読む......
GIGAZINE

Googleに約25年務める開発者が「どうやってGoogleは汎用人工知能(AGI)を達成しようと計画しているのか」について語る

近年では、人間のように未知の状況でも新たなスキルを効率的に取得して適応することが可能な「汎用(はんよう)人工知能(AGI)」の構築がさまざまなAI研究機関によって進められており、OpenAIはAGIの構築に向けてアメリカの国立研究機関と提携...
GIGAZINE

YouTubeショートにGoogle製動画生成AI「Veo 2」を用いた動画作成機能が追加される

YouTubeショートのAIを用いた動画作成補助機能「Dream Screen」に、Google製動画生成AI「Veo 2」を用いて動画を作る機能が追加されました。ユーザーは動画投稿時にVeo 2を用いて動画や画像を生成し、動画内の1シーン...
GIGAZINE

AIでディープフェイク動画を作られたスカーレット・ヨハンソンがAI規制を訴える

女優のスカーレット・ヨハンソン氏が、自身のAIディープフェイク動画がネット上で拡散されたことを受けて政府にAIを規制する法案の可決を最優先課題にするよう要請していることが報じられました。続きを読む......
GIGAZINE

もう何も信じられないレベルでリアルなディープフェイク動画が作れるByteDanceのAI「OmniHuman-1」が登場

1枚の写真から人が自然に話したり、歌ったり、動いたりするリアルな動画を出力するAIシステム「OmniHuman-1」を中国のByteDanceが発表しました。続きを読む......
GIGAZINE

Operaがマインドフルネスと心の健康に焦点を当てたブラウザ「Opera Air」をリリース

2025年2月4日、Operaがマインドフルネスを核とした世界初のウェブブラウザである「Opera Air」をリリースしました。ウェブサーフィン中にユーザーの気分が良くなるように設計されたウェブブラウザで、バイノーラルビートを流したり、前向...
GIGAZINE

OpenAIのサム・アルトマンCEOが「DeepSeek-R1はスゴイけど、もっとスゴイAIモデルを発表予定」と発言

AI業界のリーダー的存在であるOpenAIのサム・アルトマンCEOが、低コストで高パフォーマンスなAIモデルを開発したと業界で話題の中国発のAI企業「DeepSeek」について、「DeepSeek-R1は印象的なモデルだけど、より優れたAI...
GIGAZINE

PCやスマートフォンのUIを認識して自動操作できる視覚言語モデル「Qwen2.5 VL」をAlibabaのAI研究チームがリリース、GPT-4o超えの性能で航空券の予約などを自動で実行可能

Alibaba CloudのAI研究チームであるQwenが、視覚言語モデル「Qwen2.5 VL」をリリースしました。Qwen2.5 VLは画像に含まれる被写体の種類を認識したり文字を書き起こしたりできるだけでなく、PCやスマートフォンのU...
GIGAZINE

あのNyan CatをUEFIに移植する「UEFI NYAN 80×25」が登場

PCを起動した際に、OSが動作する前にCPUやメモリなどが正しく動作するように制御するインターフェースがUEFI(Unified Extensible Firmware Interface)です。このUEFIにNyan Catを移植する「U...
GIGAZINE

キヤノンが複数のスマホでマルチアングル撮影できるライブ配信用アプリ「Live Switcher Mobile」をリリース、キヤノンのカメラ接続には今後対応予定

キヤノンが複数のスマートフォンを接続することによって簡単にマルチアングルでのライブ配信ができるアプリ「Live Switcher Mobile」をリリースしました。対応OSはiOS 16/17/18とiPadOS 16/17/18で、接続が...
GIGAZINE

Adobe Photoshopの編集作業を複数人で同時実行できる「ライブ共同編集」が登場

Photoshopに複数人での同時編集を可能とする機能「ライブ共同編集」が追加されることが発表されました。記事作成時点ではベータテストが実施されています。続きを読む......
GIGAZINE

人気のブラウザ拡張機能「PayPal Honey」がインフルエンサーのアフィリエイト収益を盗みユーザーに不利な取引を提示していることが判明

オンラインショッピング向けの人気ブラウザ拡張機能「PayPal Honey」が、宣伝活動を担当したインフルエンサーに支払われるはずのアフィリエイト収益を盗み、ユーザーに不利な取引を提示していることが明らかになりました。続きを読む......
GIGAZINE

現実世界より43万倍も高速にシミュレートされた世界でロボットを訓練できるオープンソース生成物理エンジン「Genesis」

カーネギーメロン大学の研究チームが、現実の43万倍の速さでシミュレーションを実行できる物理シミュレーションプラットフォーム「Genesis」を発表しました。GenesisはPythonベースの軽量な設計、高速な物理演算、自然言語による世界生...
GIGAZINE

GPT-4oやGoogle Geminiに「自転車に乗ったペリカン」をSVG形式で描かせるベンチマークを試すとこんな感じ

OpenAIやGoogle、Anthropic、Metaなど、さまざまな企業が大規模言語モデルを開発しており、各社の開発するモデルの性能差はベンチマークを使って比較されます。エンジニアのサイモン・ウィリソン氏が、「自転車に乗ったペリカン」を...
GIGAZINE

既存の動画生成AIを8倍高速化できる「FastVideo」登場

動画生成AIの生成速度を高速化できるフレームワーク「FastVideo」が登場しました。この技術により、既存の動画生成モデルの生成速度を8倍に高速化できることが確認されています。続きを読む......
GIGAZINE

Googleが最大4Kの動画を生成できるAI「Veo 2」を発表、人間による評価でOpenAIのSoraを上回る

Googleが2024年12月16日に動画生成AIの「Veo 2」を発表しました。最大4Kまでの解像度の動画を作成できるほか、実写風動画以外にアニメ調の動画を作成可能で、カメラに対する指示も忠実に反映できると述べられています。続きを読む.....
GIGAZINE

MetaのMRヘッドセットでWindows 11のフル機能が利用可能に

Metaの複合現実(MR)ヘッドセットであるMeta Quest 3およびMeta Quest 3Sで、Windows 11の全機能が使えるようになるとMicrosoftが発表しました。続きを読む......
GIGAZINE

Adobeが写真からガラスの映り込みを削除できる「Reflection Removal tool」を公開

Adobeが、窓越しに撮影した写真に写り込む反射を除去できるツール「Reflection Removal tool」を発表しました。記事作成時点でテクノロジープレビューが、Adobe Camera Rawで使用可能です。続きを読む........
GIGAZINE

AMDやIntelのCPUを搭載したPCでmacOSを実行できる「OSX-PROXMOX」

macOSは記事作成時点でAppleシリコン搭載端末のみをサポートしており、AMDやIntelなどのx86チップを搭載したPCで使用することはできません。「OSX-PROXMOX」は、AMDやIntelのCPUを搭載したPCでもmacOSを...
GIGAZINE

ついにSiriからChatGPTを使用可能に、Apple IntelligenceとChatGPTの統合で

OpenAIの発表イベント「12 Days of OpenAI」が5日目を迎えた2024年12月12日に、OpenAIがChatGPTとApple Intelligenceの統合を発表しました。これによりiPhone、iPad、Macユーザ...
スポンサーリンク
通知を有効にしますか? OK! No...