ソフトウェア, 動画,

スポンサーリンク
GIGAZINE

VLCの開発者が手がける超低遅延動画ストリーミングを可能にするオープンソースキット「Kyber」とは?

VideoLAN/VLCプロジェクトのリード開発者として知られるJBことジャン=バティスト・ケンプ氏が、動画伝送における遅延を可能な限り低減するために設計されたリアルタイム制御SDK「Kyber」を発表しています。KyberはFFmpegや...
GIGAZINE

Photoshopに生成AIを使った新しい画像編集機能が追加、最大8メガピクセルまで高画質化する「生成アップスケール」機能や数クリックで自然な合成を可能にする「調和」機能など

Adobeが画像編集ソフト・Photoshopの7月期アップデートを発表し、生成AIを使って画像を最大8メガピクセルまで高画質化できる「生成アップスケール」機能や画像オブジェクトを分析して自動調整する「調和」機能などの新機能を導入したと発表...
GIGAZINE

ほぼすべてのデバイスをファイルサーバーに変える「copyparty」、転送が中断してもレジュームで続きから可能&HTTP・WebDAV・FTP・TFTP・SMB/CIFSをサポート

ほぼすべてのデバイスを、任意のウェブブラウザを使用して利用可能なファイルサーバーに変えることができるのが「copyparty」です。続きを読む......
GIGAZINE

Copilotがタブ内容から文脈を理解してアイデアを示してくれる「Copilot Mode」がMicrosoft Edgeに登場

ブラウジングの方法は「タブを開いて、何かを検索して、ページの中身を読む」の繰り返しで根本的にはここ数十年変化がありませんでしたが、「AIによってウェブとの関わり方の転換点が訪れている」ということで、Microsoftがウェブブラウザ「Mic...
GIGAZINE

OpenAIが次世代AIの「GPT-5」を2025年8月にリリースか

AI業界のパイオニアであるOpenAIが、早ければ2025年8月にも新しい大規模言語モデル(LLM)の「GPT-5」をリリースする予定であると、テクノロジーメディアのThe Vergeが報じました。続きを読む......
GIGAZINE

ライブ動画をリアルタイムで変換するAI動画モデル「MirageLSD」リリース、実例はこんな感じ

AIスタートアップのDecartが、テキストプロンプトに基づいて動画編集を高速かつ制御可能に行うために設計された、新しい拡散ベースのAI動画編集モデル「MirageLSD」を発表しました。MirageLSDは、テキストから動画を生成する従来...
GIGAZINE

AGIを実現するために必須の能力は何なのか?そもそも知能とは何か?

AIの技術は急速に進歩していますが、何でもできる汎用人工知能(AGI)はまだ登場していません。Googleの元研究員でAIの研究を先導してきたフランソワ・ショレ氏は、2025年6月に開催された「AI Startup School」でAGIの...
GIGAZINE

Anthropicが投資家向けの「Claude for Financial Services」をリリース、データプラットフォームや業界プロバイダーと統合し包括的な金融情報にリアルタイムでアクセス可能

Anthropicが機関投資家向けAIの「Claude for Financial Services」をリリースしました。金融データプラットフォームや金融テクノロジープラットフォームを統合し、さまざまな金融情報にリアルタイムでアクセスするこ...
GIGAZINE

日本語の完璧なあいづちまで実現した音声対話AIモデル「J-Moshi」を名古屋大学の研究者が発表

名古屋大学大学院情報学研究科の研究チームが、日本語全二重(Full-duplex)音声対話システム「J-Moshi」を発表しました。J-Moshiは近年注目を集めている同時双方向的な音声対話システムを、日本語でも実現するという点で画期的であ...
GIGAZINE

ついに「Grok 4」が登場、OpenAIなどの推論モデルを超える性能で「世界最強AIモデル」とアピールするも「イーロン・マスクの発言を参考にしまくる」という挙動も確認される

イーロン・マスク氏が設立したAI開発企業「xAI」が新たなAIモデル「Grok 4」を2025年7月10日(木)に発表しました。xAIやマスク氏はGrok 4を「世界最強AIモデル」とアピールしており、独立機関による性能テストでも最高峰の性...
GIGAZINE

AI搭載ウェブブラウザ「Comet」をPerplexityがリリース、AIでメールやGitHubを自動操作&音声で対話しながらの指示も可能で合言葉は「思考の速度でブラウジング」

AI検索サービスを展開するPerplexityがAI搭載ウェブブラウザ「Comet」を2025年7月10日(木)にリリースしました。ユーザーはCometにテキストや音声で指示して「メールを送信する」「コードを書く」といった作業を実行可能。P...
GIGAZINE

MicrosoftのAIツールは医師の診断精度20%に対して80%の精度で病気を診断できる

Microsoftは、複雑な医療診断において人間の意思よりも優れたパフォーマンスを発揮する「医療におけるスーパーインテリジェンス」を切り開く人工知能システム「Microsoft AI Diagnostic Orchestrator(MAI-...
GIGAZINE

カンニングとチートで面接や営業など9つの業界を破壊するAIツール「Cluely」が本当にリリースされる

「なんでもチートする」ためのAIツールと宣伝されている「Cluely」が、ついにリリースされました。Cluelyはベンチャーキャピタルのアンドリーセン・ホロウィッツからシリーズAラウンドで1500万ドル(約21億5900万円)の資金調達に成...
GIGAZINE

「CAPTCHAを突破してしまうAI」を正確に検出するために必要なアプローチとは?

ボットによるオンラインサービスへのアクセスを防ぐための認証システムがCAPTCHAですが、高度なAIの登場により、ボットと人間を区別するためのCAPTCHAがAIに突破される事例が複数登場しています。そんなAIによるCAPTCHAの突破を防...
GIGAZINE

MicrosoftがCopilot+ PC向け小規模言語モデル「Mu」の詳細を発表、自然言語で話しかけるとWindowsの設定を変更できるAIエージェントに応用

Microsoftが2025年6月23日、小規模言語モデル(SLM)「Mu」の詳細を発表しました。Muは、PCなどのデバイス上で直接効率的に動作するように設計されており、複雑な推論を必要とするような状況に対応したモデルで、特にWindows...
GIGAZINE

講演「ソフトウェアは再び変化している」が海外で大反響、その衝撃的な内容とは?

サム・アルトマン氏らと共にOpenAIを共同設立し、テスラに自動運転の技術開発で貢献したアンドレイ・カーパシー氏がサンフランシスコのAIスタートアップスクールで講演を行いました。この中で、過去70年間にわたるソフトウェアの変化や、急速に発展...
GIGAZINE

Appleの新しい文字起こしAPI「SpeechAnalyzer」がスピードテストでOpenAIのWhisperを圧倒

Appleの年次開発者カンファレンス「WWDC25」で発表されたiOS 26やmacOS Tahoeには、Appleの新しい音声テキスト変換API「SpeechAnalyzer」が導入されています。Apple関連のニュースサイト・MacSt...
GIGAZINE

世界最長のコンテキストウィンドウ100万トークン入力・8万トークン出力対応にもかかわらずたった7800万円でトレーニングされたAIモデル「MiniMax-M1」がオープンソースで公開され誰でもダウンロード可能に

中国の上海に拠点を置くAI企業のMiniMaxが、最新の大規模言語モデル(LLM)である「MiniMax-M1」をオープンソース化すると発表しました。MiniMax-M1は世界最長のコンテキストウィンドウである「100万トークン入力」「8万...
GIGAZINE

LLMの仕組みとは?

ChatGPTやGeminiなど、ユーザーが気軽に使えるチャットボットはすべて「LLM(大規模言語モデル)」という技術に基づいて構築されています。とても滑らかで自然な文章を生成することができるLLMが実際にはどのように動いているのかについて...
GIGAZINE

TelegramがxAIから440億円を受け取りGrokを統合すると発表、イーロン・マスクは「契約は成立していない」と主張

多機能でセキュリティの高さを売りとしているメッセージジングアプリのTelegramが、イーロン・マスク氏のAI企業であるxAIとのパートナーシップを発表しました。このパートナーシップにより、TelegramアプリにxAIのチャットボットであ...
スポンサーリンク
通知を有効にしますか? OK! No...