ソフトウェア, 動画,

スポンサーリンク
GIGAZINE

AGIを実現するために必須の能力は何なのか?そもそも知能とは何か?

AIの技術は急速に進歩していますが、何でもできる汎用人工知能(AGI)はまだ登場していません。Googleの元研究員でAIの研究を先導してきたフランソワ・ショレ氏は、2025年6月に開催された「AI Startup School」でAGIの...
GIGAZINE

Anthropicが投資家向けの「Claude for Financial Services」をリリース、データプラットフォームや業界プロバイダーと統合し包括的な金融情報にリアルタイムでアクセス可能

Anthropicが機関投資家向けAIの「Claude for Financial Services」をリリースしました。金融データプラットフォームや金融テクノロジープラットフォームを統合し、さまざまな金融情報にリアルタイムでアクセスするこ...
GIGAZINE

日本語の完璧なあいづちまで実現した音声対話AIモデル「J-Moshi」を名古屋大学の研究者が発表

名古屋大学大学院情報学研究科の研究チームが、日本語全二重(Full-duplex)音声対話システム「J-Moshi」を発表しました。J-Moshiは近年注目を集めている同時双方向的な音声対話システムを、日本語でも実現するという点で画期的であ...
GIGAZINE

ついに「Grok 4」が登場、OpenAIなどの推論モデルを超える性能で「世界最強AIモデル」とアピールするも「イーロン・マスクの発言を参考にしまくる」という挙動も確認される

イーロン・マスク氏が設立したAI開発企業「xAI」が新たなAIモデル「Grok 4」を2025年7月10日(木)に発表しました。xAIやマスク氏はGrok 4を「世界最強AIモデル」とアピールしており、独立機関による性能テストでも最高峰の性...
GIGAZINE

AI搭載ウェブブラウザ「Comet」をPerplexityがリリース、AIでメールやGitHubを自動操作&音声で対話しながらの指示も可能で合言葉は「思考の速度でブラウジング」

AI検索サービスを展開するPerplexityがAI搭載ウェブブラウザ「Comet」を2025年7月10日(木)にリリースしました。ユーザーはCometにテキストや音声で指示して「メールを送信する」「コードを書く」といった作業を実行可能。P...
GIGAZINE

MicrosoftのAIツールは医師の診断精度20%に対して80%の精度で病気を診断できる

Microsoftは、複雑な医療診断において人間の意思よりも優れたパフォーマンスを発揮する「医療におけるスーパーインテリジェンス」を切り開く人工知能システム「Microsoft AI Diagnostic Orchestrator(MAI-...
GIGAZINE

カンニングとチートで面接や営業など9つの業界を破壊するAIツール「Cluely」が本当にリリースされる

「なんでもチートする」ためのAIツールと宣伝されている「Cluely」が、ついにリリースされました。Cluelyはベンチャーキャピタルのアンドリーセン・ホロウィッツからシリーズAラウンドで1500万ドル(約21億5900万円)の資金調達に成...
GIGAZINE

「CAPTCHAを突破してしまうAI」を正確に検出するために必要なアプローチとは?

ボットによるオンラインサービスへのアクセスを防ぐための認証システムがCAPTCHAですが、高度なAIの登場により、ボットと人間を区別するためのCAPTCHAがAIに突破される事例が複数登場しています。そんなAIによるCAPTCHAの突破を防...
GIGAZINE

MicrosoftがCopilot+ PC向け小規模言語モデル「Mu」の詳細を発表、自然言語で話しかけるとWindowsの設定を変更できるAIエージェントに応用

Microsoftが2025年6月23日、小規模言語モデル(SLM)「Mu」の詳細を発表しました。Muは、PCなどのデバイス上で直接効率的に動作するように設計されており、複雑な推論を必要とするような状況に対応したモデルで、特にWindows...
GIGAZINE

講演「ソフトウェアは再び変化している」が海外で大反響、その衝撃的な内容とは?

サム・アルトマン氏らと共にOpenAIを共同設立し、テスラに自動運転の技術開発で貢献したアンドレイ・カーパシー氏がサンフランシスコのAIスタートアップスクールで講演を行いました。この中で、過去70年間にわたるソフトウェアの変化や、急速に発展...
GIGAZINE

Appleの新しい文字起こしAPI「SpeechAnalyzer」がスピードテストでOpenAIのWhisperを圧倒

Appleの年次開発者カンファレンス「WWDC25」で発表されたiOS 26やmacOS Tahoeには、Appleの新しい音声テキスト変換API「SpeechAnalyzer」が導入されています。Apple関連のニュースサイト・MacSt...
GIGAZINE

世界最長のコンテキストウィンドウ100万トークン入力・8万トークン出力対応にもかかわらずたった7800万円でトレーニングされたAIモデル「MiniMax-M1」がオープンソースで公開され誰でもダウンロード可能に

中国の上海に拠点を置くAI企業のMiniMaxが、最新の大規模言語モデル(LLM)である「MiniMax-M1」をオープンソース化すると発表しました。MiniMax-M1は世界最長のコンテキストウィンドウである「100万トークン入力」「8万...
GIGAZINE

LLMの仕組みとは?

ChatGPTやGeminiなど、ユーザーが気軽に使えるチャットボットはすべて「LLM(大規模言語モデル)」という技術に基づいて構築されています。とても滑らかで自然な文章を生成することができるLLMが実際にはどのように動いているのかについて...
GIGAZINE

TelegramがxAIから440億円を受け取りGrokを統合すると発表、イーロン・マスクは「契約は成立していない」と主張

多機能でセキュリティの高さを売りとしているメッセージジングアプリのTelegramが、イーロン・マスク氏のAI企業であるxAIとのパートナーシップを発表しました。このパートナーシップにより、TelegramアプリにxAIのチャットボットであ...
GIGAZINE

Anthropicが「Claude 4」ファミリーの2モデルをリリース、コーディング性能と推論能力が前世代から強化

Anthropicが2025年5月22日に開催された自社の開発者向けイベント「Code with Claude」にて、次世代AIモデルである「Claude 4」ファミリーの一部、Claude Opus 4とClaude Sonnet 4を発...
GIGAZINE

コンテンツの制作にGoogleのAIが使われた否かを見分けられる「SynthID Detector」が登場

Googleが、GoogleのAIで生成されたコンテンツを迅速かつ効率的に識別するための検証ポータル「SynthID Detector」を発表しました。続きを読む......
GIGAZINE

Google DeepMindが爆速でテキストを生成する拡散モデル「Gemini Diffusion」を発表

Googleが、1秒間に1479トークンを処理できる拡散モデル「Gemini Diffusion」を発表しました。「これまでで最も速いモデル」よりも高速にコンテンツを生成するとのことです。続きを読む......
GIGAZINE

Googleが動画生成AI「Veo 3」を発表、4K出力可能で音声も同時に生成できる

Googleが動画生成モデルの「Veo 3」を発表しました。最大4Kまでの解像度の動画を作成できる過去モデル「Veo 2」の品質を向上させただけでなく、Googleの動画生成AIとして初めて「音声付き」の動画生成が実現しています。続きを読む...
GIGAZINE

AIが就職の面接をして不具合を起こす動画が話題に

候補者の選別、メールの送信から作成までさまざまな処理を自動で行う「AIエージェント」が普及したことで、採用プロセスにAIを使う企業が増えています。ある企業は就職面接担当者としてAIを使用したのですが、不具合を起こしてしまい、候補者にその様子...
GIGAZINE

テキストから物理的に安定したレゴブロックの構造物を生成するモデル「LegoGPT」とデータセット「StableText2Lego」が公開中

ユーザーが入力したテキストプロンプトからレゴで組み立てた構造物を生成できる「LegoGPT」を、カーネギーメロン大学の研究チームが発表しました。また、研究チームは4万7000件を超えるレゴ構造物と2万8000件以上のユニークな3Dオブジェク...
スポンサーリンク
通知を有効にしますか? OK! No...