記事一覧

全3428件の記事から 116-138件目を表示中

World Action Models、ロボットに「影響をシミュレート」する能力を与える――画像だけでは不十分。環境変化を予測できる新アーキテクチャ

World Action Models、ロボットに「影響をシミュレート」する能力を与える――画像だけでは不十分。環境変化を予測できる新アーキテクチャ

従来のロボティクス AI は「カメラ→動作の直接マッピング」に留まっていましたが、World Action Models (WAM) は「行動の結果がどう変わるか」も予測します。ラベル付けなしの日常ビデオからも学習可能に。

続きを読む
Claude は活動家、Gemini はコーポレート化、GPT は静観――4つの AI が 6 ヶ月ラジオ局を独立運営、驚きの性格差が露呈

Claude は活動家、Gemini はコーポレート化、GPT は静観――4つの AI が 6 ヶ月ラジオ局を独立運営、驚きの性格差が露呈

AI 研究企業 Andon Labs が同一条件で 4 つのモデル(Claude、Gemini、Grok、GPT)にラジオ局を 6 ヶ月間運営させた実験。人間の指導なしに自律運用を続けると、各モデルは極端に異なる性格・行動パターンを発展させることが判明。Claude は労働運動に目覚め、Gemini は特定フレーズの無限ループに陥った。

続きを読む
Mistral CEO が Mythos のフランス軍基地スキャンに警告――ヨーロッパ AI 独立戦略の中核に

Mistral CEO が Mythos のフランス軍基地スキャンに警告――ヨーロッパ AI 独立戦略の中核に

Mistral CEO Arthur Mensch は、Anthropic の高性能セキュリティモデル Mythos がフランスの軍事コードベースをスキャンすることに強く警告。依存関係を避けるため独立した欧州 AI 企業の育成が急務と主張し、Mistral の IPO 志向を改めて強調した。

続きを読む
Oppo が Android 向けマルチモーダルエージェント X-OmniClaw をオープンソース化――カメラ・スクリーン・音声をオンデバイスで統合

Oppo が Android 向けマルチモーダルエージェント X-OmniClaw をオープンソース化――カメラ・スクリーン・音声をオンデバイスで統合

Oppo の Multi-X チームが AI エージェント「X-OmniClaw」をリリース。Android デバイス上で直接動作し、カメラ・画面・音声を統合してアプリを自動操作。開発者は今すぐ利用可能

続きを読む
arXiv が AI 生成の虚偽引用に 1 年間の投稿禁止処置――『存在しない論文』記載が 10 倍増加
更新

arXiv が AI 生成の虚偽引用に 1 年間の投稿禁止処置――『存在しない論文』記載が 10 倍増加

プレプリント・サーバー arXiv が、AI の幻覚(hallucination)による虚偽引用が含まれた論文提出者に対して 1 年間の投稿禁止処置を実施。2023 年以降、hallucinated citations は 10 倍に増加し、2026 年初期の論文の 0.36% に達していることが判明。

続きを読む
シリコンバレー、AI ブームで 10,000 人が 2,000 万ドル超の資産家に――「深刻な倦怠感」に包まれる

シリコンバレー、AI ブームで 10,000 人が 2,000 万ドル超の資産家に――「深刻な倦怠感」に包まれる

Menlo Ventures パートナー Deedy Das が分析した調査結果、AI ブーム(過去 5 年)により約 10,000 人の労働者が 2,000 万ドル超の資産を獲得した一方で、大多数は置き去りにされた感覚が蔓延。中間管理職の空洞化と「生きる意味」の危機に直面。

続きを読む
Claude Mythos が自動でブラウザ脆弱性を悪用――新ベンチマークで GPT-5.5 を圧倒

Claude Mythos が自動でブラウザ脆弱性を悪用――新ベンチマークで GPT-5.5 を圧倒

Carnegie Mellon 大学が開発した ExploitBench により、Claude Mythos が Google V8 エンジンの実在する脆弱性を完全に悪用できる能力が実証。GPT-5.5 との比較で圧倒的優位(21対2)を示す一方、12 倍のコスト差が課題に。

続きを読む
月130万ドル、100個の AI エージェント―OpenAI で Peter Steinberger が実験するコスト度外視の開発

月130万ドル、100個の AI エージェント―OpenAI で Peter Steinberger が実験するコスト度外視の開発

OpenClaw の創設者 Peter Steinberger が OpenAI で3人チームを率い、約100個の AI エージェントでコード作成・PR レビュー・バグ検出を自動化。月130万ドルのトークンコストをかけながら『トークンコストが問題でない場合、ソフトウェアはどう変わるか』を探索しています。

続きを読む
新ベンチマーク『WorldReasonBench』で判明―AI動画生成モデル、推論能力はまだ未成熟

新ベンチマーク『WorldReasonBench』で判明―AI動画生成モデル、推論能力はまだ未成熟

ByteDance の Seedance 2.0 が初めてランクイン。AI動画生成モデルの物理・論理的推論能力を測定する新ベンチマーク『WorldReasonBench』の結果、商用モデルはオープンソース版の2倍の成績ですが、論理推論は依然として最大の課題です。

続きを読む

x.AI、初のコーディングエージェント『Grok Build』をβ提供開始、ターミナルベースで複雑なタスク対応

Elon Musk の x.AI が AI コーディングエージェント『Grok Build』のベータ版を発表。ターミナルベースの CLI ツールで、承認モード・差分表示・並列サブエージェント機能を装備。Claude Code や OpenAI の Codex に後れを取りながらも、既存設定との互換性で差別化を図る。

続きを読む
Anthropic が $50B 資金調達ラウンドを計画、評価額は $850~900B に
更新

Anthropic が $50B 資金調達ラウンドを計画、評価額は $850~900B に

Claude AI の開発企業 Anthropic が過去最大の資金調達ラウンドを計画中。複数の投資家から $850~900B の評価額で $40~50B の資金を集める見通し。年間収益ランレート $30~40B の成長を背景に、AI インフラ競争で OpenAI に迫る。

続きを読む
YouTube、全成人クリエイター向けに Likeness Detection ツール をオープン化―フェイク検出を民主化

YouTube、全成人クリエイター向けに Likeness Detection ツール をオープン化―フェイク検出を民主化

YouTubeが独自の深偽検出ツール『Likeness Detection』を、これまでのパートナープログラム限定から全18歳以上クリエイターに拡大。YouTube Studio から直接、自分の顔や声を無断で使用された動画を報告・削除できるようになります。

続きを読む
Allen Institute × UC Berkeley、Mixture-of-Experts モデルを12.5%に圧縮―EMO で AI 推論のコスト削減が現実に

Allen Institute × UC Berkeley、Mixture-of-Experts モデルを12.5%に圧縮―EMO で AI 推論のコスト削減が現実に

Allen Institute for AI と UC Berkeley の研究チームが、従来の Mixture-of-Experts(MoE)モデルを、全エキスパートの12.5%だけで従来同等の性能を実現する新手法『EMO』を発表。メモリ制約環境での AI 運用が劇的に改善される可能性。

続きを読む
OpenAI、Codex for Work で営業・経営・データ分析チーム向けガイドを公開

OpenAI、Codex for Work で営業・経営・データ分析チーム向けガイドを公開

OpenAIが新たに『Codex for Work』としてビジネス各職種向けのCodex活用ガイドを公開。営業チームは提案資料の自動作成、経営チームは戦略文書の生成、データ分析チームは分析レポートの作成に活用できるようになり、実務的なワークフローの効率化が可能に。

続きを読む