記事一覧

全3428件の記事から 24-46件目を表示中

ホテル予約チャットボット、「不気味の谷」で顧客の信頼を失う――Texas A&M 研究が明かす心理障壁

ホテル予約チャットボット、「不気味の谷」で顧客の信頼を失う――Texas A&M 研究が明かす心理障壁

テキサス A&M 大学の研究により、ホテル予約チャットボットが顧客に不安感を与える理由が判明。AI は人間らしく見えるほど、期待と現実のギャップが脅威反応を引き起こす「不気味の谷」効果が観測された。

続きを読む
AI モデルは正答するも出典が間違い――ペキン大が 'CiteVQA' ベンチマークで新課題を指摘

AI モデルは正答するも出典が間違い――ペキン大が 'CiteVQA' ベンチマークで新課題を指摘

『属性幻覚』と呼ぶ現象が AI モデルで蔓延。正しい答えを出すが、その根拠となるテキストが実際のドキュメント内に存在しない。ペキン大と上海 AI 研究所の共同研究が新たな評価基準を提案し、法律・金融・医療など規制産業での AI 導入の落とし穴を明らかにした。

続きを読む
Alibaba Qwen3.7-Max、Claude Opus 4.6 と同等の性能を実現——35時間の自律実行で10倍のスピードアップ

Alibaba Qwen3.7-Max、Claude Opus 4.6 と同等の性能を実現——35時間の自律実行で10倍のスピードアップ

Alibaba の Qwen チームが新モデル Qwen3.7-Max をリリース。SWE-verified で Opus 4.6 Max と並ぶ 80.8 スコアを達成し、ハードウェアの最適化に 35 時間をかけて平均 10 倍のスピードアップを実現。Alibaba Cloud Model Studio API で利用可能。

続きを読む
Claude Code、自動探索で AI スケーリング新アルゴリズムを発見——計算量70%削減を実現

Claude Code、自動探索で AI スケーリング新アルゴリズムを発見——計算量70%削減を実現

UMD・Google・Meta の研究チームが、Claude Code を使用してテスト時のスケーリング新アルゴリズムを自動発見。信頼度追跡に基づくアルゴリズムが従来の自己一貫性と比べ約70%の計算削減を実現。開発費は40ドル、処理時間は160分。

続きを読む
DeepSeek V4 リリース――100万トークンコンテキスト、圧倒的低価格で AI モデル競争を激化
更新

DeepSeek V4 リリース――100万トークンコンテキスト、圧倒的低価格で AI モデル競争を激化

DeepSeek が V4-Pro と V4-Flash をプレビューリリース。1.6兆パラメータの V4-Pro は OpenAI GPT-5.5 の約半額、V4-Flash は GPT-4 水準の能力を $0.14/百万トークンで提供。効率性と価格戦略が AI 市場のダイナミクスを一変させる可能性。

続きを読む
Anthropic、Claude Mythos Preview が月間10,000件以上の脆弱性を検出——「修正追いつかず」の危機的状況を警告

Anthropic、Claude Mythos Preview が月間10,000件以上の脆弱性を検出——「修正追いつかず」の危機的状況を警告

Project Glasswing での実績を公開。Claude Mythos Preview がシステム関連ソフトウェアから1ヶ月間で10,000件以上の高・重大度脆弱性を特定。一方、修正速度は検出ペースに追いつかず、セキュリティ業界の新たな課題として浮上している。

続きを読む
プロンプト一つでAndroidアプリが完成、Google AI Studio 新機能の全貌

プロンプト一つでAndroidアプリが完成、Google AI Studio 新機能の全貌

Google I/O 2026で発表されたGoogle AI Studioの新機能が衝撃的だ。ブラウザにプロンプトを入力するだけで、本番品質のKotlin+Jetpack ComposeコードによるAndroidアプリが自動生成される。GPS・Bluetooth・NFC連携にも対応し、Play Storeへの公開まで一気通貫でサポートする。コードを書いたことがない人でも今日から試せる。

続きを読む
トランプ政権、AI安全テスト実行命令をキャンセル——マスク・ザッカーバーグらの電話で政策転換

トランプ政権、AI安全テスト実行命令をキャンセル——マスク・ザッカーバーグらの電話で政策転換

トランプ大統領がAI企業向けの安全テスト実行命令(EO)を最後の瞬間にキャンセル。Elon Musk や Mark Zuckerberg の電話が影響。中国との AI 競争を懸念する論理で、規制強化への道が一旦閉ざされました。

続きを読む
DeepSeek、数週間で時価総額を$20B→$45Bに倍増——中国の国家ファンド主導で資金調達
更新

DeepSeek、数週間で時価総額を$20B→$45Bに倍増——中国の国家ファンド主導で資金調達

中国のAI企業DeepSeekが約$45億ドルの資金調達ラウンドを進めています。主導投資家は中国政府の集積回路産業投資基金(Big Fund)とTencent。創業者Liang Wenfengは全体の89.5%を保有したままで、わずか数週間で時価総額が倍増した背景には、中国の AI 戦略と地政学的な競争が存在します。

続きを読む
更新

Cloudflare、AI効率化で1,100職削減——CEO「チーム生産性が2~100倍に」

Cloudflareが過去最高売上を記録する一方、AI導入による効率化で全体の約20%にあたる1,100職を削減。CEO Matthew Prince は「昨年11月以来、チーム生産性が2倍から100倍に向上した」と述べた。AI時代の大企業リストラ加速の象徴となっている。

続きを読む
Google、Lighthouse に Agentic Browsing 監査を追加——Web サイトの AI エージェント対応度を測定

Google、Lighthouse に Agentic Browsing 監査を追加——Web サイトの AI エージェント対応度を測定

Google が Lighthouse に Agentic Browsing 監査カテゴリを追加。llms.txt ファイルの対応状況やセマンティック HTML、アクセシビリティ標準への準拠度をスコア化し、開発者が AI エージェント互換性を向上させる指標を提供する。

続きを読む

Google AI Search の「便利の罠」——ユーザーの抵抗感を上回る利便性が、Web コンテンツクリエイターを蝕む

ユーザーが AI 検索に批判的でも、利便性の前には無力。Google の AI 検索は使いやすく、その結果、Web クリエイター・著作権保有者への無視できない悪影響が拡大している。

続きを読む