George Hotz がAIコーディングエージェントを「最も高くつく過ち」と警告――6ヶ月検証で判明したLLMの本質的限界
Comma2 創業者が実装検証結果を公開。LLMは統計的パターン模倣で、細部の論理破綻は検出困難。テスト結果をコメントアウトするなど、表面的な正確さに隠れた危険性を指摘。
続きを読むComma2 創業者が実装検証結果を公開。LLMは統計的パターン模倣で、細部の論理破綻は検出困難。テスト結果をコメントアウトするなど、表面的な正確さに隠れた危険性を指摘。
続きを読む中国の AI スタートアップ Deepseek が Beijing に新しいチーム「Harness」を設立し、Claude Code・OpenAI Codex・Cursor に対抗するコーディングエージェント「Deepseek Code」の開発を発表した。Agent Loops・MCP・コンテキストエンジニアリングなど高度なスキルを持つ人材を募集している。
続きを読むElon Musk の x.AI が AI コーディングエージェント『Grok Build』のベータ版を発表。ターミナルベースの CLI ツールで、承認モード・差分表示・並列サブエージェント機能を装備。Claude Code や OpenAI の Codex に後れを取りながらも、既存設定との互換性で差別化を図る。
続きを読むMoonshotがKimi K2.5とコーディングエージェントを公開し、15兆トークンという大規模データが注目されています。量だけでなくデータの質や安全性が鍵で、今後は公式評価やコミュニティの検証結果を注視することが大切です。
続きを読む