MITが挑む画像からロボ計画を作るAI
MITの新AIプランナーは視覚言語モデルで画像を理解し行動候補を生成、別モデルがそれをプログラム言語に翻訳して実行可能な計画に仕上げる技術で、報告では従来法の約2倍の効果が示されており、デモ公開が期待されています。
続きを読むMITの新AIプランナーは視覚言語モデルで画像を理解し行動候補を生成、別モデルがそれをプログラム言語に翻訳して実行可能な計画に仕上げる技術で、報告では従来法の約2倍の効果が示されており、デモ公開が期待されています。
続きを読む最新の検証は、研究室でのAI活用を安全に進めるために、教育や訓練、監督体制の強化と検証プロセスの標準化が効果的であることを示しています。現場での段階的な対策が安全性と利便性の両立につながります。
続きを読むZhipu AIのGLM-4.6Vは106Bと9Bの二サイズを揃えたオープンソースの視覚言語モデルで、128,000トークン対応やネイティブなツール呼び出し、MITライセンス公開により企業導入の選択肢を広げます。
続きを読む