NextAI 海外で話題の最新AIニュース

タグ一覧に戻る

視覚言語モデル

記事数: 3 件

MITが挑む画像からロボ計画を作るAI

その他 2026年3月11日

MITが挑む画像からロボ計画を作るAI

MITの新AIプランナーは視覚言語モデルで画像を理解し行動候補を生成、別モデルがそれをプログラム言語に翻訳して実行可能な計画に仕上げる技術で、報告では従来法の約2倍の効果が示されており、デモ公開が期待されています。

MIT 視覚言語モデルロボティクス長期計画生成

続きを読む

研究室のAI安全：過信が招く課題と今できる対策

LLM 2026年1月20日

研究室のAI安全：過信が招く課題と今できる対策

最新の検証は、研究室でのAI活用を安全に進めるために、教育や訓練、監督体制の強化と検証プロセスの標準化が効果的であることを示しています。現場での段階的な対策が安全性と利便性の両立につながります。

大規模言語モデル視覚言語モデル AI安全検証プロセス人間の監督

続きを読む

GLM-4.6V公開、106Bと9Bの実力

LLM 2025年12月9日

GLM-4.6V公開、106Bと9Bの実力

Zhipu AIのGLM-4.6Vは106Bと9Bの二サイズを揃えたオープンソースの視覚言語モデルで、128,000トークン対応やネイティブなツール呼び出し、MITライセンス公開により企業導入の選択肢を広げます。

GLM-4.6V 視覚言語モデル企業導入

続きを読む