技術 2026年3月15日 1024層で変わるRLエージェントの新挙動 The Decoderの報告によれば、自己教師あり学習で層を1024まで深めたRLエージェントが高機動な動作を示し、表現力向上の可能性と実用化に向けた検証の重要性が浮かび上がっています。 1024層RLエージェント 強化学習 計算資源 ベンチマーク 再現性 続きを読む