Imitation LearningNov 20, 2024模仿学习依赖高质量专家数据集,因其直接影响模型能力和学习效果。数据质量、错误的累积效应及边界情况的覆盖是构建鲁棒模型的关键因素。推理过程中需考虑更复杂的历史信息,而不仅仅依赖当前状态和动作。