连续吸引子网络和边界向量细胞(触须)与3个运动神经元结合,学习如何导航障碍物并朝向食物 没有反向传播。奖励调制学习与资格迹 源代码链接在评论中。