POLIXIR REVIVE
0.9.3
什么是REVIVE SDK
安装REVIVE SDK
教程
快速开始
准备数据
定义奖励函数
训练模型
使用训练完成的模型
任务示例
使用REVIVE SDK控制摆杆的运动
使用REVIVE SDK控制着陆器进行悬停
使用REVIVE SDK控制冰箱温度
使用REVIVE SDK进行工业机器控制
使用 REVIVE SDK 控制 Mujoco-HalfCheetah 运动
高级工具
引入外部变量
引入专家函数
多时间步节点拼接
添加时间步索引作为节点输入
冻结部分节点的网络参数
异构决策流图加载
引入空节点
自定义节点的损失函数
通过因果推理辅助构建决策流图
自定义网络节点
引入专家约束
训练包含多个节点的控制策略
多判别器功能
训练结果解读
虚拟环境训练结果
策略训练结果
响应曲线
核心 API
revive.server
revive.computation
revive.conf
其他
FAQ
Releases
POLIXIR REVIVE
»
revive.common package
View page source
revive.common package
¶
Submodules
¶
revive.common.next_ts_function module
¶
revive.common.step_node_function module
¶
revive.common.step_node_function.
get_next_step_node
(
data
:
Dict
[
str
,
Tensor
]
)
→
Tensor
[source]
¶
Module contents
¶