POLIXIR REVIVE
1.1.0
什么是REVIVE SDK
安装REVIVE SDK
教程
快速开始
准备数据
定义奖励函数
训练模型
使用训练完成的模型
任务示例
使用REVIVE SDK控制摆杆的运动
使用REVIVE SDK控制着陆器进行悬停
使用REVIVE SDK控制冰箱温度
使用REVIVE SDK进行工业机器控制
使用 REVIVE SDK 控制 Mujoco-HalfCheetah 运动
使用 revive_filter 算法控制 Mujoco-HalfCheetah 运动
高级工具
引入外部变量
引入专家函数
多时间步节点拼接
添加时间步索引作为节点输入
冻结部分节点的网络参数
异构决策流图加载
引入空节点
自定义节点的损失函数
通过因果推理辅助构建决策流图
自定义网络节点
引入专家约束
训练包含多个节点的控制策略
多判别器功能
神经网络干扰器
训练结果解读
虚拟环境训练结果
策略训练结果
响应曲线
模型动态交互功能
核心 API
revive.server
revive.computation
revive.conf
其他
FAQ
Releases
POLIXIR REVIVE
revive.common package
View page source
revive.common package
¶
Submodules
¶
revive.common.next_ts_policy_function module
¶
revive.common.next_ts_policy_function.
next_ts_placeholder_policy_function
(
data
:
Dict
[
str
,
Tensor
]
)
→
Tensor
[source]
¶
revive.common.next_ts_transition_function module
¶
revive.common.next_ts_transition_function.
next_ts_placeholder_transition_function
(
data
:
Dict
[
str
,
Tensor
]
)
→
Tensor
[source]
¶
revive.common.step_node_function module
¶
revive.common.step_node_function.
get_next_step_node
(
data
:
Dict
[
str
,
Tensor
]
)
→
Tensor
[source]
¶
Module contents
¶