POLIXIR REVIVE
1.1.1
什么是REVIVE SDK
安装REVIVE SDK
教程
快速开始
准备数据
定义奖励函数
训练模型
使用训练完成的模型
任务示例
使用REVIVE SDK控制摆杆的运动
使用REVIVE SDK控制着陆器进行悬停
使用REVIVE SDK控制冰箱温度
使用REVIVE SDK进行工业机器控制
使用 REVIVE SDK 控制 Mujoco-HalfCheetah 运动
使用 revive_filter 算法控制 Mujoco-HalfCheetah 运动
高级工具
引入外部变量
引入专家函数
多时间步节点拼接
添加时间步索引作为节点输入
冻结部分节点的网络参数
异构决策流图加载
引入空节点
自定义节点的损失函数
通过因果推理辅助构建决策流图
自定义网络节点
引入专家约束
训练包含多个节点的控制策略
多判别器功能
神经网络干扰器
训练结果解读
虚拟环境训练结果
策略训练结果
响应曲线
模型动态交互功能
数据特征关系分析可视化 [Beta]
核心 API
revive.server
revive.computation
revive.conf
其他
FAQ
Releases
POLIXIR REVIVE
revive.common package
View page source
revive.common package
¶
Submodules
¶
revive.common.next_ts_policy_function module
¶
revive.common.next_ts_policy_function.
next_ts_placeholder_policy_function
(
data
:
Dict
[
str
,
Tensor
]
)
→
Tensor
[source]
¶
revive.common.next_ts_transition_function module
¶
revive.common.next_ts_transition_function.
next_ts_placeholder_transition_function
(
data
:
Dict
[
str
,
Tensor
]
)
→
Tensor
[source]
¶
revive.common.step_node_function module
¶
revive.common.step_node_function.
get_next_step_node
(
data
:
Dict
[
str
,
Tensor
]
)
→
Tensor
[source]
¶
Module contents
¶