POLIXIR REVIVE
0.9.3
  • 什么是REVIVE SDK
  • 安装REVIVE SDK

教程

  • 快速开始
  • 准备数据
  • 定义奖励函数
  • 训练模型
  • 使用训练完成的模型

任务示例

  • 使用REVIVE SDK控制摆杆的运动
  • 使用REVIVE SDK控制着陆器进行悬停
  • 使用REVIVE SDK控制冰箱温度
  • 使用REVIVE SDK进行工业机器控制
  • 使用 REVIVE SDK 控制 Mujoco-HalfCheetah 运动

高级工具

  • 引入外部变量
  • 引入专家函数
  • 多时间步节点拼接
  • 添加时间步索引作为节点输入
  • 冻结部分节点的网络参数
  • 异构决策流图加载
  • 引入空节点
  • 自定义节点的损失函数
  • 通过因果推理辅助构建决策流图
  • 自定义网络节点
  • 引入专家约束
  • 训练包含多个节点的控制策略
  • 多判别器功能

训练结果解读

  • 虚拟环境训练结果
  • 策略训练结果
  • 响应曲线

核心 API

  • revive.server
  • revive.computation
  • revive.conf

其他

  • FAQ
  • Releases
POLIXIR REVIVE
  • »
  • Search


© Copyright 2021-2023 Polixir Technologies Co., Ltd..

Built with Sphinx using a theme provided by Read the Docs.