POLIXIR REVIVE
1.1.1
  • 什么是REVIVE SDK
  • 安装REVIVE SDK

教程

  • 快速开始
  • 准备数据
  • 定义奖励函数
  • 训练模型
  • 使用训练完成的模型

任务示例

  • 使用REVIVE SDK控制摆杆的运动
  • 使用REVIVE SDK控制着陆器进行悬停
  • 使用REVIVE SDK控制冰箱温度
  • 使用REVIVE SDK进行工业机器控制
  • 使用 REVIVE SDK 控制 Mujoco-HalfCheetah 运动
  • 使用 revive_filter 算法控制 Mujoco-HalfCheetah 运动

高级工具

  • 引入外部变量
  • 引入专家函数
  • 多时间步节点拼接
  • 添加时间步索引作为节点输入
  • 冻结部分节点的网络参数
  • 异构决策流图加载
  • 引入空节点
  • 自定义节点的损失函数
  • 通过因果推理辅助构建决策流图
  • 自定义网络节点
  • 引入专家约束
  • 训练包含多个节点的控制策略
  • 多判别器功能
  • 神经网络干扰器

训练结果解读

  • 虚拟环境训练结果
  • 策略训练结果
  • 响应曲线
  • 模型动态交互功能
  • 数据特征关系分析可视化 [Beta]

核心 API

  • revive.server
  • revive.computation
  • revive.conf

其他

  • FAQ
  • Releases
POLIXIR REVIVE
  • Overview: module code

All modules for which code is available

  • revive.algo.policy.base
  • revive.algo.policy.ppo
  • revive.algo.policy.sac
  • revive.algo.venv.base
  • revive.algo.venv.bc
  • revive.algo.venv.revive
  • revive.algo.venv.revive_f
  • revive.algo.venv.revive_p
  • revive.algo.venv.revive_t
  • revive.algo.venv.template
  • revive.cli
  • revive.common.next_ts_policy_function
  • revive.common.next_ts_transition_function
  • revive.common.step_node_function
  • revive.computation.dists
  • revive.computation.funs_parser
  • revive.computation.graph
  • revive.computation.inference
  • revive.computation.inference_cn
  • revive.computation.modules
  • revive.computation.operators
  • revive.computation.utils
  • revive.data.batch
  • revive.data.dataset
  • revive.data.processor
  • revive.server
  • revive.server_cn
  • revive.utils.auth_utils
  • revive.utils.causal_discovery_utils
  • revive.utils.causal_graph
  • revive.utils.common_utils
  • revive.utils.license_utils
  • revive.utils.raysgd_utils
  • revive.utils.server_utils
  • revive.utils.sys_utils
  • revive.utils.tune_utils

© Copyright 2021-2025 Polixir Technologies Co., Ltd..

Built with Sphinx using a theme provided by Read the Docs.