模型动态交互功能

为了更好地可视化模型各个节点之间的影响关系,REVIVE 提供了一种强大的动态交互功能,旨在帮助用户深入理解模型的行为和节点间的相互作用。用户可以通过类似 TensorBoard 的简单启动方式,在浏览器中通过 URL 进行直观的交互。

功能亮点

  1. 动态模型可视化: REVIVE 允许用户实时观察模型节点间的影响关系,便于快速识别和分析模型行为。

  2. 灵活的配置参数: - Rollout 长度:用户可以根据需要设置模拟的时间长度,从而观察不同时间范围内的动态变化。 - 每次 Rollout 的轨迹数量:系统支持用户在多个轨迹之间切换,方便进行对比分析。使用“上一张”和“下一张”按钮,可以轻松浏览不同的轨迹,快速捕捉重要信息。

  3. 因节点与果节点的定义: 用户可以自定义因节点(通常是可以控制的动作节点)和果节点(与控制目标相关的观测节点),通过对因节点的扰动来分析其对果节点的影响。这种设置使得用户能够更好地理解决策过程中的关键因素。

扰动类型及其应用

  • 加法和乘法扰动: REVIVE 支持多种扰动类型,包括加法扰动和乘法扰动。用户可以根据实验需求,自定义扰动值列表,灵活调整因节点的输入数据。

    通过将定义的扰动值加到或乘以原始因节点数据,用户可以在同一图表中清晰展示果节点在不同因节点扰动下的各维度变化。这种直观的展示方式有助于识别模型对不同输入条件的敏感性和响应模式。

使用示例

当使用REVIVE训练完成环境模型之后,进入环境模型所在的目录,例如: ~/logs/revive/venv_train/ 下,使用下面命令启动模型动态交互面板:

$ revive rollout

启动后,命令行会显示对应的URL,在浏览器中访问,即可打开模型动态交互面板。下图展示了一个任务的可视化面板。

../_images/model_dynamic_interaction.png

应用场景

  • 因果分析:通过对因节点的系统性扰动,用户可以分析模型节点之间的因果关系。

  • 决策支持:在复杂决策场景中,用户可以通过可视化工具快速评估不同决策动作对模型的潜在影响。

  • 时序影响分析:在具有时延特性的任务中,用户可以通过可视化工具在时间序列上分析因果关系的影响。

通过这些功能,REVIVE 不仅提升了可视化的效果,还极大地增强了用户的交互体验,使得模型分析变得更加直观和高效。