分类: experiments

18 篇文章

penalty_coeffs.py
这段代码实现了一个基于 惩罚系数(Penalty Coefficients)扫描 的实验,用于测试不同惩罚系数对强化学习算法(如 PPO)在 GreenLight 温室环境 中性能的影响。以下是代码的详细解释:1. 代码结构代码主要由以下几个部分组成:参数解析:使用 ArgumentParser 解析命令行参数(如环境 ID、配置名称、惩罚系数范围…
omega_pen_sweep.py
这段代码实现了一个基于 Omega 参数扫描 的实验,用于测试不同 Omega 值对强化学习算法(如 PPO)在 GreenLight 温室环境 中性能的影响。以下是代码的详细解释:1. 代码结构代码主要由以下几个部分组成:参数解析:使用 ArgumentParser 解析命令行参数(如环境 ID、配置名称、Omega 范围等)。参数加载:加载环境…
model_dynamics.py
这段代码实现了一个用于测试 GreenLight 温室环境 中不同控制策略效果的实验。它通过加载环境参数和选项,运行温室环境模拟,并可视化实验结果。以下是代码的详细解释:1. 代码结构代码主要由以下几个部分组成:参数解析:使用 ArgumentParser 解析命令行参数(如起始日期)。环境初始化:加载环境参数并初始化温室环境。控制策略实验:运行不…
matlab_controls.py
这段代码实现了一个用于运行 GreenLight 温室环境 并应用指定控制信号的实验。它通过加载 MATLAB 生成的控制信号和气象数据,运行温室环境模拟,并记录实验结果。以下是代码的详细解释:1. 代码结构代码主要由以下几个部分组成:参数解析:使用 ArgumentParser 解析命令行参数(如环境 ID、时间步长、日期、求解器等)。环境初始化…
k_decay.py
这段代码实现了一个基于 k 因子(k-factor) 的实验,用于测试不同 k 因子对强化学习算法(如 PPO)在 GreenLight 温室环境 中性能的影响。以下是代码的详细解释:1. 代码结构代码主要由以下几个部分组成:参数解析:使用 ArgumentParser 解析命令行参数(如环境 ID、项目名称、k 因子范围等)。参数加载:使用 lo…
gamma_sweep.py
这段代码实现了一个参数扫描实验,用于测试不同参数(如 gamma)对强化学习算法(如 PPO)在 GreenLight 温室环境 中性能的影响。以下是代码的详细解释:1. 代码结构代码主要由以下几个部分组成:参数解析:使用 ArgumentParser 解析命令行参数(如环境 ID、配置名称、参数范围等)。参数加载:加载环境参数(env_base_…
continue_training.py
这段代码实现了一个基于 PPO(Proximal Policy Optimization) 算法的强化学习训练过程,用于优化 GreenLight 温室环境 的控制策略。代码的主要功能包括加载环境参数、初始化环境和模型、设置回调函数、加载预训练模型并继续训练。以下是代码的详细解释:1. 代码结构代码主要由以下几个部分组成:参数加载:加载环境参数(e…
benchmark_rule_based.py
这段代码实现了一个基于规则控制器的温室环境模拟实验。它通过加载环境参数、初始化温室环境、运行规则控制器,并记录实验结果(如状态、控制信号、奖励、利润、违规次数等)。以下是代码的详细解释:1. 代码结构代码主要由以下几个部分组成:run_rule_based_controller 函数:运行规则控制器,模拟温室环境的一个 episode。记录温室状态…