本文评估了CoT、MCTS增强和SFT三种方法在生成强化学习解释中的效果,发现MCTS显著提升大模型在复杂环境(如Lunar Lander)的解释质量,而SFT对中小模型更有效。通过LLMs作为评判者,验证了自动化评估框架与人工评估高度一致(Cohen's κ=0.77,Spearman ρ=0.88)。