【资料图】
最近,微软亚洲研究院提出可以将LLM用于工业控制,而且仅需少量示例样本就能达成优于传统强化学习方法的效果。该研究尝试使用GPT-4来控制空气调节系统(HVAC),得到了相当积极的结果。
研究团队设计了一种机制来从专家演示和历史交互挑选示例,还设计了一种可将目标、指示、演示和当前状态转换为prompt的prompt生成器。然后,再使用生成的prompt,通过LLM来给出控制。