涞水县建设局网站,教育类网站配色,网站建设部工作职能,做兼职的网站有哪些工作内容本文是LLM系列的文章#xff0c;针对《Tree of Thoughts: Deliberate Problem Solving with Large Language Models》的翻译。 思维树#xff1a;用大模型进行深思熟虑的问题解决 摘要1 引言2 背景3 思维树#xff1a;用LM进行深思熟虑的问题解决4 实验5 相关工作6 讨论 摘…本文是LLM系列的文章针对《Tree of Thoughts: Deliberate Problem Solving with Large Language Models》的翻译。 思维树用大模型进行深思熟虑的问题解决 摘要1 引言2 背景3 思维树用LM进行深思熟虑的问题解决4 实验5 相关工作6 讨论 摘要
语言模型越来越多地被部署用于解决各种任务中的一般问题但在推理过程中仍然局限于token级别的从左到右的决策过程。这意味着他们可能无法完成需要探索、战略前瞻或初始决策发挥关键作用的任务。为了克服这些挑战我们引入了一种新的语言模型推理框架“思维树”ToT它概括了流行的“思维链”方法来提示语言模型并能够探索连贯的文本单元“思维”作为解决问题的中间步骤。ToT允许LMs通过考虑多个不同的推理路径和自我评估选择来进行深思熟虑的决策以决定下一步行动并在必要时前瞻或回溯以做出全局选择。我们的实验表明ToT显著提高了语言模型在三项需要非琐碎计划或搜索的新任务上的解决问题能力24小时游戏、创意写作和迷你交叉词。例如在《24小时游戏》中具有思维链提示的GPT-4只解决了4%的任务而我们的方法的成功率为74%。带有所有提示的代码库https://github.com/ysymyth/tree-of-thought-llm.
1 引言
2 背景
3 思维树用LM进行深思熟虑的问题解决
4 实验
5 相关工作
6 讨论
限制和未来方向。对于GPT-4已经擅长的许多现有任务来说像ToT这样的深思熟虑的搜索可能不是必要的作为最初的一步这项工作只探索了三个相对简单的任务这些任务挑战了GPT-4并呼吁将更好的搜索和规划能力与LMs结合起来。然而随着我们开始为更多现实世界的决策应用如编码、数据分析、机器人等部署LM可能会出现更复杂的任务并为研究这些研究问题提供新的机会。此外像ToT这样的搜索方法需要比采样方法更多的资源例如GPT-4 API成本来提高任务性能但ToT的模块化灵活性允许用户定制这种性能成本权衡正在进行的开源努力在不久的将来应该很容易降低这种成本。最后这项工作的重点是使用现成的LM使用ToT风格的高级反事实决策对LM进行微调例如考虑下一段的潜在选择而不是预测下一个token可能会为提高LM的解决问题能力提供机会。 更广泛的影响。ToT是一个使LMs能够更自主、更智能地做出决策和解决问题的框架。虽然目前的任务仅限于推理和搜索问题但未来涉及与外部环境或人类互动的应用可能会带来潜在的危险例如促进LMs的有害使用。另一方面ToT还提高了模型决策的可解释性和人类对齐的机会因为生成的表示是可读的、高级语言推理而不是隐式的、低级的token值。 结论。LMs的关联“系统1”可以通过基于搜索问题解决方案的可能路径树的“系统2”进行有益的扩展。思维树框架提供了一种将关于解决问题的经典见解转化为当代LMs可操作方法的方法。同时LM解决了这些经典方法的弱点提供了一种解决不容易形式化的复杂问题的方法例如创造性写作。我们认为LMs与人工智能经典方法的交叉是未来工作的一个令人兴奋的方向。