当前位置: 首页 > news >正文

网站建设需要岗位wordpress 博客同步

网站建设需要岗位,wordpress 博客同步,使用他人api做网站,钟表网站开发背景文章LLM 洪流滚滚#xff0c;AI 浪潮席卷全球#xff0c;在这不断冲击行业认知的一年中#xff0c;Agent 以冉冉新星之态引起开发者侧目。OpenAI 科学家 Andrej Karpathy 曾言“OpenAI 在大模型领域快人一步#xff0c;但在 Agent 领域#xff0c;却是和大家处在同一起跑线上。… LLM 洪流滚滚AI 浪潮席卷全球在这不断冲击行业认知的一年中Agent 以冉冉新星之态引起开发者侧目。OpenAI 科学家 Andrej Karpathy 曾言“OpenAI 在大模型领域快人一步但在 Agent 领域却是和大家处在同一起跑线上。” 在此背景下AI 从业者坚信基于 LLM 的 Agent 会是一个崭新并且充满着机会的蓝海领域。 那么究竟什么是 Agent它的框架工作方式是什么现阶段存在哪些问题未来有着怎样的可能性本文将分享一些思考。 01.什么是 Agent 根据 OpenAI 科学家 Lilian Weng 的一张 Agent 示意图 [1] 我们可以了解 Agent 由一些组件来组成。 规划模块 子目标分解Agent 将目标分为更小的、易于管理的子目标从而更高效地处理复杂的任务。 反省和调整Agent 可以对过去的行为进行自我批评和自我反思从错误中吸取教训并针对未来的步骤进行完善从而提高最终结果的质量。 记忆模块 短期记忆在这里通常是指 in-context learning即利用提示工程来让模型进行一定的学习。 长期记忆这为 Agent 提供了长时间保留和召回信息的能力通常是通过利用外部向量存储和快速检索。 工具使用模块 代理学习调用外部 API 来获取模型权重中缺失的额外信息通常在预训练后很难更改包括当前信息、代码执行能力、对专有信息源的访问等。 所以当 Agent 接收到一个处理复杂任务的目标时它会首先进行任务的拆解并去执行子任务每次大模型调用之间通过短期记忆连接使得大模型能理解当前任务处理的状态。接下来 Agent 需要根据任务的状态来获取能够帮助模型处理任务的信息这些信息可以是历史信息以及与任务有关的额外信息。 由于大模型拥有一定的认知能力所以在无法精准定义所需信息的情况下我们可以将与当前状态有相关性的信息组织起来让大模型自主地去摘取它需要的内容。所以比起基于关键字精准的匹配的搜索方法向量数据库所拥有的根据语义相关性的模糊搜索在这一点上受到了 Agent 框架的广泛青睐。通过将长期记忆存放在一个数据库向量数据库或传统数据库并且在执行过程中根据需要进行检索模型能够在任务的执行中获取执行经验以及认识到总体的状态。 02.Agent 框架工作方式 我们以 AutoGPT 为例看看一个 Agent 框架具体是如何工作的 AutoGPT[2] 使用 GPT-4 来生成任务、确定优先级并执行任务同时使用插件进行互联网浏览和其他访问。AutoGPT 使用外部记忆来跟踪它正在做什么并提供上下文使其能够评估其情况生成新任务或自我纠正并将新任务添加到队列中然后对其进行优先级排序。 另一个著名的项目 babyagi[3] 也是采取类似工作的方式。Agent 与一般的 LLM 最大的不同点在于LLM Agent 通常根据任务的总体目标来去指定以及编排子目标而 LLM 通常是作为一个被调用的工具在一个工作流中担任一个具体任务的执行者。 03.LLM Agent 现阶段出现的问题 由于一些 LLMGPT-4带来了惊人的自然语言理解和生成能力并且能处理非常复杂的任务一度让 LLM Agent 成为满足人们对科幻电影所有憧憬的最终答案。但是在实际使用过程中大家逐渐发现了通往通用人工智能的道路并不是一蹴而就的目前 Agent 很容易在一些情况下失败 Agent 会在处理某一个任务上陷入一个循环 prompt 越来越长最终甚至超出最大内容长度 记忆模块的策略没有给 LLM 某些关键的信息而导致执行失败 LLM 由于幻觉问题错误使用工具或者让事情半途而废 上述问题随着大家对于 Agent 的了解开始浮出水面这些问题一部分需要 LLM 自身来解决另一部分也需要 Agent 框架来进行解决通用的 Agent 仍需进一步打磨。 04.Agent 的展望 目前LLM Agent 大多是处于实验和概念验证的阶段持续提升 Agent 的能力才能让它真正从科幻走向现实。当然我们也可以看到围绕 LLM Agent 的生态也已经开始逐渐丰富大部分工作都可以归类到以下三个方面进行探索 Agent模型 AgentBench[4] 指出了不同的 LLM 对于 Agent 的处理能力有很大区别当前的 gpt-40613版本以极大的优势领先于同类竞品LLM 本身的逻辑推理能力以及更长的 prompt 处理能力都会是 Agent 中极其重要的因素。 sToolLLM[5] 则使用轻量级的 LLaMA 向更加复杂的大模型学习理解 API 和使用 API 的能力希望能够将这种能力运用在更轻量的模型上。 Agent 框架 由 Lilian Weng 列出来的每一个组件都有探索的空间目前学术探索较多的是利用框架提升 LLM 推理的能力从 COT[6]、ReAct[7]、Reflexion[8] 等一系列方法都是在不改变大模型的方法下利用 prompt 去提升大模型的理性。关于记忆和搜索目前普遍是将内容存储在数据库和搜索引擎中Refexion 认为可以将执行过程中的观察以轨迹的形式存储在短期记忆中而将接受反馈后的评估和自我反省总结的经验放在长期记忆中。在其他方向AutoGen[9] 也在探索多智能体之间的通信与协作。 Agent 应用 实现真正意义上的 Agent 道阻且长因为现实世界具有太多不确定性。在特定、具体的可控环境下Agent 便可以如工厂中实现一道道供需的机器人一般针对更多的场景特点进行针对性的设计从而更好的去完成一些特定的任务达到预期的效果。 MetaGPT[10] 是一个针对软件开发场景的 Agent针对这一具体场景设计了各种具有不同技能的角色协作完成这一任务。Voyager[11] 是一个可以在 Minecraft 中可以进行自主探索、学习技能并且会合成道具的 Agent。VoxPoser 结合了 RGB-D 信息以及 LLM 的推理能力后可以完成更多复杂的机器人抓取操作。当下Agent 尚不能做到完全可靠针对更多场景的设计可以保障 Agent 不会在大部分简单场景下失败。 我们置身于一个充满无限可能性的时刻人工智能的进步将继续塑造我们的未来而 LLM Agent 无疑是这一演进过程中的亮点之一。人们探索人工智能最终还是希望能够让人工智帮助人类完成自己无法做到的复杂任务而 Agent 恰恰是从自动化走向智能化的一个关键的里程碑…… 参考链接 [1]https://lilianweng.github.io/ [2]https://github.com/Significant-Gravitas/Auto-GPT [3]https://github.com/yoheinakajima/babyagi [4]https://arxiv.org/abs/2308.03688 [5]https://arxiv.org/abs/2307.16789 [6]https://arxiv.org/abs/2201.11903 [7]https://arxiv.org/abs/2210.03629 [8]https://arxiv.org/abs/2303.11366 [9]https://arxiv.org/abs/2308.08155 [10]https://arxiv.org/abs/2308.00352 [11]https://arxiv.org/abs/2305.16291 [12]https://arxiv.org/abs/2307.05973 本文由 mdnice 多平台发布
http://www.w-s-a.com/news/423496/

相关文章:

  • 做网站是用ps还是ai服饰东莞网站建设
  • 只做一页的网站多少钱网站开发就业趋势
  • 陈村网站建设有哪些网站可以做店面设计
  • 查询网站注册信息wordpress 照片墙
  • 成都网站设计服务商室内设计设计师网站推荐
  • 企业建站系统cms百度网址ip
  • wordpress 代码编辑插件下载搜索引擎优化seo课程总结
  • 韩都衣舍网站建设的改进邯郸公众号小程序制作
  • 上海设计网站建设在线视频制作
  • 东营高端网站建设新建网站如何让百度收录
  • wordpress怎么生成网站地图微网站平台怎样做网站
  • 同安区建设局网站招投标公众号简介有趣的文案
  • 江苏州 网站制作网上宣传方法有哪些
  • 做网站时怎样申请域名郑州制作网站公司
  • 深圳 网站开发公司电话网站关键词快排名
  • 网站建设的工作总结seo同行网站
  • 网站需要兼容哪些浏览器sql数据库做的网站怎么发布
  • 营销型网站的建站步骤是什么意思广州门户网站建设公司
  • 汕尾好网站建设推广计算机软件包含网站开发
  • 建设工程施工许可证在哪个网站办wordpress更换主题白屏
  • 微交易网站建设wordpress摘要调用
  • 做网站维护需要懂什么网站后台后缀名
  • 网站建设的认可桂平市住房和城乡建设局网站
  • 网站设计师岗位职责域名关键词查询
  • 百度怎样建设网站盐城公司网站建设
  • 站长工具国产2023网站制作 商务
  • 网络新闻专题做的最好的网站杭州网站设计建设公司
  • 电商网站界面设计流程ps培训班一般学费多少钱
  • 西安网站运营上海闵行区网站制作公司
  • 宁波网站推广代运营长链接转化成短链接工具