当前位置：首页 > news >正文

多元网站建设厦门网站建设服务

news 2026/4/8 21:11:31

多元网站建设,厦门网站建设服务,安卓优化大师官方版本下载,wordpress 分库在 LLM 应用程序中构建稳健性和确定性图片来自作者欢迎来到雲闪世界。OpenAI最近宣布其最新的gpt-4o-2024–08–06模型支持结构化输出。与大型语言模型 (LLM) 相关的结构化输出并不是什么新鲜事——开发人员要么使用各种快速工程技术#xff0c;要么使用第三方工具。在本文…在 LLM 应用程序中构建稳健性和确定性图片来自作者欢迎来到雲闪世界。OpenAI最近宣布其最新的gpt-4o-2024–08–06模型支持结构化输出。与大型语言模型 (LLM) 相关的结构化输出并不是什么新鲜事——开发人员要么使用各种快速工程技术要么使用第三方工具。在本文中我们将解释什么是结构化输出、它们如何工作以及如何将它们应用于您自己的基于 LLM 的应用程序中。尽管 OpenAI 的公告使得使用他们的 API 实现起来非常容易正如我们将在此处演示的那样但您可能希望选择开源Outlines包由dottxt上的可爱人员维护因为它可以应用于自托管开放权重模型例如 Mistral 和 LLaMA以及专有 API免责声明由于此问题 Outlines 在撰写本文时不支持通过 OpenAI API 生成结构化 JSON但这很快就会改变。什么是结构化输出如果RedPajama 数据集有任何指示那么绝大多数预训练数据都是人类文本。因此“自然语言”是 LLM 的原生领域——无论是在输入中还是在输出中。然而当我们构建应用程序时我们希望使用机器可读的形式结构或模式来封装我们的数据输入/输出。这样我们就可以在应用程序中构建稳健性和确定性。结构化输出是一种机制通过该机制我们可以在 LLM 输出上强制执行预定义模式。这通常意味着我们强制执行 JSON 模式但它不仅限于 JSON — 原则上我们可以强制执行 XML、Markdown 或完全定制的模式。结构化输出的好处有两方面更简单的提示设计——在指定输出应该是什么样子时我们不需要过于冗长确定性名称和类型——我们可以保证在 LLM 响应中获得age具有Number JSON 类型的属性实现 JSON 模式在这个例子中我们将使用Sam Altman 的维基百科条目的第一句话…… 塞缪尔·哈里斯·奥特曼 (Samuel Harris Altman1985 年 4 月 22 日出生) 是一位美国企业家和投资者自 2019 年起担任 OpenAI 的首席执行官他曾短暂被解雇并于 2023 年 11 月复职。 …我们将使用最新的 GPT-4o 检查点作为命名实体识别 (NER) 系统。我们将强制执行以下 JSON 模式 json_schema { name: NamedEntities,name : NamedEntities , schema : { type : object , properties : { entities : { type : array , description : 实体名称及其对应类型的列表 , items : { type : object , properties : { name : { type : string , description : 文本中指定的实际名称例如人名或国家名称}, type : { type : string , description : 实体类型例如Person或Organization , enum : [ Person , Organization , Location , DateTime ] } }, required : [ name , type ], “additionalProperties” : False} } }, “required” : [ “entities” ], “additionalProperties” : False}, “strict” : True} 本质上我们的 LLM 响应应该包含一个NamedEntities对象该对象由一个数组组成entities每个数组包含一个name和type。这里有几点需要注意。例如我们可以强制使用枚举类型这在 NER 中非常有用因为我们可以将输出限制为一组固定的实体类型。我们必须指定数组中的所有字段required但是我们也可以通过将类型设置为例如来模拟“可选”字段[string, null]。现在我们可以将模式连同数据和指令一起传递给 API。我们需要response_format用一个字典填充参数然后提供相应的模式。typejson_schema” 完成客户端。beta.chat.completions.parse( modelgpt-4o-2024-08-06,“gpt-4o-2024-08-06”消息[ { “role”“system”“content”“”“您是命名实体识别 (NER) 助理。您的工作是识别并返回给定文本的所有实体名称及其类型。您只能严格遵守以下实体类型人员、位置、组织和日期时间。如果不确定实体类型请忽略它。请小心某些首字母缩略词例如角色头衔“CEO”、“CTO”、“VP”等 - 这些应该被忽略。”“”}{ “role”“user”“content”s } ]response_format{ “type”“json_schema”“json_schema”json_schema} ) 输出应如下所示 {entities: [{name:Samuel Harris Altman,type:Person},实体[{ 名称塞缪尔·哈里斯·奥特曼类型人 }{ 名称1985 年 4 月 22 日类型日期时间 }{ 名称美国人类型地点 }{ 名称OpenAI类型组织 }{ 名称2019类型日期时间 }{ 名称2023 年 11 月类型日期时间 }]} 本文使用的完整源代码可在此处获得。工作原理魔法在于约束采样和上下文无关语法 (CFG)的结合。我们之前提到过绝大多数预训练数据都是“自然语言”。从统计上讲这意味着对于每个解码/采样步骤从学习的词汇表中抽取一些任意标记的可能性都是不可忽略的在现代 LLM 中词汇表通常涵盖 40 000 多个标记。但是在处理形式模式时我们确实希望快速消除所有不可能的标记。在前面的例子中如果我们已经生成了…… {实体[{名称Samuel Harris Altman‘实体’[{ ‘名称’‘塞缪尔·哈里斯·奥特曼’...那么理想情况下我们希望typ在下一个解码步骤中对标记放置非常高的逻辑偏差而对词汇表中所有其他标记放置非常低的概率。本质上就是这种情况。当我们提供模式时它会被转换成形式语法或 CFG用于在解码步骤中指导逻辑偏差值。CFG 是那些正在卷土重来的老式计算机科学和自然语言处理 (NLP) 机制之一。这个 StackOverflow 答案实际上对 CFG 进行了非常好的介绍但本质上它是一种描述符号集合的转换规则的方式。结论结构化输出并不是什么新鲜事物但随着专有 API 和 LLM 服务的出现它无疑正成为人们最关心的问题。它们在 LLM 不稳定且不可预测的“自然语言”领域与软件工程确定性和结构化领域之间架起了一座桥梁。结构化输出对于任何设计复杂 LLM 应用程序的人来说都是必不可少的因为LLM 输出必须在各种组件中共享或“呈现”。虽然 API 原生支持终于到来了但构建者也应该考虑使用 Outlines 等库因为它们提供了一种与 LLM/API 无关的方法来处理结构化输出。感谢关注雲闪世界。Aws解决方案架构师vs开发人员GCP解决方案架构师vs开发人员

查看全文

http://www.w-s-a.com/news/183340/