济南网站建设山东聚搜网咨询,怎样把网站上传到服务器上,老牛影视传媒有限公司,网站配色 要用什么原则一、GPT-4o简介
北京时间5月14日#xff0c;OpenAI举行春季发布会。OpenAI在活动中发布了新旗舰模型“GPT-4o”#xff01;据OpenAI首席技术官穆里穆拉蒂#xff08;Muri Murati#xff09;介绍#xff0c;GPT-4o在继承GPT-4强大智能的同时#xff0c;进一步提升了文本、…一、GPT-4o简介
北京时间5月14日OpenAI举行春季发布会。OpenAI在活动中发布了新旗舰模型“GPT-4o”据OpenAI首席技术官穆里·穆拉蒂Muri Murati介绍GPT-4o在继承GPT-4强大智能的同时进一步提升了文本、图像及语音处理能力为用户带来更加流畅、自然的交互体验更多详情可点击查看官网。 GPT-4o的“o”代表“omni”源自拉丁语“omnis”。在英语中“omni”常被用作词根用来表示“全部”或“所有”的概念。GPT-4o是一个多模态大模型支持文本、音频和图像的任意组合输入并能生成文本、音频和图像的任意组合输出。与现有模型相比它在视觉和音频理解方面尤其出色。
二、GPT-4o的性能
GPT-4o可以在音频、视觉和文本中进行实时推理接受文本、音频和图像的任何组合作为输入并生成文本、音频和图像的任何组合进行输出。它可以最短在232毫秒内响应音频输入平均为320毫秒这与人类在对话中的响应时间相似。
文本能力
GPT-4o 在 0 次 COT MMLU常识问题上创下了 88.7% 的新高分。所有这些评估都是用我们的新 简单评估在新窗口中打开。此外在传统的 5 次无 CoT MMLU 上GPT-4o 创下了 87.2% 的新高。注3400b在新窗口中打开还在训练 音频能力
GPT-4o 在语音翻译方面创下了新的领先地位并在 MLS 基准测试中优于 Whisper-v3。 各种语言的考试能力
M3Exam 基准测试既是多语言评估也是视觉评估由来自其他国家标准化考试的多项选择题组成有时包括数字和图表。GPT-4o 在所有语言的基准测试中都比 GPT-4 强。我们省略了斯瓦希里语和爪哇语的视力结果因为这些语言只有 5 个或更少的视力问题。 视觉理解
GPT-4o 在视觉感知基准测试中实现了最先进的性能。全面碾压之前的模型。所有视觉评估均为 0 次其中 MMMU、MathVista 和 ChartQA 为 0 次 CoT。 语音交互 GPT-4o 在语音交互方面取得了重大进展。它采用了先进技术显著提高了响应速度使得对话更加流畅自然。在最近的发布会上OpenAI 展示了 GPT-4o 在语音对话中的表现它能够几乎实时地回答问题并通过文本转语音技术进行朗读提供了一种沉浸式的交流体验。此外GPT-4o 还可以调整说话的语气从夸张戏剧到冰冷机械以适应不同的交流场景。令人兴奋的是GPT-4o 还具备唱歌的功能增添了更多的趣味性和娱乐性。
三、GPT-4 Turbo 与 GPT-4o
不仅在传统的文本能力上GPT-4 Turbo的性能相当还在 API 方面更快速价格还更便宜 50%。总结来说与 GPT-4 Turbo 相比GPT-4o 速度提高了 2 倍价格减半限制速率提高了 5 倍。截至 2024 年 5 月 13 日Plus 用户将能够在 GPT-4o 上每 3 小时发送多达 80 条消息在 GPT-4 上每 3 小时发送多达 40 条消息。我们可能会在高峰时段减少限制以保持 GPT-4 和 GPT-4o 可供尽可能多的人访问。
GPT-4o 具有相同的高智商但比 GPT-4 Turbo 更快、更便宜并且具有更高的速率限制。
具体说来
定价GPT-4o 比 GPT-4 Turbo 便宜 50%输入 5 美元/月输出代币 15 美元/M。速率限制GPT-4o 的速率限制比 GPT-4 Turbo 高 5 倍——每分钟最多 1000 万个代币。速度GPT-4o 的速度是 GPT-2 Turbo 的 4 倍。视觉GPT-4o 的视觉能力在与视觉能力相关的评估中表现优于 GPT-4 Turbo。多语言GPT-4o 改进了对非英语语言的支持而不是 GPT-4 Turbo。
GPT-4o 目前的上下文窗口为 128k知识截止日期为 2023 年 10 月。
四、怎么使用GPT-4o 目前GPT-4o的文本和图像功能已经开始在ChatGPT中逐步推出用户可以在ChatGPT平台上免费体验到GPT-4o的相关功能但免费版有使用次数限制Plus用户可以享受到5倍的调用额度升级plus详细教程升级PLUS。
在接下来的几周内OpenAI计划将在ChatGPT Plus中推出Voice Mode新版本该版本带有GPT-4o。这将作为ChatGPT Plus的一个alpha版本提供给PIus用户。此外GPT-4o也将通过API提供给开发者作为文本和视觉模型。开发者可以利用AP来集成GPT-4o到他们自己的应用程序
中而且GPT-4o在API中相比GPT-4Tubo更快、更便宜并且有更高的速率限制。
至于GPT-4o的音频和视频功能OpenAl将在未来的几周和几个月内继续开发技术基础设施、通过训练后提高可用性以及确保安全性之后才会发布这些功能并逐步向公众提供。