河北建筑工程信息网站,哈尔滨 高端网站建设,php 和wordpress,wordpress采集网页文章从算力基础到用户生态#xff0c;群雄逐鹿大模型
自2022年stable diffusion模型的进步推动AIGC的快速发展后#xff0c;年底#xff0c;ChatGPT以“破圈者”的姿态#xff0c;快速“吸粉”亿万#xff0c;在全球范围内掀起了一股AI浪潮#xff0c;也促使了众多海外巨头竞…从算力基础到用户生态群雄逐鹿大模型
自2022年stable diffusion模型的进步推动AIGC的快速发展后年底ChatGPT以“破圈者”的姿态快速“吸粉”亿万在全球范围内掀起了一股AI浪潮也促使了众多海外巨头竞相发布属于自己的大模型。
而在国内实际上很久之前阿里、华为、腾讯等公司便早已有所布局2019年阿里开始布局大模型研发去年9月发布“通义”大模型系列的众多大模型华为在2021年基于昇腾AI与鹏城实验室联合发布了鹏程盘古大模型而腾讯的思路也与阿里相似发布了混元AI大模型第二梯队的京东、网易、360、字节跳动等企业也纷纷官宣了自己在AI大模型方面的布局。
而进入2023年以来随着文心一言的发布成为了中国第一个类ChatGPT产品后各家的大模型也纷纷亮相一时间国内仿佛陷入了“大模型之战”中。
截至目前百度文心大模型、华为盘古大模型、商汤大模型、阿里大模型都已亮相而后还有许多大模型正在准备粉墨登场。
那么在这匆匆发布的背后是真的技术成熟还是鱼龙混杂各个大模型的实力又是怎样
本文将从语言大模型、算力与技术底座与具体应用层面状况三大角度来分析和研究目前已经发布的大模型的技术基础、应用场景和用户生态看看哪些大模型更有可能在这混战中成功突围。 01 | ChatGPT不该止于C端
ChatGPT作为最早出圈的大模型产品应用其问答的流畅程度与准确程度可以很好地体现NLP模型的水平。
而目前国内厂商百度、阿里也都发布了类似模型那么相比之下文心一言与通义千问的表现如何
首先是最近对话式AI们经常出现的一个典型问题面对自己知识库中没有或本身就是错误的提问时仍能对着错误描述侃侃而谈简称一本正经的胡说八道。
于是我先问了通义千问这样一个问题你知道唐僧为什么要上梁山吗
通义千问在思考后给出了这样的回答它首先简单对唐僧进行了介绍然后将其带入了《水浒传》中宋江的角色但最后却又回到了《西游记》中还讲“这一情节体现了唐僧的坚定和决心也反映了他作为一个有信仰的人物的形象。” 而同样的问题给了文心一言却得到了一个更加简短但同样荒谬的答案唐僧上梁山的原因是因为他被迫出走被唐朝通缉无路可走只能上梁山。 本次测试中通义千问与文心一言都犯了同样的错误不过在我指正之后通义千问也进行了积极地认错展现出了良好的连续问答能力而文心一言则并没有“听懂”我的指正。
接下来我又问了它们一个经典的数学问题——鸡兔同笼“鸡兔同笼头共10足共28鸡兔各几只”
通义千问在得到提问后快速做出了回答为我列出了计算该问题所需要的方程式还贴心地在后面备注上了方程式的由来。 而文心一言就显得更加直接回答了我的问题。 而在这两个问题之外我还让它们两个一起编写了代码、赏析了诗词、撰写了文章。
总得来说在面对用户提出的问题时通义千问与文心一言在绝大多数情况都可以给出较为正确的回答在面对C端用户的提问时两个产品显示出了不相上下的实力。
而在C端的势均力敌之下阿里却祭出了同类竞品难以比拟的B端服务能力。
通义千问在C端用户之外专门针对企业用户发出了邀请共测企业可基于通义千问打造专属大模型在企业专属的大模型空间中既可以调动通义千问的全部能力也可以结合企业自己的行业知识和应用场景训练自己的企业大模型。
具体而言除了通用场景之外企业由于业务特性的不同对于大模型服务有特殊需求和要求希望让通用的大模型变成企业专属的大模型支撑企业各式各样的应用与服务。
阿里云希望通过产品化的方式满足企业专属大模型从生成到部署全生命周期的需求。 在发布会当天阿里云就宣布将与OPPO安第斯智能云联合打造OPPO大模型基础设施基于通义千问完成大模型的持续学习、精调及前端提示工程未来建设服务于其海量终端用户的AI服务。
同时中兴通讯、吉利汽车、智己汽车、奇瑞新能源、毫末智行、太古可口可乐、波司登、掌阅科技等多家企业也表示将与阿里云在大模型相关场景展开技术合作的探索和共创。
或许在竞争激烈的C端之外面向企业端的大模型构建能力才是通义千问真正的优势所在。
而相关专家也在交流中表示通义千问将会在企业各自深耕的领域中为他们提供构建大模型方面的帮助带来更好的生态系统与商业模式。
02 | 大模型背后的算力之争谁占先机
纵观国内发布的大模型可以发现相对于国外尖端的AI企业来说国内还像是蹒跚学步的孩童在这条道路上刚刚起步。
而在大模型发展的道路上最重要的实际上还是最基础的算力资源的多少与怎样利用算力的能力那么国内顶尖大模型企业在算力上的储备几何
首先是近日同样发布了大模型的商汤科技在前段时间的交流中商汤科技内部的相关专家对公司的算力情况进行了交流。
国内能拿到最尖端的显卡是来自英伟达的A100 GPU商汤科技在美国对华禁售之前便提前囤积了上万张A100芯片是国内算力资源比较充足的厂商。
除了来自英伟达的显卡之外商汤还在采购国内的GPU并且专家表示早在去年以前就已经在大装置中适配了许多寒武纪与海光信息的GPU卡但在当下商汤仍旧面临着如何将国产GPU卡进行大模型训练适配的问题。
在商汤之外华为的盘古大模型也引起了众人瞩目但在算力资源方面华为却略显窘迫。
因为受到美国的长期制裁华为只得使用全部国产的加速芯片而目前昇腾系列最先进大幅使用的型号昇腾910也只有A100 70%的性能从长期来看将会制约大模型的发展。
而算力的短缺也直接影响了华为的发展策略选择性地放弃了C端的发展主攻B端工业大模型应用。
而说起算力资源储备最多的企业莫过于云时代中独占鳌头的阿里。
但从阿里云上的角度来看当前云上至少拥有上万片的A100 GPU从整体来说阿里云的算力资源至少能够达到10万片以上。如果继续抬眼从整个集团的算力资源来说将会是阿里云5倍的这样的一个量级。
而在英伟达的芯片之外阿里云也拥有众多国产化的GPU芯片而最近的项目中便选择了寒武纪MLU370其性能基本过关(A100的60-70%)检测合格厂商态度积极愿意与阿里对接并且已经用在了CV等小模型的训练和推理上。
在2023年阿里云算力资源的增速也将达到30%-50%。
得益于云时代的绝对领先让阿里拥有了远超其他企业的算力资源也让其在AI时代里天生就占得了上风。
但是动辄超千亿参数的大模型研发并不能靠简单堆积GPU就能实现这是囊括了底层算力、网络、存储、大数据、AI框架、AI模型等复杂技术的系统性工程需要AI-云计算的全栈技术能力。
而阿里是全球少数在这几个领域都有深度布局、长久积累的科技公司之一也是为数不多拥有超万亿参数大模型研发经验的机构。
在AI算法方面阿里达摩院是国内最早启动大模型研究的机构之一2019年便开始投入大模型研发在中文大模型领域一直处于引领地位2021年阿里先后发布国内首个超百亿参数的多模态大模型及语言大模型此后还训练实现了全球首个10万亿参数AI模型。
在智能算力方面阿里建成了国内最大规模的智算中心“飞天智算平台”千卡并行效率达90%自研网络架构可对万卡规模的AI集群提供无拥塞、高性能的集群通讯能力。基于飞天智算的阿里云深度学习平台PAI可将计算资源利用率提高3倍以上AI训练效率提升11倍推理效率提升6倍覆盖全链路AI开发工具与大数据服务深度支持了通义大模型的研发。
阿里云全栈AI技术体系更是从机器学习平台、大模型即服务、产业智能三个层面不断丰富AI服务并通过全栈技术驱动千行百业的AI发展与应用。 可以说阿里在云时代的成功在一定程度上延续到了AI时代与那些算力资源相对不足的竞争者来说阿里在算力与技术底座方面有着无可比拟的巨大优势。 03 | 大模型带来业务集合式飞跃
在拥有了算力资源与技术底座后大模型能力若想要普惠大众触达到每一个人就需要应用层面的生态建设而这也正是众多厂商“刺刀见红”的战场众多厂商也依据企业发展的不同做出了不同的选择。
比如华为盘古大模型受算力资源不足与公司业务导向的影响选择了指向B端的打法。
在盘古大模型发布会上华为没有着墨于NLP模型而是着重强调了CV大模型与科学计算大模型的应用范例。
盘古CV大模型主要应用于智能巡检、智慧物流等场景。
例如在与能源公司合作的盘古矿山大模型中案例中矿井现场是一个40米长的采掘机宽度仅2米左右传统相机很难一下子捕捉到全部画面只能用图中的九宫格视频画面。而通过5GAI全景视频拼接综采画面卷传输到地面地面工作人员将来可以实现地面控制机器进行采矿实现矿下无人少人安全作业。
而盘古气象大模型也在气象预测方向上超过了传统数值的计算方法。
盘古气象大模型在气象预报的关键要素和常用时间范围上精度均超过当前最先进的预报方法同时速度相比传统方法提升 1000 倍以上。如在台风路径预测任务上相比传统数值气象预报方法盘古气象大模型可以降低 20%以上的位置误差。
而对阿里而言其在国内领先的大模型能力与众多的业务板块让阿里大模型在各个领域都能一展拳脚。
阿里云智能集团CEO张勇在峰会上表示阿里巴巴所有产品未来都将接入“通义千问”大模型进行全面改造包括天猫、钉钉、高德地图、淘宝、优酷、盒马等。 以阿里起家的电商赛道来说大模型就有许多应用场景。
对商家而言大模型最切合实际的应用场景莫过于智能客服。随着电商行业逐渐成熟消费者对服务质量的要求日益提高客服这个岗位有着极为巨大的降本增效需求。
而经过通义千问的改造后能听懂消费者的话、明白消费者诉求的聪明客服机器人也将上线将基于机器学习、大数据、、语义分析和理解等多项人工智能技术为消费者提供最优质的服务。
对于平台而言大模型可以有效提升用户的购物体验。比如用户可能有时不清楚自己的明确需求但通过与AI导购员交流可以得到相当多的指引信息以及购物清单比如开一个生日party需要哪些方面的准备化妆需要购买哪些工具等。
在电商场景之外接入通义千问后的办公场景也将实现多项全新功能。
例如在钉钉文档中可借助通义千问自动配图、创作文章、撰写邮件、生成方案在会议中可以完成记录、总结、生产待办事项甚至还能帮助总结未读群聊信息中的要点...... 可以说无论是对B端的企业还是C端的用户只要有阿里系产品存在的地方在接入通义千问后其智能水平与易用水平都将快速提升一个档次。
而对阿里来说作为国内最大的商业集团之一有了通义千问的加持得到的提升将不会仅仅局限于某个业务线或是某个方向而将是整体实力的飞跃。 04 | 结语
AI大模型的浪潮开启了一个新的时代将所有的互联网厂商都重新拉到了同一起跑线上。
在2023阿里云峰会上阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇也说出“面对AI时代所有产品都值得用大模型重做一次。”
而在一切应用重建后的AI时代里核心竞争力究竟是什么也成为了厂商们需要思考的首要问题。
在我看来坚实的算力基础与良好的用户生态将成为AI时代里成功的两个必要条件。
而国内谁拥有最多高端算力资源与强大的算法进化能力在这场大模型之战中就有着其他企业无法比拟、得天独厚的优势。