世界顶尖名表瑞士网站不要中国手表网站,canvas设计网站,h5开发公司,企业网站建设比较好科技云报道原创。
北京冬奥运AI 虚拟人手语主播、杭州亚运会数字人点火、新华社数字记者、数字航天员小诤…当随着越来越多数字人出现在人们生活中#xff0c;整个数字人行业也朝着多元化且广泛的应用方向发展#xff0c;快速拓展到不同行业、不同场景。
面向C端#xff0…科技云报道原创。
北京冬奥运AI 虚拟人手语主播、杭州亚运会数字人点火、新华社数字记者、数字航天员小诤…当随着越来越多数字人出现在人们生活中整个数字人行业也朝着多元化且广泛的应用方向发展快速拓展到不同行业、不同场景。
面向C端数字人帮助用户生产内容和辅助工作如数字人练口语、和数字人玩游戏等面向B端数字人是企业的“工具人”应用于金融、影视、电商、直播等行业提高行业生产和运营效率。
毫无疑问数字人是一门好生意但其规模化落地依然面临着人才、成本、场景、技术等层层困难。其中最关键的是技术瓶颈如何让数字人摆脱“空有一副好皮囊”的市场评价是一大难题。
然而随着大模型的出现数字人的发展似乎正在迎来新的机遇。
大模型赋能数字人
对于产业界而言数字人本身并不新鲜。在过去很长一段时间内为了又力求数字人视觉外形上的高保真呈现生产成本不亚于制作一部专业级电影。
瑞银发布的数字人研究报告指出高级虚拟人物的先期投入成本平均为3000万元后期又需要真人团队完成拍摄、配音、剪辑。以乐华娱乐的虚拟女团A-SOUL为例其一支单曲制作成本约200万元一场线下演唱会成本约2000万元。
但即便是如此高昂的成本也解决不了数字人的互动效果问题。由于智能水平不足与其说它是数字人更像是一个没有灵魂的数字皮套。
高成本再加上互动效果不佳使得数字人的使用被限制在厂商内部或大企业客户的试验项目。
因此当具有学习能力的生成式大模型颠覆了内容制作范式后面向更广范围的中小型企业用户、优先规模化落地使用的廉价数字人成为了可行方案。
据一名人工智能研究人员介绍大模型对数字人的重塑与赋能主要体现为降本增效。
从技术角度来说搭建一个数字人主要分为建模、驱动、渲染几个环节。传统的数字人主要依托计算机图形学技术真人动作捕捉需要采集大量的真人数据深度建模耗时长效率低成本高。
如今在大模型的加持下通过AI算法基于深度学习模型、动作模拟、情感模拟等技术只需要几分钟的真人视频用大模型训练若干个小时就可以生成逼真的数字人制作成本大大降低。
不仅如此数字人在成本降低的同时效能也大大提升。
在大模型出现以前数字人在外形上差异度较小而且只能根据输入的统一脚本“照本宣科”地回答问题。
在大模型的赋能下数字人拥有了“灵魂”不仅外貌特征可以自定义设计智能化、交互性也有了很大提升。比如在一些直播带货场景中数字人已经可以与受众进行基础互动。
比如百度智能云发布的曦灵数字人大模型的加持下可以15分钟快速完成直播间搭建自动生成匹配产品特色的讲品话术开启智能互动问答。
在某餐饮品牌的直播间曦灵数字人主播自动生成直播话术包含开场破冰、福利放送、暖场话术、催单话术等。在这场真人与曦灵数字人的接力直播中用户竟然没有丝毫察觉。
更令人惊讶的事在真实6小时的直播比对中数字人主播仅需真人主播15%的成本就可获得真人主播85%GMV。
除了直播带货百度智能云曦灵作为国内首个大模型全面重构的数字人平台还可为企业提供2D真人、3D写实、3D超写实的人像实现视频制作、数字员工、数字人代言人等多种应用。
比如在曦灵平台只需5分钟的真人视频半小时即可训练人像录制100句话语24小时生成专属音色库相比真人授课成本只需过去的30%录制效率提升20倍。
不难发现经过大模型重塑与赋能的数字人一定程度上摆脱了价格昂贵、互动性差等问题越来越广泛地出现在短视频、直播间中。
同时数字人开始朝着更多“身份”进军——银行理财师、律师、老师、已逝的名人……数字人正在成为任何想成为的人也为这条日渐拥挤的赛道带来了新的机遇。
让数字人更像“人”
大模型的出现让数字人“脱胎换骨”成为如今最火的创业赛道之一。
目前市场上主要的数字人厂商主要有两类一类是以百度、腾讯、华为等为代表的科技巨头基于自身大模型方面的优势研发推出数字人产品另一类是以硅基智能、出门问问、相芯科技等为代表的中小厂商。
多名人工智能领域投资人表示目前AIGC生成式人工智能还处于早期阶段能落地产生利润的不多数字人是其中比较少有的商业化路径且已经能够盈利的项目。
但随着大量的创业者涌入行业竞争趋于激烈和同质化赛道逐渐变得拥挤和内卷。
内卷的一个表现是价格越降越低。目前2D数字人的价格大多数已经降到千元级别有的甚至只需要几百元。
360集团的数字人营销服务也显示通过智能营销云平台的配套SaaS服务推广给客户按照会员用户每月付费的标准估算一款数字人的价格最低几十元最高在一、二百元上下。
随着大量低成本的数字人涌入市场百元级别的数字分身迅速被炒成一本万利的“财富经”。
每到深夜打开主流平台大量的数字人坚守在直播间。随之而来的是关于数字人的质疑声渐起诸如效果太假、市场混乱等导致用户体验不佳。
有业内人士认为随着越来越多的玩家涌入一些创业者技术能力有限生产的数字人产品质量良莠不齐容易导致劣币驱逐良币。
一方面数字人多用于较为简单的环境、解决较为基础的问题在场景切换或面对多轮对话时可能出现答非所问或陷入死循环的情况制约用户体验。
另一方面大模型下的数字人交互体验始终与真人存在明显差异比如在Sora生成内容中无视物理学原理、人的手指时多时少等问题被广为诟病可能进一步引发心理方面的“恐怖谷效应”。
对此也有专家认为需要进一步提升技术创新能力和用户体验感在保证数字人外在拟人效果的同时优化用户交互体验注重实时渲染、光学捕捉、三维重建、智能人机交互等新兴技术与自然语言处理、语音识别、计算机视觉、生成式AI等技术的研究和应用。
“当前行业正在共同突破的技术目标是‘如何让数字人变得更像一个人’像人一样去思考”一位业内人士表示加快企业间的技术协同解决交互型数字人在情绪感知、语义理解等方面的技术难题是接下来的重点。
这一系列的挑战都指向技术侧。
2024年度《中国虚拟数字人影响力指数报告》指出截至2024年2月底国家知识产权局“专利检索”数据显示2023年全年数字人领域专利申请数高达544个反映出业界在核心技术研发上的强劲势头和深度创新。
从2023年数字人相关专利申请机构来看以百度、腾讯为代表的老牌互联网巨头以中国移动、工商银行为代表的头部通信、金融机构以小冰公司、世优科技、黑镜科技为代表的头部数字人公司形成了技术端的多强格局。
尽管行业头部大厂在AI技术上拥有了先发优势但在产业高速发展的过程中每个公司在技术本身都没有绝对的壁垒本质上技术背后是人。对于所有数字人厂商来说AIGC带来机会的同时也成为直面挑战的起点。
结语
数字人正处于风口吸引了大量想分一杯羹的创业者涌入。但不可否认的是作为一项年轻的技术数字人还处于早期阶段市场尚在培育之中。
对于同处一片红海中的数字人公司来说要思考的或许不是如何“卷低价”而是通过技术的不断进步让数字人“更像人”提高行业的整体水位让数字人“活下去”创造更多的价值。
【关于科技云报道】
专注于原创的企业级内容行家——科技云报道。成立于2015年是前沿企业级IT领域Top10媒体。获工信部权威认可可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。