网站点赞怎么做的,备案号 不放在网站首页,北京值得去的互联网公司,淘客联盟推广平台让郭德纲飙英文、让霉霉说中文的翻译视频生成工具HeyGen和掀起AI证件照热潮的“妙鸭相机”一样#xff0c;在一阵疯狂刷屏之后#xff0c;又迅速在各大群里销声匿迹了。 十月份#xff0c;由HeyGen制作的各种明星跨语言翻译视频#xff0c;在全网疯传#xff0c;大家震撼于… 让郭德纲飙英文、让霉霉说中文的翻译视频生成工具HeyGen和掀起AI证件照热潮的“妙鸭相机”一样在一阵疯狂刷屏之后又迅速在各大群里销声匿迹了。 十月份由HeyGen制作的各种明星跨语言翻译视频在全网疯传大家震撼于AIGC地道的中英文表达完全没有译制片的腔调惟妙惟肖的音色还原、高度对齐的口型声音让不少人表示“真的有被吓到”“配音演员要失业了”…… 太阳底下无新事这个现象级AIGC应用也逃不过“速朽”的命运。 如今我所在的LLM大模型讨论群里偶尔有人发一个中英翻译视频根本无人讨论可能大多数人连点开看看都提不起兴趣。 大众的新鲜感很快会过去“明星译制片”只有看个乐子的娱乐属性并不是高频刚需猎奇尝鲜之后到了真金白银付费的时候自然风过了无痕。 这一年大模型无疑是全球最大的热点。但热归热最终在商业市场立足的大模型应用仍然稀少。 明明已经是“百模争艳”为何成功产品化的现象级应用就那么几个 而这些产品成熟也不缺热度的爆款AIGC应用为何无法将流量转化为持久的经济效益商业化仍是一团迷雾 本文希望从“AI译制片”这个小切口探讨一下大模型的产品化条件和商业化迷思。 一夜爆红 是产品化的胜利 首先要明确一点妙鸭也好HeyGen也好AIGC应用的一夜爆红对于大模型产业来说绝对是一件正面的事。 大模型只是一种基础技术相当于钢材大模型厂商相当于炼钢厂还要有人设计出洗衣机、跑步机、微波炉等一个个具体的产品新技术才能为人所用。 而HeyGen的一夜爆红正是产品化的胜利。 技术原理上跨语言翻译视频制作并不是什么新事物业内已经有很多科技公司、影视公司、后期制作公司在探索并推出了专业级工具平台。 简单来说就是升级版的TTSText To Speech技术。利用大语言模型对文本进行更地道的翻译然后对声音空间进行更好的建模训练一个跨语种迁移TTS模型让风格迁移、音色迁移、情感迁移更加鲁棒合成的语音更加自然、还原。 这种技术的特点就是高效整个翻译过程全自动化可以批量生成翻译视频。不过在自然度和表现力细节上还是不如真人配音演员的演绎那么细腻、有创造力。 总结一下就是HeyGen背后的技术原理并非什么独家秘籍。 其火爆的原因是极高的产品化能力。 一般来说AI技术的产品化要经历三个步骤 第一步选择工具。 工欲善其事必先利其器工具是开发人员喜欢花费大量时间争论的话题。HeyGen的工具选择是比较务实的甚至看起来特别“小白”那就是头部闭源模型开源“大礼包”。 有网友扒出HeyGen是用Whisper将语音转文字GPT4目前未开源进行文本翻译声音克隆生成音频用so-vits-svc最后用GeneFace将翻译后的语音与视频中说话者的嘴唇动作同步。 大模型热潮以来我们看到了许多开发者在衡量和挑选“最好”的大模型而市面上有各种不同的基座模型供应商提供类似的竞品服务开发者想要找到绝对意义上最好的工具几乎不可能。这些底层工具如基座模型、编程语言等先进性都可能变化。选择好相对较优的工具组合然后快速去开发demo、验证想法、迭代升级才是开发者最应该做的。 第二步原型设计。 HeyGen选择的工具无论是GPT4的API还是开源模型都是比较容易获取的但大多数普通人都不会从搜索GitHub仓库、处理软件bug中获得多少乐趣。 就拿跨语种视频翻译来说其中涉及了多模态内容的翻译包括语音、文本以及视频在字幕翻译、语音合成、智能配音方面目前都有很好的自动化但将多模态功能集成到一起实现端到端一键翻译的产品还不多见。 所以HeyGen构建了一个简单易上手的访问界面通过集成多种模型、多种工具降低了翻译门槛用户只需要上传初始视频选择目标语言一键输出就可以坐等声音克隆完成了。 HeyGen的核心价值就是让非技术用户不必陷入繁多的技术细节中不需要安装N多个额外的工具就可以与多个模型交互完成转写、翻译、配音、图像处理、音画同步等一大堆复杂的事情轻松进行高维度、可交互的内容创作。 第三步产品化。 明星、名人的跨语言翻译视频固然精彩但只是一种用例并且只能停留于C端用户玩梗涉及自然人的声音、肖像等版权问题是无法大规模普及并商用的。所以虽然明星译制片带火了HeyGen但HeyGen想要将产品投放市场并发挥价值还需要更有说服力的产品力。 从HeyGen官网可以看到数字人跨语言翻译视频才是HeyGen的核心产品力并给出了跨境电商营销视频、跨语种品牌宣传、老师制作教学视频、社交媒体吸粉、为生日婚礼等纪念日制作令人难忘的个人视频等一系列落地场景。 在此基础上HeyGen让数字人跨语言翻译视频可以通过自动化流水线来制作。 用户可以上传自己的照片进行个性化形象定制也可以在HeyGen提供的数字人素材和模板中选择输入脚本后就能生成自己所需的多语种视频了。 至此 HeyGen顺利完成了AI译制产品化的转换从而取得了巨大的成功导致了“多年译制无人问一朝HeyGen天下知”的景况。 从AI写真到AI译制片的爆火一次次说明产品化是承上启下、不可或缺的一步再怎么强调也不为过。 可以肯定地说不能完成从技术到原型设计再到产品化的转换将是许多大模型投资回报率低的主要原因也是许多AI创业项目失败的原因之一。 难逃“速朽”命运 商业化的魔咒 然而即便如此成功的产品化HeyGen又一次重复了“妙鸭”前辈的故事在访问量陡增之后又很快在各大群里销声匿迹了。 公域流量的退潮似乎是爆款AIGC应用的共同命运。 对此有人认为HeyGen是在“闷声发大财”。虽然猎奇玩家散去了但留下来的用户还是给HeyGen贡献了收入增长HeyGen连续九个月环比增长率在50%以上。创始人Joshua Xu也在社交媒体上公布了相关数据仅七个月时间ARR年度经常性收入就达到了100万美元。 问题来了HeyGen的商业化潜力是可持续的吗 我们认为HeyGen将要面临的商业化挑战还是非常大的。 首先技术工具无法被垄断仅靠多模态AI无法建立商业模式。 HeyGen凭借大模型强大的多模态和理解能力让跨语种翻译视频制作达到了传统AI译制所望尘莫及的水平这是非常厉害的工作。但大模型就像c、数据库一样只是一种新技术工具它是无法被垄断的。HeyGen所使用的开源工具极易获得闭源模型API也敞开了迎客所以仅靠底层工具无法建立商业模式和竞争壁垒。 而产品创意、交互界面的开发门槛并不高大量科技企业和个人开发者都可以轻松复刻并优化升级产品被超越或许只在旦夕之间。 如今点开海外科技媒体的报道页面会看到类似HeyGen原movio的视频生成工具推荐清单高达95个之多。可以说HeyGen提供了一个宝贵的AIGC用例但很快就开启了一场白热化竞争这对其后续收入的持续增长是很大的威胁。 其次C端付费刚性B端行业壁垒深收入增长曲线会放缓。 目前HeyGen收入主要靠C端客户付费。免费版本只支持一个免费的credits字幕显然仅供玩票而最低的创作者Creator付费档也要24美元/月对于个人博主来说虽然不算太贵但随着一大堆同质化产品的价格“内卷”未来也会面临性价比不高的窘况。 而商业用户business虽然付费能力强、价格接受度高但对跨语言视频翻译的技术含金量则要求更为复杂。HeyGen商业版本的客户大多是制作电商营销广告、语言学习数字人、多语种新闻播报、译制片等对翻译质量就会提出更为细粒度的要求比如文本翻译的长度要尽量和目标语言接近来保持说话口型的一致性。还有不同人说话的韵律不一样停顿的位置、重音的位置都要对齐才能高度还原个人风格。 再比如老人、小孩说同一个文本时因为角色人设的不同遣词造句也应该不一样翻译后的文本、语音都需要跟人设相对齐。 还有很多文化细节是跨语种翻译中要进行强把控的很多还是要人工译者去完成。毕竟商用场景不同于娱乐场景跨语言容易产生歧义一旦出现1%的错误都可能让做对的99%工作打了水漂面临丢单甚至海外市场合规风险。 所以说商业用户需要复杂、高质量、高控制的产品。这就需要厂商在数据方面尤其是小语种等少样本数据有独家的、高质量的数据积累。模型训练强行业知识等都要长期积累和迭代达到专业译者的水平。 目前已经有AI公司针对精品化视频译制的需求推出了ToB的产品解决方案训练跨语种 Voice Conversion模型采集配音演员的口型由人工控制再经由VC模型生成配音结果比TTS模型的表现力更强细节保留更多。 目前国内的AI巨头都很重视B端市场资源充足并且在机器翻译TTS、多模态AI技术方面的积累深厚都可能是HeyGen商业用户的争夺者。 大模型的产品创新风口才刚刚开始要保持商业化的优势身位如逆水行舟“当红顶流”也不能掉以轻心。 爆款应用“速生速朽” 大模型的商业迷思 2022年11月30日ChatGPT问世在一周年刚刚过去之际这场大语言模型的热潮将所有人都席卷其中。或许还有人无知无觉但也注定无法置身事外。 一年以来时常有妙鸭相机、HeyGen这样的爆款应用在社交媒体刷屏。这证明了几件事 1.大模型是条件而不是结果。运用好这些新工具创造新产品的人会获得新时代里无限多的机会。 2.基建是问题但也不是问题。提到大模型业界总会担忧算力卡被限制国产大模型能力有差距但悲观者正确乐观者前行。实际上无论算力基建、开发工具、基座模型在今天都不是也不该是应用开发者的阻碍。 业内有人说过国产卡只要达到N卡60%的性能用户就会买单。而一些开发者告诉我密集使用了文心一言、讯飞星火等国产大模型基础逻辑推理确实能叫板GPT 3.5-turbo非基础能力比如func call、稳定性等也可圈可点。而妙鸭、HeyGen也都是中国企业所开发的行动比洞见更重要。 3.产品化是大模型商业化的必要条件。做了那么多通用大模型和行业大模型如果没有大量产品化的成果是无法转化为使用价值和经济效益的。“改变世界”的不是大模型而是各种各样的产品无数个HeyGen帮助开发者完成从原型设计到产品化的转换降低试错成本将是接下来大模型厂商最重要的动作。 4.建立商业壁垒的是刚需场景强业务知识/数据软件工程。HeyGen的商业化挑战说明大模型不是壁垒产品也不是壁垒这些都是很容易被复制的。而行业知识/数据大规模软件工程的流程控制、降本增效可以针对特定场景的需求深入挖掘、快速开发、快速迭代优化才符合AI技术特性才是商业化的保障。 几位行业大模型应用的开发者不约而同地跟我说过一件事先找到场景再优化产品和服务。也就是先想好商业变现的路线确定自己的壁垒达到了再去扎扎实实做产品心里才能不慌。 比如一个ToC的民宿大模型解决的是旅客入住民宿时管家介入太深显得没有边界感过度打扰管家介入太浅又缺乏服务价值感无法及时解决问题。基于大模型的语音交互助手就在旅客和管家之间起到了很好的缓冲桥梁作用让服务恰到好处。而旅客在当地的餐饮、游玩、购物等活动也都是围绕“住”展开的通过民宿大模型提供优质可靠的推荐服务也带来了商业转换的潜力。 一个ToB的金融大模型应用开发者也表示企业机构内部的多样化需求是不可能由一个通用的、标准化的软件产品来承载的所以ToB大模型创业既要做业务分析咨询又要做软件开发写代码才能真正服务好客户。AI软件开发的流程化、自动化对于控制成本非常重要不能每个项目都靠一群博士“手搓”代码。 对商业和场景的深刻洞察对行业和客户的理解比掌握算法、掌握技术都要难得多也是开发者最应该重视的核心能力。 最后我想说虽然大模型已经非常火了但别急着担心“泡沫”、害怕“追高”这才是开始。 国际咨询机构的调查报告显示65%的受访者目前有时或很少使用生成式人工智能而约占90%的受访者认为AI应该被“经常或总是”使用。 也就是说大众对机器学习和生成式 AIGen AI的接受度很高而实际渗透率并不高。妙鸭、HeyGen等现象级Gen AI产品无疑迈出了一大步而只有它们是远远不够的。 爆款AIGC应用只是AI和大模型价值潜力的一小部分。目前还没有一种商业模式长期跑通恰恰说明技术的新大陆上留给登陆者、建设者们的发挥空间还很大。