当前位置: 首页 > news >正文

厦门海沧区建设局网站wordpress 站内搜索代码

厦门海沧区建设局网站,wordpress 站内搜索代码,顺义建站公司,网站开发报价明细大模型对搜推技术产生了深远的影响#xff0c;极大地推动了搜推技术的演进趋势#xff0c;使得搜推更加的智能化和个性化#xff0c;然而在搜推中引入大模型时同样面临一系列的挑战#xff0c;例如商品知识的幻觉#xff0c;复杂查询的理解#xff0c;个性化商品推荐极大地推动了搜推技术的演进趋势使得搜推更加的智能化和个性化然而在搜推中引入大模型时同样面临一系列的挑战例如商品知识的幻觉复杂查询的理解个性化商品推荐隐私和安全等问题。 京东零售技术总监翟周伟基于对电商场景的深刻理解和洞察从实际问题分析出发结合京东搜推业务在大模型上的相关创新性实践来解决这些痛点问题阐述在电商大模型的技术探索。本文为整个演讲的内容文稿期望对大家有所启发。 作者介绍翟周伟京东集团技术总监负责京东零售搜推电商大模型技术以及在 AI 助手搜推等领域的应用探索和实践。 1. 电商行业的发展和技术演进 1.1 电商行业发展 过去十年实物商品网上零售额实现了高速增长电商模式也经历了显著的演变。从以货架电商为主的传统模式发展到如今货架电商与内容电商并存的多元格局这一变化不仅反映了市场需求的多样化也展示了技术进步对零售行业的深远影响。 货架电商如阿里巴巴、京东和拼多多等平台通过建立庞大的商品数据库和高效的物流体系为消费者提供了便捷的购物体验。这些平台依托强大的技术基础优化了供应链管理降低了商品流通成本使得消费者能够以更低的价格购买到更丰富的商品。 与此同时内容电商如抖音、快手和小红书等平台的崛起标志着电商模式的进一步创新。这些平台通过短视频、直播等内容形式将商品展示与娱乐体验相结合吸引了大量用户的关注。内容电商不仅丰富了消费者的购物体验还通过社交互动和用户生成内容增强了用户粘性和购买欲望。 本质上无论是货架电商还是内容电商都是通过技术驱动大幅降低了商品流通成本显著提升了零售效率。可以说电商模式的发展变化是技术演进的直接结果。未来随着技术的不断进步电商模式将继续创新进一步满足消费者多样化、个性化的需求。 1.2 电商场景问题分析 从电商用户的消费决策链出发用户从需求的产生到最终决策下单可以拆解为购前、购中、购后这三个阶段。在这一链条中不同类型的平台扮演着不同的角色各自发挥着独特的功能。 首先以抖音、快手和小红书等为代表的内容分发平台作为当前的新兴内容电商平台主要处于消费链路的上游阶段。在购前阶段这些平台通过丰富多样的短视频、直播和用户生成内容激发用户的购物需求。内容电商平台通过生动的商品展示和互动性强的内容能够有效地吸引用户的注意力促进潜在需求的产生和转化。用户在这些平台上获取灵感、发现新产品并逐渐形成购买意向。 而以阿里巴巴、京东和拼多多为代表的商品分发平台作为当前的货架电商平台主要处于消费链路的中下游阶段。在购中阶段这些平台承担着用户需求与商品供给的高效匹配任务。当用户在内容平台上产生购买需求后他们通常会转向这些电商平台进行搜索以寻找具体的商品并进行比价和决策。电商平台通过庞大的商品库、精准的推荐算法和高效的物流服务确保用户能够快速找到所需商品并顺利完成购买。 在消费决策链路中用户购买需求产生后的搜索环节是决策的关键。电商搜索的核心在于基于用户需求的商品分发其主要目标是提升商品分发效率优化的关键指标是 GMV商品交易总额和 UCVR用户转化率。与一般的信息搜索如百度不同电商搜索不仅要提供相关性高的搜索结果还需要考虑商品的库存、价格、物流等多方面因素确保用户能够获得最佳的购物体验。 1.3 关键问题和技术挑战 作为国内领先的电商平台京东在移动端 APP小程序以及 PC 端等多种产品形态中为用户提供了全方位的购物体验。京东的宏观目标是实现更低的成本、更高的效率以及更好的用户体验。然而在实现这些宏观目标的过程中京东面临着一系列关键问题和技术挑战。 这种多样化的产品形态要求平台在各个终端上提供一致且优质的用户体验。同时不同终端的用户行为和需求也存在差异这就需要平台在设计和优化用户界面、功能以及交互体验时充分考虑各终端的特点和用户习惯。 宏观目标可以总结为更低的成本、更高的效率和更好的体验。 更低的成本降低成本不仅涉及商品采销和库存管理还包括物流成本和平台运营成本。通过智能化的供应链管理和 AI 技术京东可以优化库存配置减少商品滞销和库存积压从而降低成本。 更高的效率提高效率主要体现在物流配送和订单处理上。京东通过建设智能物流系统和自动化仓储设施实现了从订单生成到商品配送的全流程高效运作。同时通过精准的用户画像和个性化推荐京东能够在用户浏览和搜索时更快地匹配到合适的商品提高用户购物效率。 更好的体验用户体验的提升不仅依赖于界面设计和功能优化更需要在售前、售中和售后各个环节提供优质的服务。京东通过优化搜索算法、提升客服质量和完善售后服务体系全面提升用户的购物体验。 在实现宏观目标的过程中我们需要解决的关键问题可以归结为 GMV商品交易总额的问题。GMV 可以通过公式描述为GMV UV独立访客数 * UCVR用户转化率 * 客单价 UV独立访客数增加 UV 需要通过多种渠道吸引新用户和保留老用户。京东通过多样化的营销活动、社交媒体推广和内容合作吸引更多用户访问平台。 UCVR用户转化率提高 UCVR 需要优化用户的购物路径减少购买障碍。京东通过改进搜索和推荐系统提供个性化的商品展示提升用户的购买意愿。此外简化支付流程和提供多种支付方式也有助于提高用户转化率。 客单价提升客单价可以通过增加商品的附加值和鼓励用户购买更多商品来实现。京东通过推出高品质的自有品牌商品和组合销售策略提升客单价。 在解决上述关键问题时京东面临着多项技术挑战这些技术挑战包括但不限于以下四个方面 交互引流 提升交互效率同时考虑激发用户需求在提升用户交互效率的同时需要设计能够激发用户需求的交互方式。 时效性问题确保信息和商品推荐的实时性以满足用户的即时需求。 丰富性问题提供多样化的内容和商品选择满足用户的不同需求。 意图理解 复杂用户需求理解准确理解用户的复杂需求提供相应的商品和服务供给。 数千数万商品属性和类目精准识别对海量商品的属性和类目进行精准识别和分类从而提升检索效率。 用户画像等复杂上下文利用用户画像和上下文信息提供个性化的商品推荐和服务。 商品召回 多维度召回和融合从多个维度进行商品召回确保推荐结果的全面性和准确性。 商品和库存等动态变化实时跟踪商品和库存的动态变化确保推荐的商品有货且可购买。 个性化和多样性问题在个性化推荐的同时确保推荐结果的多样性避免推荐的单一化。 相关性 文本 图像多模态匹配通过文本和图像的多模态匹配提升推荐结果的相关性。 动态价格、促销、物流等考虑商品的动态价格、促销活动和物流情况提供更具吸引力的推荐。 权衡 UCVR 和长期 GMV在提升用户转化率的同时兼顾长期 GMV 的增长。 宏观流量调控和反作弊进行宏观流量调控防止作弊行为确保平台的公平性和用户体验。 1.4 技术演进洞察 电商行业的快速发展离不开技术的不断创新。技术的演进不仅是为了追求技术本身的突破更是为了实现更低的成本、更高的效率和更好的用户体验。本节将探讨电商搜索技术的演进历程从文本检索阶段到当前正在经历的大模型阶段以及未来的 AGI 导购助手。 文本检索阶段 在电商搜索技术的初期主要依赖于基础的文本检索技术和规则引擎。这个阶段的核心在于通过关键词匹配实现用户与商品的连接。 规则引擎的应用利用预定义的规则和逻辑初步实现用户搜索需求与商品信息的匹配。 基础文本检索技术通过简单的文本匹配算法检索出与用户搜索词相关的商品。 关键词的人货匹配基于关键词的匹配技术初步实现用户需求与商品的对接。 机器学习阶段 随着数据量的增加和计算能力的提升电商搜索技术进入了机器学习阶段。这一阶段的核心是通过统计 NLP 和机器学习模型提升用户意图理解和商品匹配的准确性。 用户意图理解和商品理解通过统计自然语言处理技术更加精准地理解用户的搜索意图和商品属性。 基于 ML 的 CTR/CVR 建模利用机器学习模型预测点击率CTR和转化率CVR优化搜索结果的排序。 LTR 排序模型通过学习排序LTR模型进一步提升搜索结果的相关性。 用户反馈数据学习利用用户的搜索和点击反馈数据不断优化和调整搜索算法形成基于数据驱动算法迭代闭环。 深度学习阶段 深度学习的兴起带来了电商搜索技术的又一次飞跃。通过深度神经网络DNN电商平台能够更为精准地理解用户意图和商品信息并实现多模态的搜索交互。 基于 DNN 的意图 / 商品精准理解提升分发准确率利用深度神经网络模型提升用户意图和商品信息的理解精度增强泛化效果从而提高搜索结果的准确性。 以文本 语音 图像的新搜索交互支持用户通过文本、语音和图像进行搜索提供更加丰富的交互方式。 ANN 语义召回、多模态召回和 DNN 匹配技术通过近似最近邻ANN算法进行语义召回结合多模态召回和 DNN 匹配技术提升搜索结果的相关性和多样性。 个性化搜索 千人千面根据用户历史行为和偏好提供个性化的搜索结果实现千人千面的搜索体验。 大模型阶段 当前电商搜索技术正在经历大模型阶段。基于大模型的技术不仅提升了用户理解和商品理解的深度和长尾泛化性能还实现了更加智能的交互方式。 交互上单向引导到对话式交互导购从传统的单向搜索引导发展到对话式的交互导购提供更加智能和自然交互的购物体验。 基于大模型的用户理解和商品理解解决长尾问题利用大模型技术提升对用户需求和商品信息的理解特别是解决长尾商品的推荐问题。 大模型生成式检索技术在召回和相关性上大模型也正在重构整个技术架构包括极具有颠覆潜力的大模型生成式检索技术的探索和应用。 AGI 导购助手阶段 展望未来电商搜索技术将进入 AGI 导购助手阶段。这个阶段的核心是通过完全 AGI 技术驱动实现多模态交互和 AI Agent 式购物服务。 完全 AGI 技术驱动利用人工通用智能AGI技术全面提升电商搜索和推荐的智能化水平。 完全多模态交互支持文本、语音、图像等多种交互方式提供更加自然和便捷的购物体验。 AI Agent 式购物服务通过 AI Agent 提供个性化的购物建议和服务提升用户的购物体验。 人格化数字虚拟助理打造具有人格化特征的数字虚拟助理为用户提供更加贴心的购物服务。 2. 大模型电商场景下的问题 2.1 大模型的技术优势 近年来随着人工智能技术的迅猛发展大模型在各个领域展现出了卓越的技术优势。大模型不仅在语言理解和生成方面表现出色还在知识总结、迁移学习、逻辑推理以及多语言多模态建模等方面展现出了强大的能力。以下将详细阐述大模型的五大技术优势。 强大的语言理解和生成能力 大模型的一个显著优势在于其强大的语言理解和生成能力。大模型能够准确地理解复杂的语言结构和语义关系从而实现高质量的文本生成以及指令遵循能力。这种能力不仅体现在自然语言处理NLP任务中还在搜索和推荐对话系统和内容创作中得到了广泛应用。 广泛的知识总结和归纳能力 大模型具备广泛的知识总结和归纳能力能够从海量数据中提取和整合信息形成系统的知识体系。这种能力使得大模型在处理复杂问题时能够提供全面而准确的解答。 显著的迁移学习和多任务能力 大模型在迁移学习和多任务处理方面表现出色。通过迁移学习大模型可以将从一个任务中学到的知识和技能应用到其他相关任务中显著提高了模型的泛化能力和适应性。此外大模型可以基于一个统一模型底座实现多任务学习这种能力在实际应用中具有重要意义。 逻辑推理和分析能力 大模型不仅在数据处理和语言生成方面表现出色还具备一定的逻辑推理和分析能力。通过复杂的模型结构和训练算法大模型能够对输入信息进行深度分析和推理得出合理的结论。这种能力使得大模型在解决复杂问题和做出决策时能够提供有力的支持。 多语言多模态建模 大模型的多语言多模态建模能力使其在处理多语言和多模态数据时表现出色。大模型可以同时处理文本、语音、图像等多种数据形式实现跨模态的信息整合和理解。此外大模型还支持多语言处理能够在不同语言之间进行无缝转换和理解。这种能力在全球化的背景下具有重要意义。 2.2 电商场景下的应用问题 随着大模型技术的不断进步其在电商行业的应用也日益广泛。然而尽管大模型在许多方面展现了强大的潜力电商场景下的实际应用仍面临诸多挑战。本节将深入探讨电商场景下大模型应用的五大主要问题电商知识理解、效果和个性化、时效性、成本和速度以及安全性。 电商知识理解 在电商场景中商品知识的专业性和精确度至关重要。然而通用大模型在这方面表现出了一些不足。 商品知识专业性不足通用大模型在商品类目、品牌和属性等方面的专业性不够难以满足电商平台对商品信息的精细化需求。这导致模型在处理商品相关任务时可能无法提供准确和有用的结果。 通用知识和商品的对齐问题大模型通常基于广泛的通用知识进行训练但这些知识与具体的商品信息之间存在对齐问题。例如模型可能无法正确理解某些商品的特定属性或品牌特征。 图像商品理解差尽管大模型在文本处理方面表现优异但在商品图像商品理解上仍存在显著差距。这限制了其在需要图像识别和处理的电商应用中的效果。 效果和个性化 在电商平台上个性化推荐和精准营销是提升用户体验和促进销售的关键。然而直接应用大模型并未展现出绝对的效果优势。 理解购物历史和偏好大模型在理解用户的购物历史、偏好、评论和商品细节方面面临挑战。个性化推荐需要对用户统计行为进行深度分析而通用大模型在这方面的能力有限。 个性化挑战尽管大模型可以处理大量数据但要实现真正的个性化推荐仍需克服许多技术难题。例如如何在短时间内分析和理解用户的复杂需求并提供精准的商品推荐。 时效性 电商行业的动态性和时效性要求极高而大模型在这方面存在明显的不足。 更新速度慢大模型本身的更新速度较慢导致其知识容易陈旧无法及时反映最新的商品信息、促销活动和价格变动。 高时效性需求电商平台需要实时更新新商品、促销信息和价格变动以确保用户获取最新的商品信息。然而大模型在这方面的更新时效性难以满足电商平台的需求。 成本和速度 大模型的训练和推理成本高昂给电商平台带来了巨大的经济压力。 高训练和推理成本大模型的训练需要大量的计算资源和时间推理过程也消耗大量的计算能力。这使得其在大规模商用中的 ROI投资回报率较低难以广泛应用。 实时性挑战在线推理速度难以满足电商平台的实时性要求尤其是在高并发的购物场景中模型的响应速度成为瓶颈。 安全性 在电商场景中用户数据的安全性和生成内容的合规性至关重要。 用户敏感数据泄露风险大模型在处理用户数据时存在敏感数据泄露的风险。这对用户隐私保护和数据安全提出了严峻挑战。 生成内容的安全合规大模型生成的商品相关内容需要确保安全和合规避免出现虚假信息或不当内容。这对电商平台的内容审核和监管提出了更高要求。 2.3 电商大模型解决方案 基于上述问题分析和大模型优劣势结合我们京东的业务场景我们提出了一整套基于大模型的 AIGC 架构 后面章节讲分别介绍整个 AIGC 框架的关键技术 3. 电商大模型关键技术 3.1 数据和预训练 在大模型的预训练过程中数据预处理是至关重要的一环。特别是在电商领域数据源的多样性和复杂性决定了预处理的质量直接影响到模型的最终效果。 数据预处理 核心去除站外和站内商品相关数据中的噪音提升专有数据的电商知识密度整体流程如下图 预训练数据处理的核心目标是提升电商知识密度为了提升大模型在电商领域的专业性和准确性预处理的核心目标是去除数据中的噪音确保数据的高质量和高相关性。这不仅有助于模型更好地理解商品类目、品牌和属性还能提高模型在实际应用中的表现。 数据预处理的核心流程包括以下几个步骤 文法引擎过滤文法引擎通过分析文本的语法和结构过滤掉不符合语法规则的噪音数据。这一步骤确保了输入数据的基本语法正确性减少了模型处理无效信息的负担。 困惑度评分器困惑度评分器用于评估文本的复杂度和合理性。通过计算文本的困惑度可以识别和过滤掉那些难以理解或不符合常识的内容从而提高数据的质量。 质量评分器质量评分器根据预定义的标准如信息完整性、准确性和相关性对数据进行评分。在技术上一般组合使用多种分类器可基于 CNN 或 Bert 模型进行构建只有那些高质量的数据才会被保留下来用于训练模型。 数据去重分析数据去重分析通过识别和删除重复数据确保训练数据的独特性和多样性可以使用多种去重算法这不仅提高了数据的有效利用率还避免了模型因重复信息而产生的偏差。 基于聚类和分类的过滤通过聚类和分类算法可以将数据按照不同的类别和特征进行分组和筛选。此步骤有助于识别和过滤掉不相关或低质量的数据进一步提升数据的电商知识密度。 安全性过滤安全性过滤确保数据不包含敏感信息或违反隐私和安全规定的内容。这一步骤至关重要特别是在处理用户数据时必须严格遵守相关的法律法规和隐私政策。 数据配比均衡策略数据配比均衡策略通过调整电商知识类数据和通用数据的比例确保训练数据的均衡性和全面性。这有助于模型在电商知识增强上充分训练同时降低对通用能力的损失。 Continue Pretraining 启发于人类学习总是在前人积累的知识和经验上进一步学习我们提出了一种基于知识继承的增量学习方法来持续学习在数据上通过提升电商领域知识密度和配比调整通过模型结构优化退火学习多阶段指令对齐优化增强安全治理对齐等方法提升我们电商大模型的性能表现。 平台和框架 我们的增量学习框架支持基于华为 NPU 集群利用其强大的计算能力和并行处理优势实现高效训练。 底座大模型 采用支持 100B 参数规模的底座大模型并结合 MOEMixture of Experts架构进一步提升模型的表达能力和计算效率。MOE 架构通过动态选择专家网络显著提高了模型的参数利用率和推理效率使其在处理复杂任务时表现更加出色。 参数扩展 为进一步提升模型的性能和适应性我们引入了 Depth Up-Scaling 和 MOE 的参数扩展技术。Depth Up-Scaling 通过增加模型的深度增强其对复杂模式的捕捉能力MOE 扩展则通过增加专家网络的数量和多样性提高模型的泛化能力和鲁棒性。 长上下文扩展 在处理电商相关长上下文数据时我们通过增加长上下文数据的配比并优化分块缓存工程架构显著提升了模型在长序列任务中的表现。 持续预训练 为了实现持续预训练我们采用了 Cosine Learning Rate Scheduler 和退火学习策略并结合数据配比调整确保模型在训练过程中能够逐步适应新的数据和任务。退火学习则通过逐步降低学习率避免模型陷入局部最优解提升模型的整体性能。 3.2 通用对齐和领域对齐 对齐学习不仅可以提升模型在通用任务中的表现还能够在特定领域如电商中增强其专业性和准确性。通用对齐学习旨在优化模型对通用指令的遵循能力使其在广泛的任务中表现出色。同时电商领域对齐学习则专注于增强模型在电商场景中的专业性。 SFT 阶段 在 SFT 阶段模型通过监督学习进行微调。对于通用对齐训练数据涵盖各种通用任务和指令确保模型具备广泛的应用能力。对于电商领域对齐训练数据则包括大量电商相关的任务和指令核心是数据多样性和准确率。为了提升多样性和准确性我们通过对数据进行细粒度的分类标签并利用更大模型对 SFT 数据在复杂度准确性等进一步判断筛选判断最终获取更高指令的对齐数据。 DPO 阶段 在 DPO 阶段模型通过直接偏好优化进行进一步调整。此阶段的目标是提升模型在特定任务中的表现基于用户反馈或专家的直接反馈进行优化。对于通用对齐DPO 阶段通过收集用户对模型输出的偏好反馈调整模型参数使其更符合用户期望。对于电商领域对齐DPO 阶段则通过分析用户在电商平台上的行为和反馈作为偏好依据优化模型在商品推荐和客户服务等方面的表现。 PPO 阶段 PPO 阶段采用近端策略优化方法通过强化学习进一步提升模型的对齐能力。此阶段通过模拟真实环境中的任务和指令执行过程模型在不断试错和优化中学习最佳策略。对于通用对齐PPO 阶段使模型能够在动态和复杂的环境中表现出色具备更强的适应能力。对于电商领域对齐PPO 阶段则通过电商场景中的各种任务中用户行为反馈使模型能够在搜推应用中考虑搜推的 CTR/CVR 等收益。 在实践中也可以利用 KTO 对齐来替代 DPO/PPO。 3.3 安全性 随着大模型在各类应用中的广泛部署其安全性问题日益受到关注。大模型安全性可以从潜在安全事件发生前后进行划分分别为被动安全和主动安全。这两种策略共同构建了一个全面的安全防护体系确保大模型的生成内容在各个方面都是安全和可控的我们设计了一套完整的大模型安全体系 被动安全安全检测服务 被动安全侧重于安全检测服务从检测方向入手确保用户输入的提示词prompt和大模型生成的内容在发布前经过严格的安全审查。具体措施包括 用户输入检测对用户输入的提示词进行实时监控和分析识别并过滤潜在的恶意或不当内容防止其对大模型的生成过程产生不良影响。 生成内容检测对大模型生成的内容进行全面的安全审查检测其中可能存在的幻觉hallucinations、毒性toxicity、偏见bias等问题确保输出内容符合安全和道德标准。 通过这些检测服务可以在潜在安全事件发生前及时发现和处理问题降低风险。 主动安全大模型生成安全性 主动安全则从生成方向着手确保大模型在任何输入情况下都能生成安全可控的回复内容。主要技术手段包括监督微调SFT和基于人类反馈的强化学习RLHF。 监督微调SFT通过在大量标注数据上进行微调训练使大模型学习如何生成符合安全标准的内容。训练数据涵盖各种可能的输入场景和生成要求确保模型具备广泛的安全生成能力。 基于人类反馈的强化学习RLHF通过收集和分析人类对大模型生成内容的反馈不断优化模型的生成策略。RLHF 方法能够动态调整模型参数使其在生成过程中更加注重安全性减少幻觉、毒性和偏见等问题的出现。 主动安全策略不仅在大模型生成内容的过程中进行实时控制还通过持续学习和优化不断提升模型的安全性和可靠性。 被动安全的方法核心是检测主要方法包括 文法规则引擎: 以句法分析模板 词典进行识别侧重关键词特征明显的文本识别 分类模型以 NN 为核心的小模型例如基于 bert 的分类保证一定泛化同时满足实时要求 大模型安全检测通过 SFT 等技术通过大模型来检测为了满足低时延往往小参数 LLM 实现 主动安全算法核心是两种思路 融合路线通用对齐 电商对齐 安全对齐在 SFT 和 DPO 阶段数据融合PPO 阶段 RewardModel 模型融合 两阶段对齐最后单独进行二阶段的安全对齐 3.4 评估体系 电商大模型的评估体系至关重要。为了确保模型在实际应用中的高效性和可靠性我们构建了一套综合性的电商大模型评估体系。该体系涵盖了通用 Benchmark、电商 Benchmark 以及安全性评分等多个维度力求全面、客观地评估模型性能。 通用 Benchmark 评估 通用 Benchmark 评估是衡量大模型在各种标准任务上的表现。我们采用了一系列主流 Benchmark包括以下但不局限 MMLU评估模型在多任务语言理解上的能力。 CMMLU针对中文多任务语言理解的评估。 C-Eval评估模型在中文环境下的综合表现。 GSM8K用于评估模型在数学推理任务上的能力。 GAOKAO模拟中国高考题目评估模型的知识水平和解题能力。 SuperCLUE中文语言理解评估基准。 AlignBench评估模型在对齐任务上的表现。 这些 Benchmark 涵盖了从语言理解到数学推理的多种任务确保模型在广泛应用中的通用性和鲁棒性。 电商 Benchmark 评估 为了更好地服务于电商应用我们专门构建了电商 Benchmark。该 Benchmark 与电商应用任务高度对齐评估模型在电商场景中的具体各种任务表现。评估方法包括自动评估和人工评估 自动评估利用自动化工具和算法快速评估模型在电商任务中的表现裁判模型我们使用 GPT4 作为参考。 人工评估由专业评估人员对模型生成的内容进行人工审核确保评估结果的准确性和可靠性。 通过电商 Benchmark我们可以深入了解模型在电商领域的实际应用效果并进行针对性优化。 安全性评估 安全性是大模型评估中的重要一环。我们通过以下评估集合和指标进行安全性评分 CValues评估模型输出内容的安全性和合规性。 Safety-Prompts使用特定的安全提示词测试模型在处理敏感话题时的表现。 自建安全评估集基于实际应用场景构建专门的安全评估数据集。 安全性 score 计算公式为Score 安全回复数量 / 总回复数量或总 prompt 数量 此外我们还关注错误拒答率FRR即大模型误判良性提问场合的概率。 4. 电商搜索场景下大模型应用实践 在电商搜索场景中大模型能够显著提升用户体验和搜索效率。以下将介绍大模型在电商搜索中的实践应用。 4.1 搜索交互 在电商平台上搜索交互是用户找到满意商品的关键环节。通过大模型的应用我们可以实现更智能的 query 引导帮助用户更快地找到所需商品同时降低交互成本提升搜索效率。 大模型在以下几个方面发挥了重要作用 Query 引导通过智能引导帮助用户优化搜索词提高搜索结果的相关性和满意度。 交互成本降低减少用户在搜索过程中的操作步骤提高搜索效率。 转化率提升通过精准的搜索结果引流提升用户的购买转化率。 难点和挑战 尽管大模型在搜索交互中具有显著优势但也面临一些难点和挑战 传统方法局限传统的搜索方法主要依赖于召回和排序利用 SMT统计机器翻译和 NMT神经机器翻译技术优化链路较长且噪音大。 语言理解挑战处理歧义、多义词和个性化需求是搜索交互中的主要难点传统方法难以全面解决这些问题。 准确性和泛化效果在保证搜索结果准确性的同时提升模型的泛化效果仍然是一个难题。 这里以以纠错 /Sug 等为例说明基于大模型的通用方案 应用核心在于 电商知识增强将电商领域的专业知识融入大模型中使其能够更准确地理解和处理用户的搜索需求。 业务任务对齐结合具体的业务任务对大模型进行优化使其在搜索交互中表现更佳。 搜索交互日志利用利用历史搜索交互日志优化模型的对齐目标提升搜索效果。 Multi-Instruction Learning通过多指令学习增强模型应对多样化搜索需求的能力。 4.2 电商用户意图理解 在电商平台中意图理解是提升用户体验和转化率的关键环节。通过解决用户需求表达与商品语义对齐的问题我们能够提高商品召回的相关性和多样性最终提升用户转化率UCVR。本节将探讨电商意图理解的目标、方向以及面临的问题和挑战并介绍基于电商大模型的核心技术解决方案。 电商意图理解的主要目标是 解决用户需求表达与商品语义对齐问题确保用户输入的搜索 query 能够准确匹配到相关商品。 提升商品召回的相关性和多样性提供高相关搜索结果的同时保证结果的多样性满足不同用户的需求。 提升用户转化率UCVR通过优化搜索体验和结果提高用户的购买转化率。 意图理解的方向 为了实现上述目标意图理解需要在以下几个方向上进行优化 Query 理解 分词将用户输入的搜索词进行合理的分词处理提升理解精度。 实体识别识别搜索 query 中的关键实体如品牌、型号等。 类目预测预测用户搜索的商品类别提升召回精度。 品牌识别识别并理解用户搜索中的品牌信息。 改写对用户输入的 query 进行智能改写优化搜索结果。 需求识别理解用户的具体需求如购买意图、用途等。 商品理解 商品 SKU 理解深入理解商品的 SKU 信息提升匹配度。 商品图像理解通过多模态大模型图像识别技术理解商品图片内容。 SKU-to-Query实现商品 SKU 信息与用户搜索 query 的精准匹配。 问题和挑战 在意图理解的过程中面临以下主要问题和挑战 Query 理解 传统方法局限传统方法主要依赖于规则和基于 BERT 的二分类或多分类、序列标注算法优化成本高且难以处理长尾问题。 长尾问题用户输入的多样化和个性化需求难以全面覆盖。 商品理解 泛化能力差商品理解的泛化能力较弱难以适应多变的商品信息。 图像理解准确率低基于 OCR 的商品图像理解准确率不高影响搜索结果的精度。 基于电商大模型的意图理解核心技术 为了应对上述问题和挑战基于电商大模型的意图理解技术应运而生 我们的大模型应用方案是一个多层体系架构包括底层平台层 NPU 平台和 GPU 平台NPU 是一华为昇腾 910B 为主的第二算力平台GPU 以 A100/H800 为主模型底座包括文本大模型和多模态大模型基于大模型底座我们做了模型扩展和电商知识增强预训练再通过多任务增强对齐学习构建了我们的电商大模型最上层是应用层包括 prompt 工程进一步结合具体业务场景的对齐以及蒸馏萃取技术在时效性个性化方便核心是通过 RAG 技术实现的包括电商知识图谱 RAGWeb 搜索 RAG以及用户画像 RAG 其核心技术包括 Instruction Learning通过指令对齐学习提升模型对多样化需求的理解和处理能力。 搜索用户反馈用于强化学习利用用户搜索行为和反馈数据对模型进行强化学习持续优化搜索效果。 RAGRetrieval-Augmented Generation 知识图谱 -RAG结合知识图谱增强模型对商品信息的理解和匹配能力。 用户画像 -RAG利用用户画像提升个性化推荐和搜索结果的精准度。 Web 搜索 RAG 基于公网搜索信息解决时效性相关知识问题。 4.3 文案创意生成 在电商平台中文案创意是吸引用户关注、提升商品曝光率和转化率的关键因素。然而传统的文案生成过程往往需要大量的人力和时间成本。随着人工智能技术的进步利用大模型的生成能力可以有效降低商品素材的生成成本提升营销转化效率。本节将探讨电商文案创意生成的具体应用场景和关键技术。 文案创意生成的应用场景 商品标题生成 SKU 描述 - 标题通过分析 SKU 描述信息自动生成简洁明了、富有吸引力的商品标题。 SKU 描述 SKU 图像 - 标题结合 SKU 描述和商品图像生成更加精准和视觉化的商品标题。 商品文案生成 SKU 描述 场景 - 营销文案基于 SKU 描述和特定使用场景生成富有创意和吸引力的营销文案帮助商品更好地触达目标用户。 SKU 描述 SKU 图像 - 图文文案结合 SKU 描述和商品图像生成图文并茂的商品文案提升用户的阅读体验和购买欲望。 卖点生成 SKU 商详 - 卖点从商品详情中提取核心卖点帮助用户快速了解商品的主要优势。 SKU 商详 卖点 - 卖点文案结合商品详情和提炼的卖点生成详细的卖点文案进一步增强商品的吸引力。 关键技术 为了实现高效且高质量的文案创意生成以下关键技术至关重要 图文语义对齐学习通过先进的图文语义对齐技术确保商品图像与文字描述之间的高度一致性提升生成文案的准确性和相关性。 商品图文数据构建构建高质量的商品图文数据集作为训练多模态大模型的基础。通过大量真实商品数据的训练使模型能够更好地理解和生成符合实际需求的文案。 4.4 电商搜索相关性 在电商平台中搜索相关性是影响用户体验和购买转化率的关键因素。如何精准匹配用户需求与商品信息直接关系到用户的搜索满意度和最终的购买决策。本节将探讨电商搜索相关性的核心问题、主流模型以及面临的技术挑战。 核心问题 电商搜索的核心问题在于如何实现用户需求与商品的精准匹配。这一问题最终可以归结为计算用户搜索 query 与商品 SKU 之间的相关性即 sim(query, sku)。在优化过程中不仅要考虑搜索结果的相关性还需要兼顾点击率CRT和转化率CVR等关键指标以实现整体效益的最大化。 主流模型 目前基于神经网络NN的语义相关性模型在电商搜索中得到了广泛应用主要分为两大类 孪生网络Siamese Network也称双塔模型孪生网络通过两个或多个共享参数的子网络来处理输入的 query 和 SKU。每个子网络独立地将输入映射到一个高维向量空间然后计算这两个向量的相似度。这种方法的优点在于计算效率高适用于大规模的在线搜索场景。 交互式匹配Interactive Matching也称单塔模型交互式匹配模型在处理 query 和 SKU 时允许输入之间进行复杂的交互操作。这种模型能够捕捉到更丰富的语义关系从而提升匹配的精度。尽管计算复杂度较高但在高精度需求的场景中表现出色。 问题与挑战 尽管当前的模型在提升搜索相关性方面取得了显著进展但仍面临一些重要的技术挑战 长尾泛化效果存在瓶颈在电商平台上用户的搜索需求具有高度的多样性和个性化特别是长尾搜索 query。这些长尾 query 往往缺乏足够的训练数据导致模型在处理长尾需求时的泛化效果较差。 超长上下文理解有限用户的搜索 query 有时包含复杂的上下文信息特别是超长 query。现有模型在处理这些超长上下文时理解能力有限难以准确捕捉用户的真实意图从而影响搜索结果的相关性。 基于大模型的解决方案 基于大模型的相关性提升方案逐渐成为研究热点。业界主要有两种主要的相关性提升方案Prompt 工程应用结合数据增强蒸馏以及增强预训练结合相关性对齐。 方案一Prompt 工程应用 数据增强蒸馏 Prompt 工程应用 是一种通过设计和优化输入提示prompts来引导大模型生成更准确和相关的输出的方法。在电商搜索场景中精心设计的 prompts 可以帮助模型更好地理解用户的搜索意图而不需要后训练从而提升搜索结果的相关性。 数据增强蒸馏 则是通过生成更多高质量的训练数据来提升模型的泛化能力。利用调试优化好的大模型 prompt 工程来标注数据再通过蒸馏技术将这些数据整合到模型的训练过程中。 通过结合 Prompt 工程和数据增强蒸馏这一方案能够在有限的数据和算力条件下显著提升模型的搜索相关性特别是在处理复杂和长尾 query 时表现尤为突出。 方案二增强预训练 相关性对齐 增强预训练 是指在模型预训练阶段引入更多领域相关的数据和任务以提升模型对特定领域的理解能力。在电商搜索场景中可以通过引入大量商品描述、用户评论和搜索日志等数据进行预训练使模型能够更好地理解商品和用户需求之间的关系。 相关性对齐 则是在模型训练过程中通过设计特定的损失函数和优化策略使得模型输出的相关性评分更符合实际需求。具体来说可以通过引入多任务学习、对比学习等方法使模型在学习商品相关性的同时兼顾点击率CRT和转化率CVR等关键指标核心是需要考虑搜索系统的收益。 5. 下一代 AI 电商搜索 在当前的电商系统中无论是传统的货架电商还是新兴的内容电商在整个购物消费链路中其核心驱动力依然是搜索和推荐技术。 仍然面临着诸多痛点 成本用户交互成本高需要精准的关键词表达才能容易找到所需商品用户购买决策成本高搜索结果通常是一个长长的 SKU 列表用户需要多次点击查看商品详情增加了决策难度和时间成本。 效率传统搜推技术转化链路长且低效长尾搜索结果不相关或无结果导致搜索效率低下用户难以找到符合需求的商品。 体验交互方式受限主要依赖于单向的 query 输入会存在用户在多个平台之间跳转增加了购物的复杂性和不便。 为了彻底解决这些痛点理想的下一代 AI 电商搜索应在技术和产品形态上实现全面革新 具体表现为以下几个方面 技术驱动下一代 AI 电商搜索应完全由大模型或 AGI 技术驱动。在技术上能够更深刻地理解用户需求并提供高度个性化的搜索和推荐服务 数字虚拟助理产品形态上下一代 AI 电商搜索应类似于电影《Her》中出现的超级 AI 助手。这个数字虚拟助理能够与用户进行全模态的自然语言交互包括无障碍的流畅语音交互并且具备听觉、视觉和空间感知等能力。 精准商品推荐基于用户需求数字虚拟助理可以直接推荐最匹配的商品并给出精准的商品总结解释为什么这些商品满足用户需求性价比如何等。对于需求不明的用户助理可以进行拟人的交互式导购帮助用户明确需求然后推荐。 智能代理通过 AI Agent 技术数字虚拟助理可以在用户授权下自动完成下单包括后续的物流和售后服务。用户只需要下达简单的命令助理即可完成整个购物流程极大地简化了用户的操作。 下一代 AI 电商搜索不仅在技术上实现了从传统搜索到智能搜索的飞跃更在用户体验上进行了全面的革新。通过大模型和 AGI 技术的驱动结合数字虚拟助理的产品形态用户将享受到更加精准、便捷和高效的购物体验我想这应该是理想的 AI 电商搜索产品形态。
http://www.w-s-a.com/news/182609/

相关文章:

  • .net做的网站代码网站怎么加二级域名
  • 网站建设方案对比分析报告成都短视频代运营
  • 企业所得税税率知多少重庆seo什么意思
  • ftp如何修改网站备案号百度云建站
  • 免费做网站空间dede二手车网站源码
  • 网站服务器需要多大设计网站公司开发
  • asp 网站权限设计做网站业务员
  • 做棋牌网站违法嘛网络服务网络推广
  • 专门做推广的网站吗免费建域名网站
  • 在百度做网站株洲网站平台搭建
  • 用node做的网站南宁网站定制开发
  • 做刷单网站犯法吗wordpress depth
  • 潍坊青州网站建设少儿编程app
  • 表白网站制作源代码自己怎么免费做网站网页
  • 开源网站建设是什么工作个人虚拟网站
  • 网站制作的一般过程优化关键词排名公司
  • 如何使用阿里云建设网站网站两边广告
  • 互联网信息服务小红书seo是什么意思
  • 深圳市南山区建设局网站公司简介网页
  • 免费小程序制作软件爱站网站seo查询工具
  • 承接电商网站建设缔烨建设公司网站
  • 网站运营介绍十大国外室内设计网站
  • 网站建设完毕后怎么加后台电影购买网站怎么设计
  • 空间ip地址访问网站音乐分享 wordpress
  • 做网站一单能挣多少wordpress主题文件夹在哪
  • 视频社区app源码台州优化网站
  • 保定高端网站建设做微商好还是开网站好
  • 有什么方法在淘宝发布网站建设设计wordpress评分
  • 自己做的网站怎么爬数据库酷播wordpress
  • 广州哪家做网站还可以黑龙江省建设厅网站的电话