当前位置: 首页 > news >正文

怎么建设自己导购网站物流公司网站建设

怎么建设自己导购网站,物流公司网站建设,建一个信息网站多少钱,焦作网站建设哪家公司好作者#xff1a;朱杰、奚悦、黄宇 AI 和搜索的整合已成为下一代搜索引擎的发展趋势#xff0c;技术革新的浪潮下#xff0c;你是否想抓住搜索领域的新机会#xff0c;增强 AI 产品力与技术竞争力#xff1f; 想学习搜索引擎技术的你#xff0c;是否面临这样的困惑…作者朱杰、奚悦、黄宇 AI 和搜索的整合已成为下一代搜索引擎的发展趋势技术革新的浪潮下你是否想抓住搜索领域的新机会增强 AI 产品力与技术竞争力 想学习搜索引擎技术的你是否面临这样的困惑 初学实操搭建缺少指导解惑刚起步就困在原地对基础搜索不够了解怎样构建更高阶的搜索应用自学搜索引擎难度大工作中也没有实操的机会向量检索、多模态搜索、混合搜索只听过没用过不知从哪入手 加入 Elasticsearch 训练营从全文检索到向量检索搭建高频业务场景构建进阶向量检索应用。带你拓展技术视野晋升 Elasticsearch 搜索实战派。 立即学习 搜文本搜位置搜图片玩转Elasticsearch-阿里云开发者社区-阿里云 学习专属权益 基础学习环境新用户免费试用阿里云检索分析服务 Elasticsearch 版一个月打卡拿周边完成指定打卡任务可获得Elastic社区周边结业赢好礼完成参营学习任务赢阿里云开发者社区定制礼品 循序渐进的场景实战 Elasticsearch 基础检索 包含业务场景中高频应用的【全文检索】同时可拓展学习【多语言检索】和【地理位置查询】 基于 Elasticsearch 向量检索的以文搜图 实现图片和文本的跨模态相似性比对检索搭建基于向量检索的以文搜图的搜索服务原型 【以文搜图】实验课程先览 1. 以文搜图的实现原理 区别于传统的文本关键词搜索现代的文本语义搜索、相似图片搜索、还有文本搜索图片的跨模态搜索普遍采用向量相似搜索的方式来实现。基本原理是将文本、图片通过深度学习模型映射到一个高纬度的向量空间然后通过衡量向量的相似程度就可以找到最相关的文本或者图片。 下面就分 5 个方面详细讲解文本搜索图片、图片搜索图片应用所需的每个组件的基本概念和技术细节 嵌入模型把要搜索的数据转化为向量的机器学习模型推理APIElastic 中调用模型进行推理的 API生成图像嵌入调用嵌入模型将图像转化为向量向量搜索通过向量最近邻搜索实现相似性搜索应用逻辑前端程序与后端向量搜索引擎 Elasticsearch 通信 嵌入模型 要将相似性搜索应用于自然语言或图像数据你需要使用机器学习模型将数据转换为数值表示也称为向量嵌入embeddings。在这个例子中 NLP “transformer” 模型将自然语言转化为向量。OpenAI CLIP对比语言-图像预训练模型对图像进行向量化。 NLPTransformer 模型是经过训练处理自然语言数据的机器学习模型例如语言翻译、文本分类或命名实体识别。他们接受了大量的带注释文本数据集的训练以学习人类语言的模式和结构。 图像相似性应用程序根据文本、自然语言描述找到匹配的图像。要实现这种相似性搜索你需要一个在文本和图像上都经过训练并且可以将文本查询转换为向的模型。 CLIP 是 OpenAI 开发的一种可以处理文本和图像的大规模语言模型。给定一小段文本作为输入该模型被训练来预测图像的文本表示。这涉及到将图像的视觉 和文本表示关联起来的学习过程然后才能进行准确的预测。 CLIP 的另一个重要方面是它是一个“零样本”模型允许它执行没有经过专门训练的任务。例如它可以对训练期间从未见过的语言进行翻译或者将图像分类到以前从未见过的类别中。这使得 CLIP 成为一个非常灵活和通用的模型。 推理 API 一旦将 NLP 模型加载到 Elasticsearch 中你就可以处理实际的用户查询。首先你需要使用 Elasticsearch_infer API 将查询文本转换为向量。该 API 提供了一种在 Elastic 中原生使用 NLP 模型的内置方法不需要查询外部服务从而显著简化了实施。 POST _ml/trained_models/sentence-transformers__clip-vit-b-32-multilingual-v1/deployment/_infer {docs: [{text_field: A mountain covered in snow}] } 生成图像嵌入 上面提到的图像嵌入对于图像相似性搜索的效果至关重要。它们应该存储在一个单独的索引中该索引包含图像向量在上面的代码中称为 your-image-index。 该索引由每个图像的文档以及上下文字段和图像的密集向量组成。图像向量表示低维空间中的图像。相似的图像被映射到这个空间中的附近点。原始图像可能有几 MB 大具体取决于其分辨率。 如何生成这些向量的具体细节可能会有所不同。一般来说这个过程涉及从图像中提取特征然后使用数学函数将它们映射到低维空间。该函数通常在大量图数据集上进行训练以学习在低维空间中表示特征的最佳方式。生成向量是一项一次性任务。 在这个项目中我们将使用 CLIP 模型。你可能需要为专门的用例训练自定义嵌入模型以实现所需的性能具体取决于你要分类的图像类型在用于训练 CLIP 模型的公开可用数据中的表现程度。 Elastic 中的嵌入生成需要在数据写入时发生步骤如下 加载 CLIP 模型。对于每个图像加载图像。使用模型评估图像。将生成的向量保存到文档中。将文档保存到 Elasticsearch 中。 处理后的文档如下所示。关键部分是存储密集向量表示的字段 image_embedding {_index:my-image-embeddings,_id:_g9ACIUBMEjlQge4tztV,_score:6.703597,_source:{image_id:IMG_4032,image_name:IMG_4032.jpeg,image_embedding:[-0.3415695130825043,0.1906963288784027,.....-0.10289803147315979,-0.15871885418891907],relative_path:phone/IMG_4032.jpeg} } 向量相似度搜索 在使用嵌入模型对查询和文档进行向量化后相似文档是向量空间中查询的最近邻居。实现该目标的一种流行算法是 k 最近邻 (kNN)它找到与查询向量最近 的k个向量。但是对于你通常在图像搜索应用程序中处理的大型数据集kNN 需要非常高的计算资源并可能导致执行时间过长。作为一种解决方案近似最近邻 (ANN) 搜索牺牲了完美的准确性以换取在大规模高维向量空间中高效地执行。 在 Elastic 中_search API 支持精确和近似最近邻搜索。使用下面的代码进行 kNN 搜索。它假定 your-image-index 中所有图像的向量都在 image_embedding 字段中。 # Run kNN search againstquery-embedding obtained above POST your-image-index/_search {fields:[...],knn:{field:image_embedding,k:5,num_candidates:10,query_vector:query-embedding} } 应用逻辑 在这些基本组件的基础上你最终可以将所有部分组合在一起来实现交互式图像相似性搜索。让我们从概念上开始了解当你想要以交互方式检索匹配的图像时 需要发生的事情。 对于文本查询输入可以简单到像 roses 这样的单个词也可以是更广泛的描述如 “a mountain covered in snow”。或者你也可以提供一张图片并要求提供与你图片相似的图片。 尽管你使用不同的模式来查询但两者在底层向量搜索中都是使用相同的步骤执行即对密集向量表示的文档使用 kNN 查询。我们在前面的部分中描述了使 Elasticsearch 能够对大型图像数据集执行非常快速和可扩展的向量搜索的机制。 那么如何实现上述逻辑呢在下面的流程中你可以看到信息是如何流动的用户发出的查询作为文本或图像由嵌入模型向量化——取决于输入类型NLP 模型用于文本描述而 CLIP 模型用于图像。两者都将输入转换为它们的向量表示并将结果存储为 Elasticsearch 中的密集向量类型[number, number, number...]。 然后在 kNN 搜索中使用向量表示来查找相似的向量图像这些向量作为结果返回。 推理用户查询向量化 后台的应用程序会向Elasticsearch中的推理API发送请求。对于文本输入是这样的 POST _ml/trained_models/sentence-transformers__clip-vit-b-32-multilingual-v1/deployment/_infer {docs: [{text_field: Amountaincoveredinsnow}] } 对于图像你可以使用以下简化代码使用 CLIP 模型处理单个图像 model SentenceTransformer(clip-ViT-B-32) image Image.open(file_path) embedding model.encode(image) 你将得到一个 512 长的 Float32 值数组如下所示 {predicted_value: [-0.26385045051574707,0.14752596616744995,0.4033305048942566,0.22902603447437286,-0.15598160028457642,...] } 搜索寻找相似的图片 对于两种类型的输入搜索工作相同。将带有kNN搜索定义的查询发送到带有图像向量 my-image-embeddings 的索引。放入先前查询的密集向量 (”query_vector:  [...]) 并执行搜索 GET my-image-embeddings/_search {knn:{field:image_embedding,k:5,num_candidates:10,query_vector:[-0.19898493587970734,0.1074572503566742,-0.05087625980377197,...0.08200495690107346,-0.07852292060852051]},fields:[image_id,image_name,relative_path],_source:false } Elasticsearch 的响应将根据我们的 kNN 搜索查询为你提供存储在 Elasticsearch 中最匹配的图像。 下面的流程总结了交互式应用程序在处理用户查询时所经历的步骤 加载交互式应用程序它的前端。用户选择他们感兴趣的图像。你的应用程序通过应用 CLIP 模型将图像向量化并将生成的向量存储为密集向量类型。应用程序在 Elasticsearch 中启动 kNN 查询它获取向量并返回其最近的邻居。你的应用程序处理响应并呈现一个或多个匹配图像。 2. 课程实验详情 本实验将阿里云 Elasticsearch 作为支持向量近邻搜索的向量查询引擎结合在 Elasticsearch 实例部署开源模型将查询文本的语义特征向量化的方式将文本和图片映射到同一个向量空间实现图片和文本的跨模态相似性比对检索搭建基于向量检索的以文搜图的搜索服务原型并使用阿里云 Serverless 应用引擎 SAE 实现了前端 web 应用 demo。 说明本实验由阿里云与Elastic公司合作创作实验原始代码来源于 flask-elastic-nlp 项目点击查看 Github 项目地址。 2.1 领取实验产品资源 本实验场景使用的实验资源和配置说明如下 资源规格说明本示例遵循最小原则使用满足场景需求的最小资源。免费试用说明首购客户可以免费试用 Serverless 应用引擎 SAE、传统型负载均衡 CLB 可以使用免费试用资源。付费说明本实验推荐使用阿里云 Elasticsearch 4C8G 规格的按量付费资源计费标准 3.7 元起/时不同地域价格略有差异如果用户没有 SAE 免费试用领取资格推荐使用 SAE2C4G 规格的按量付费资源计费标准为单实例0.0074074 元/min。 具体配置项说明和资源领取步骤请参见 搜文本搜位置搜图片玩转Elasticsearch-阿里云开发者社区-阿里云 2.2 实验步骤 2.2.1 创建配置 Elasticsearch 部分 1. 进入控制台找到 Elasticsearch 所在的地域从实例列表页找到实验需要使用 ES 的实例 2. 点击实例 ID 或 “管理”进入实例详情页可查看ES的实例所在的专有网络、私网地址、私网端口等信息 3. 进入安全配置确认 VPC 私网访问白名单是否包含 ES 实例所在的专有网络的全部网段 专有网络网段可以进入专有网络列表页查看阿里云登录 - 欢迎登录阿里云安全稳定的云计算服务平台 4. 进入可视化控制在修改配置页修改 Kibana 公网访问白名单为本机 IP 5. 点击公网入口进入 Kibana正确输入用户名密码后即可登录。用户名默认为elastic密码为实例创建时输入的自定义密码。 6. 左侧菜单栏 “Management” 进入 “开发工具” 7. 通过快照恢复方式将数据集和模型导入到 ES 实验实例中 1创建快照仓库并指定公共读的阿里云 OSS bucket 作为源存储库 代码 PUT _snapshot/my_backup/ {type: oss,settings: {endpoint: http://oss-rg-china-mainland.aliyuncs.com,bucket: es-image-search,base_path: snapshot/,readonly: true,access_key_id: xxxx,secret_access_key:xxxx,region: oss-rg-china-mainland} } 说明“access_key_id” 和 “secret_access_key” 字段的具体信息请进入课程学习钉群群号28810034388在群公告处获取。 2从公共读的 OSS 中恢复快照到当前实验实例中 代码 POST /_snapshot/my_backup/snapshot_1/_restore {indices: image-embeddings,feature_states: [machine_learning],ignore_unavailable: true,include_global_state: false } 3确认数据已同步完毕 左侧菜单栏 “Management” 进入 “Stack Management”的“ 索引管理”模块确认 “image-embeddings” 和 .ml-inference-native-000001 大小和下图一致 8. 左侧菜单栏 “Analytics” 进入 “Machine Learning” 中 “同步模型” 后进入 “模型管理-已训练模型” 并部署 tips如遇以下网络返回超时报错可忽略关闭报错窗口并刷新模型状态能正常更新为 “started” 即可。 9. 测试模型输入词组或短句该模型可以将文本数据转换成向量数据 该模型支持中英文的文本转换成功转化为向量后说明模型部署成功。 2.2.2 创建和配置 SAE 部分 本步骤仅介绍关键配置项其余配置项保持默认即可。 1. 登录 SAE 控制台。 2.可选在左侧导航栏单击命名空间环境在顶部菜单栏选择华北2北京地域然后在命名空间页面单击创建命名空间在创建命名空间面板配置相关信息单击确定。 配置项教程配置命名空间名称自定义例如输入 demo。命名空间 ID自定义例如输入 demo。描述自定义例如输入测试。 说明如果跳过该步骤在创建应用时步骤4选择默认命名空间则应用创建成功后需要切换 VPC修改为与 Elasticsearch 实例配置一致的 VPC。 3. 在左侧导航栏选择应用管理应用列表然后在应用列表页面单击创建应用。 4. 在创建应用页面配置相关信息。         a.在应用基本信息配置向导配置相关信息然后单击下一步应用部署配置。 配置项教程配置应用名称自定义例如输入 demo。专有网络配置选择自定义配置。命名空间 默认无需手动创建。第一次在默认命名空间内创建应用时系统会自动生成一个 VPC与Elasticsearch 实例配置的 VPC 不一致。因此如果你选择默认方式后续需要在命名空间详情页面切换 VPC。推荐自定义需要手动创建。选择已创建的命名空间并选择与 Elasticsearch 实例配置一致的 VPC。 更多信息请参见管理命名空间。vSwitch选择与 Elasticsearch 实例配置一致的虚拟交换机。安全组选择与 Elasticsearch 实例配置一致的 VPC 绑定的安全组。更多信息请参见创建安全组。应用实例数1VCPU2Core内存4GiB 2. 在应用部署配置配置向导配置相关信息然后单击下一步确认规格。 配置项教程配置技术栈语言选择 Python。应用部署方式选择镜像。配置镜像在配置镜像区域单击Demo镜像页签选择SAE提供的版本为nlp的镜像Demo。完整的镜像地址如下registry-vpc.cn-beijing.aliyuncs.com/sae-serverless-demo/python-demo:nlp环境变量设置 展开环境变量设置区域选择类型为自定义新增3对键值对格式如下 ES_HOSTtestHostES_USERtestUserES_PWDtestPassword 注意事项如下 ES_HOST 可在阿里云 Elasticsearch 控制台的实例基本信息页面获取 ES 实例的私网地址请注意格式为http://es-cn-vxxxxx.elasticsearch.aliyuncs.com:9200ES_USER 和 ES_PWD 为开通 Elasticsearch 时填写的的账户名和密码 4. 页面会跳转至创建完成配置向导你可以单击应用详情页进入基本信息页面。 2.2.3 为 SAE 应用绑定负载均衡 CLB SAE 支持绑定的 SLB为传统型负载均衡 CLBClassic Load Balancer属于阿里云负载均衡 SLBServer Load Balancer支持的负载均衡类型之一 1) 在应用的基本信息页面的应用访问设置区域单击添加公网 SLB 访问。 2. 在添加公网访问 SLB 对话框从请选择 SLB 下拉列表中选择复用已创建的免费试用 CLB 资源优先或者新建 SLB 资源如果没有 CLB 领取资格需要额外付费然后在 HTTP 协议页签HTTP 端口输入 80容器端口输入 5001单击确认。 注意如果你复用已创建的 SLB且需要确保 HTTP 端口和容器端口均未被占用。更多信息请参见 CLB 按量付费。 3. 添加完成后n 可以在公网访问地址栏看到该公网 SLB 的 IP 地址和端口。 4. 在浏览器地址栏中输入上一步获得的 SLB 的 IP 地址:端口并回车访问公网。在如下界面中我们可以在搜索框中输入文字搜索图片或者在图片结果列的“搜索相似图片”按钮搜索相似图片。下图红色框的内容展现了搜索相似图片的实现原理。 原文基于 Elasticsearch 向量检索的以文搜图-阿里云开发者社区
http://www.w-s-a.com/news/746264/

相关文章:

  • 嘉兴网站建设系统免费的seo优化
  • 购书网站开发的意义网站建设接单渠道
  • 网站站内搜索怎么做wordpress默认主题修改
  • 网站推广的表现方式交网站建设 域名计入什么科目
  • 龙岗南联网站建设公司江门市
  • 网站运行方案设计平台模式
  • 网站加入wordpress邳州城乡建设局网站
  • 两个网站如何使用一个虚拟主机东莞市网站seo内容优化
  • 湖南网站建设公司排名傲派电子商务网站建设总结
  • 网站建设求职要求互联网挣钱项目平台
  • 网站权重怎么做做黑彩网站能赚钱吗
  • 三台建设局网站网页设计购物网站建设
  • thinkphp大型网站开发市场调研公司招聘
  • 天宁区建设局网站七冶建设集团网站 江苏
  • 越南网站 后缀湘潭新思维网站
  • 环球旅行社网站建设规划书网钛cms做的网站
  • 软件资源网站wordpress不能识别语言
  • 东坑仿做网站西安私人网站
  • 公司想做个网站怎么办如何搭建视频网站
  • .net网站架设凯里网站建设哪家好
  • seo网站建站建站国外百元服务器
  • 家具网站开发设计论文企业网站里面的qq咨询怎么做
  • 网站视频提取软件app淘宝店购买网站
  • 站长之家域名解析做百度推广网站咱们做
  • 行业 网站 方案莱州网站建设公司电话
  • 丹东谁做微网站威海网络科技有限公司
  • 寻找网站建设_网站外包自助打印微信小程序免费制作平台
  • 台式机网站建设vk社交网站做婚介
  • 创建网站得花多少钱网站建设的技术路线
  • 图书馆网站建设汇报免费编程软件哪个好用