当前位置: 首页 > news >正文

网站开发运营工程师待遇智慧景区网站建设

网站开发运营工程师待遇,智慧景区网站建设,网站建设花费录什么费用,网站建设预估费用es自2020年的8.x版本以来#xff0c;就提供了机器学习的能力。我们可以使用es官方提供的工具eland#xff0c;将hugging face上的NLP模型#xff0c;上传到es集群中。利用es的机器学习模块#xff0c;来运维部署管理模型。配合es的管道处理#xff0c;来更加便捷的处理数据… es自2020年的8.x版本以来就提供了机器学习的能力。我们可以使用es官方提供的工具eland将hugging face上的NLP模型上传到es集群中。利用es的机器学习模块来运维部署管理模型。配合es的管道处理来更加便捷的处理数据。 但是在国内操作根据官方文档或者根据官方博客操作有无穷无尽的坑。看着官方的文档写的很清楚实际上操作的时候还是操作不下来。这里写一个闭坑指南。 在你上车体验ES的机器学习之前看看我这篇文章肯定是会有收获的。因为我已经花了时间踩了坑并解决了它。 上传模型存在的坑 第一个坑是es的机器学习是收费的功能白金版才能使用。这里需要开启试用才能用试用期限为一个月。如果只是体验一个月已经足够了。体验效果不错就可以找老板花钱了。不过网上也有很多绿色的方案可以用不推荐有法律风险特别是商用开启白金试用需要开启xpack安全认证开启用户认证在kibana上登录的时候要使用elastic用户登录否则无法开启试用会告诉你无权限。网络环境问题。如果你能开启科学上网肯定可以避免问题。但是即使有科学上网也只是体验一下。并不是生产实践方案生产环境通常都是在内网环境下即使能上网也肯定是在国内网络环境下。这会有各种各样的问题。所以要做我们就做生产环境版本要做就做离线版本。举一个最简答的例子国内的网络很难访问huggingface去拉取模型。 这里是我直接使用eland上传模型的时候遇到的错误。 docker run -it   -v /u01/isi/.cache/huggingface/hub/:/usr/local/bin/eland_import_hub_model  --rm elastic/eland \ eland_import_hub_model \ --url http://elastic:12312310.99.100.49:9200 \ --hub-model-id sentence-transformers/clip-ViT-B-32-multilingual-v1 \ --task-type text_embedding \ --start报错为无法访问huggingface.co 国内域名污染导致的。如果可以挂代理可以解决。如果没有代理则看下边离线安装版本 2023-11-22 09:40:30,738 INFO : Establishing connection to Elasticsearch 2023-11-22 09:40:30,751 INFO : Connected to cluster named es (version: 8.8.0) 2023-11-22 09:40:30,752 INFO : Loading HuggingFace transformer tokenizer and model sentence-transformers/clip-ViT-B-32-multilingual-v1 HTTPSConnectionPool(hosthuggingface.co, port443): Max retries exceeded with url: /sentence-transformers/clip-ViT-B-32-multilingual-v1/resolve/main/tokenizer_config.json (Caused by ConnectTimeoutError(urllib3.connection.HTTPSConnection object at 0x7f50eb16cc10, Connection to huggingface.co timed out. (connect timeout10))) thrown while requesting HEAD https://huggingface.co/sentence-transformers/clip-ViT-B-32-multilingual-v1/resolve/main/tokenizer_config.json 2023-11-22 09:40:41,125 WARNING : HTTPSConnectionPool(hosthuggingface.co, port443): Max retries exceeded with url: /sentence-transformers/clip-ViT-B-32-multilingual-v1/resolve/main/tokenizer_config.json (Caused by ConnectTimeoutError(urllib3.connection.HTTPSConnection object at 0x7f50eb16cc10, Connection to huggingface.co timed out. (connect timeout10))) thrown while requesting HEAD https://huggingface.co/sentence-transformers/clip-ViT-B-32-multilingual-v1/resolve/main/tokenizer_config.json HTTPSConnectionPool(hosthuggingface.co, port443): Max retries exceeded with url: /sentence-transformers/clip-ViT-B-32-multilingual-v1/resolve/main/config.json (Caused by ConnectTimeoutError(urllib3.connection.HTTPSConnection object at 0x7f50eb16cfd0, Connection to huggingface.co timed out. (connect timeout10))) thrown while requesting HEAD https://huggingface.co/sentence-transformers/clip-ViT-B-32-multilingual-v1/resolve/main/config.json 2023-11-22 09:40:51,583 WARNING : HTTPSConnectionPool(hosthuggingface.co, port443): Max retries exceeded with url: /sentence-transformers/clip-ViT-B-32-multilingual-v1/resolve/main/config.json (Caused by ConnectTimeoutError(urllib3.connection.HTTPSConnection object at 0x7f50eb16cfd0, Connection to huggingface.co timed out. (connect timeout10))) thrown while requesting HEAD https://huggingface.co/sentence-transformers/clip-ViT-B-32-multilingual-v1/resolve/main/config.json Traceback (most recent call last):File /usr/local/lib/python3.9/dist-packages/transformers/utils/hub.py, line 409, in cached_fileresolved_file  hf_hub_download(File /usr/local/lib/python3.9/dist-packages/huggingface_hub/utils/_validators.py, line 118, in _inner_fnreturn fn(*args, **kwargs)File /usr/local/lib/python3.9/dist-packages/huggingface_hub/file_download.py, line 1291, in hf_hub_downloadraise LocalEntryNotFoundError( huggingface_hub.utils._errors.LocalEntryNotFoundError: Connection error, and we cannot find the requested files in the disk cache. Please try again or make sure your Internet connection is on.During handling of the above exception, another exception occurred:Traceback (most recent call last):File /usr/local/bin/eland_import_hub_model, line 219, in moduletm  TransformerModel(model_idargs.hub_model_id, task_typeargs.task_type, es_versioncluster_version, quantizeargs.quantize)File /usr/local/lib/python3.9/dist-packages/eland/ml/pytorch/transformers.py, line 613, in __init__self._tokenizer  transformers.AutoTokenizer.from_pretrained(File /usr/local/lib/python3.9/dist-packages/transformers/models/auto/tokenization_auto.py, line 634, in from_pretrainedconfig  AutoConfig.from_pretrained(File /usr/local/lib/python3.9/dist-packages/transformers/models/auto/configuration_auto.py, line 896, in from_pretrainedconfig_dict, unused_kwargs  PretrainedConfig.get_config_dict(pretrained_model_name_or_path, **kwargs)File /usr/local/lib/python3.9/dist-packages/transformers/configuration_utils.py, line 573, in get_config_dictconfig_dict, kwargs  cls._get_config_dict(pretrained_model_name_or_path, **kwargs)File /usr/local/lib/python3.9/dist-packages/transformers/configuration_utils.py, line 628, in _get_config_dictresolved_config_file  cached_file(File /usr/local/lib/python3.9/dist-packages/transformers/utils/hub.py, line 443, in cached_fileraise EnvironmentError( OSError: We couldnt connect to https://huggingface.co to load this file, couldnt find it in the cached files and it looks like sentence-transformers/clip-ViT-B-32-multilingual-v1 is not the path to a directory containing a file named config.json. Checkout your internet connection or see how to run the library in offline mode at https://huggingface.co/docs/transformers/installation#offline-mode.官方指定的向es中导入NLP模型的工具是Eland下载和构建镜像也是有网络问题这里需要指定国内的镜像源。关于从hugging face上拉取NLP模型的问题。使用eland它可以根据我们指定的模型id去hugging face上拉取模型但是还是国内的网络环境问题死活拉不下来。因为无法访问huggingface域名。目前截止到2023年12月2号为止。es所谓的机器学习能力仅支持文本类操作的模型。官方一直在说拥有跨模态的能力。实际上es并不支持将图片转向量的模型导入到es中例如常用的CLIP多模态模型其实它是两部分双塔模型一个是将图片做embedding转成向量。另一个模型是将我们的文本内容做embedding转为向量。其中图片转向量的模型在es中是不支持上传的文本转向量的模型是可以上传的。如下所示上传clip 将图片转为向量的模型。会报错 docker run -it -v /u01/isi/.cache/huggingface/hub/sentence-transformers/clip-vit-base-patch32:/eland/sentence-transformers/clip-vit-base-patch32 --rm elastic/eland \ eland_import_hub_model \ --url http://elastic:12312310.99.100.49:9200 \ --hub-model-id sentence-transformers/clip-vit-base-patch32 \ --task-type text_embedding \ --start 报错如下 准备工作 1. 需要搭建一个8.8以上版本的ES集群。默认会开启安全访问认证不要关它。 2. 使用源码构建eland工具 3. 从huggingface上离线下载NLP模型 4. 将模型上传到构建eland的服务器上 安装Elasticsearch 和kibana 这里参看以下文章跟着搭建集群就可以了其实我整个导入的过程也是参考的这篇文章只是在国内安装遇到了上述的坑。 Elasticsearch如何在 Elastic 中实现图片相似度搜索_es 相似度查询_Elastic 中国社区官方博客的博客-CSDN博客 搭建的es版本8.8.0 一定要开安全认证不然无法开启机器学习的试用无法导入模型 需要kibana 开启试用 可以看到模型 安装准备Eland eland是如何工作的 Eland 可以从huggingFace上把模型下载下来并上传导es中。如下图所示 应该如何安装eland 这里提供在线的方式和离线的方式。 Eland 可以通过 pip 从 PyPI 安装 在安装之前我们需要安装好自己的 Python。 $ python --version Python 3.10.2可以使用 Pip 从 PyPI 安装 Eland python -m pip install eland 可以使用 Conda 从 Conda Forge 安装 Eland conda install -c conda-forge eland Docker容器的方式来使用它 希望在不安装 Eland 的情况下使用它为了只运行可用的脚本可以构建 Docker 容器。个人认为这种方式是最符合生产环境的部署方式。易交付。可以移植不依赖网络环境可以提前构件好然后将eland镜像导入。 第一步需要需要在有网的环境下下载源码。可以将源码上传到有docker环境的服务器上。如果没有docker环境可以以最简单的方式来安装docker这里就不提供方法了可以网上搜搜文章是在不行麻烦麻烦运维同事 # 下载源码 git clone https://github.com/elastic/eland# 这里可以把源码上传到有docker环境的且能够访问到es集群的服务器上。 cd eland这里注意因为是在国内我们先pass掉挂代理的事情并不一定每个人都能挂代理 这里需要先编辑一下dockerFile添加指定国内的源。添加如下一行 RUN python3 -m pip install --no-cache-dir --disable-pip-version-check .[all] -i https://mirror.baidu.com/pypi/simple#然后构建镜像 docker build -t elastic/eland .在huggingface上下载所需的NLP模型 在huggingface上找到该模型。这里可以根据自己的需求找到合适的模型这里我以CLIP的模型为例这个是clip中做文本embedding的模型来下载。 https://huggingface.co/sentence-transformers/clip-ViT-B-32-multilingual-v1/tree/main 全部下载下来 然后上传到有eland的服务器上 使用eland 将离线模型导入到es集群中 我是以docker的方式来运行eland的。  这次主要是加里一个数据卷我把下载后的模型放在了 /u01/isi/.cache/huggingface/hub/sentence-transformers/clip-ViT-B-32-multilingual-v1 下然后加了一个数据拒卷。把模型映射到了容器中。这里因为服务器无法访问huggingface去拉取模型。所以用离线的方式。eland会在运行过程中检查本地有没有模型如果有模型就不用去huggingface上拉取了。 注意eland的挂载目录docker中映射的是/eland/目录这样才能读到本地下载好的模型 docker run -it   -v /u01/isi/.cache/huggingface/hub/:/eland/   --rm elastic/eland \ eland_import_hub_model \ --url http://elastic:12312310.99.100.49:9200 \ --hub-model-id sentence-transformers/clip-ViT-B-32-multilingual-v1 \ --task-type text_embedding \ --start可以看到这里已经成功的导入模型了。 然后在kiabna上找到模型管理刷新一下。 已经成功刷新了出来 测试使用模型 对内容进行文本嵌入在kiban上执行以下内容。点击D旁边的菜单栏找到 Dev tools POST _ml/trained_models/sentence-transformers__clip-vit-b-32-multilingual-v1/_infer {docs : [{text_field: Yellow mountain is the most beautiful mountain in China}] } 可以看到成功应用模型将文本内容转成了向量。
http://www.w-s-a.com/news/522197/

相关文章:

  • asp官方网站微信模板素材
  • wordpress 留言给站长发邮件做百度推广员赚钱吗
  • 北京建站公司做网站价格专门找人做软件的网站
  • 商务网站的特点ui软件界面设计
  • 广州个性化网站开发网站索引量是什么意思
  • 公司网站制作专业公司python做后台网站的多吗
  • 桂林建站平台哪家好给别人做网站怎么收取费用
  • python做网站显示表格用visual做的网站
  • 彩票网站建设需要什么聊城网站建设首选天成网络
  • 安徽建设工程网站wordpress标签云代码
  • 推荐佛山顺德网站建设手机网站建设域名空间
  • 电子商务网站建设策划书例子企业官网用什么cms系统
  • 网站栏目设计怎么写平面设计接单报价表
  • 做网站美工要学什么网站推广的方法包括
  • 哪个网站可以做笔译兼职wordpress加表单
  • 百度站内搜索 wordpress微餐饮建站费用
  • 用什么做网站的访问量统计制作手工作品
  • 微信公众号搭建网站河南卫生基层系统网站建设
  • steam账号注册网站重庆手机版建站系统哪家好
  • 中新生态城建设局门户网站wordpress云盘视频播放
  • 大型网站开发基本流程wordpress记录用户搜索
  • 云服务器安装win系统做网站wordpress边栏扩大尺寸
  • 网站开发面试自我介绍软件下载网站如何建设
  • 可以做翻译任务的网站陕西省建设厅八大员证
  • 昆明 网站推广重庆网页优化seo公司
  • 网站排名下降怎么上去设计一套app页面多少钱
  • 专门用来查找网址的网站查公司名字是否被注册
  • 自己创建网站教程河南省建设厅官方网站李学军
  • 一个网站需要多少容量怎样免费设计网站建设
  • 建设工程交易中心网站12306的网站是哪个公司做的