当前位置: 首页 > news >正文

郑州艾特网站建设公司在哪里进行网站域名的实名认证

郑州艾特网站建设公司,在哪里进行网站域名的实名认证,建设银行网银网站特色,游戏介绍网站模板背景介绍 在前一篇文章 RAG 项目对比 之后#xff0c;确定 Dify 目前最合适的 RAG 框架。本次就尝试在本地 GPU 设备上部署 Dify 服务。 Dify 是将模型的加载独立出去的#xff0c;因此需要选择合适的模型加载框架。调研一番之后选择了 Xinference#xff0c;理由如下确定 Dify 目前最合适的 RAG 框架。本次就尝试在本地 GPU 设备上部署 Dify 服务。 Dify 是将模型的加载独立出去的因此需要选择合适的模型加载框架。调研一番之后选择了 Xinference理由如下 支持多种类型的模型包括 LLMEmbedding, Rerank, Audio 等多种业务场景的模型需求一个框架全搞定方便的模型管理能力提供可视化页面快速部署模型支持直接从 ModelScope 下载模型避免 huggingface 被墙的问题 本文是 Dify 与 Xinference 最佳组合的 GPU 设备部署流程。为了充分利用 nvidia GPU 的能力需要先安装显卡驱动CUDA 和 CuDNN这部分网上的教程比较多了大家可以自行搜索参考安装安装时需要注意版本需要与自己的 GPU 显卡版本匹配。 Dify 部署 参考 Dify 官方文档 进行安装。 首先需要下载 Dify 对应的代码: git clone https://github.com/langgenius/dify.git之后创建环境变量文件 .env, 根据需要进行修改之后就可以基于 docker compose 启动 cd dify/docker cp .env.example .env docker compose up -d默认访问 http:// 应该就可以看到 Dify 的页面。 docker 镜像问题 实际执行镜像拉取时发现Docker hub 因为监管的原因已经无法访问了。为了解决这个问题目前相对可行的方案 利用一些目前可用的镜像服务当前2024-7-11可用的是 public-image-mirror通过修改本地的镜像下载地址进行加速利用 Github Action 将镜像拉取至个人阿里云的的私有镜像仓库可以参考 教程 实际为了简单直接采用方案 1在本地文件 /etc/docker/daemon.json 中添加 {registry-mirrors: [https://docker.m.daocloud.io] }如果上面的地址不可用可以尝试另一个测试可用的地址 {registry-mirrors: [https://docker.anyhub.us.kg] }修改之后执行下面命令重启 docker 服务 sudo systemctl daemon-reload sudo systemctl restart docker接下来就可以正常拉取镜像了。 Xinference 部署 XInference 的部署也选择基于 docker 部署可以参考 XInference 部署实际使用的部署命令为: docker run -e XINFERENCE_MODEL_SRCmodelscope -v local model path:/models -e XINFERENCE_HOME/models -p 9998:9997 --gpus all registry.cn-hangzhou.aliyuncs.com/xprobe_xinference/xinference:latest xinference-local -H 0.0.0.0各位使用时将上面命令行中的 local model path 替换为期望服务器上模型存储的路径即可 上面的命令利用 XINFERENCE_MODEL_SRCmodelscope 指定了模型最终是从 modelscope 下载的这样国内下载模型镜像的速度比较快。 上面的命令会将 docker 中的 9997 端口映射至本地的 9998 端口部署完成后访问 http://server ip:9998/ui 就可以看到 XInference 可视化页面有需要可以调整服务器上实际占用的端口。 docker GPU 不可用 上面的命令实际执行时会报错 docker: Error response from daemon: could not select device driver with capabilities: [[gpu]]., docker 目前是不能直接使用 GPU 设备的。 此时需要参考 Nvidia 文档 安装 nvidia-container-toolkit 首先需要先补全 apt-get 下载源 curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \ curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \sed s#deb https://#deb [signed-by/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g | \sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list接下来更新源安装对应的包 sudo apt-get update sudo apt-get install -y nvidia-container-toolkit安装完成之后修改 docker 配置文件 /etc/docker/daemon.json {default-runtime: nvidia,runtimes: {nvidia: {path: nvidia-container-runtime,runtimeArgs: []}} }之后执行 sudo systemctl restart docker 重启 docker。 此时再执行上面的 docker run 命令去使用 GPU 设备就没问题了。 Dify 模型配置 上述服务配置好之后就可以在 Xinference 下载所需的模型XInference 启动后实际会占用服务器上的 9998。因此访问 http://server ip:9998/ui 就可以进入可视化页面下载所需的模型 在 Xinference 上下载和运行所需的模型后可以返回 Dify 可视化页面在 Dify 的设置页中配置对应的模型对应的页面如下所示 RAG 一般情况下需要配置上 LLM, Text Embedding 和 Rerank 模型。配置完成后就可以自由玩耍了。 总结 本文是实际部署 Dify Xinference 组合的完整流程实际上如果 docker 可用的话整体的流程还是比较丝滑的。期望给后面折腾 Dify 部署的一些帮助减少重复的踩坑。
http://www.w-s-a.com/news/979848/

相关文章:

  • wordpress仿站视频教程wordpress用什么php版本好
  • 郑州做网站九零后网络沧州做网站的专业公司
  • 小游戏网站建设可以自己做图片的软件
  • 湖南地税局官网站水利建设基金app仿制
  • 苏州网站设计kgwl建设网站需要用到哪些技术人员
  • 万户网络做网站如何亚马逊网站建设
  • 门户网站制作费用暴雪公司最新消息
  • 深圳专业建网站公司济南公司做网站的价格
  • 怎么运行自己做的网站网上申请平台怎么申请
  • 旅游公司网站 优帮云新闻近期大事件
  • 电商网站后台报价营销软文小短文
  • 网站建设项目售后服务承诺公司名称邮箱大全
  • 湖南网站建设哪里好做ppt的网站叫什么名字
  • 容城县建设银行网站电子商务网站建设子项目
  • 网站管理助手3.0做淘宝网站用什么软件做
  • 贵阳做网站的公司wordpress趣味插件
  • 自己设置免费网站设计平台南京哪里有做公司网站的
  • 建设公司内网网站的意义自助建站网站的宣传手册
  • 手机建设中网站建立个人网站服务器
  • 网站开发工程师岗位概要网站怎么制作教程
  • 城乡建设主管部门官方网站公司简介模板ppt范文
  • 网站认证必须做么cc0图片素材网站
  • net域名 著名网站国外设计案例网站
  • 淘宝客网站哪里可以做app地推网
  • 宜昌建设厅网站中国最新时事新闻
  • 微网站怎么开发wordpress 发表评论
  • 山东网站建设是什么一页网站首页图如何做
  • 游戏开发与网站开发哪个难万网影
  • 做网站编程语言建筑施工特种证书查询
  • 找人做网站内容自己编辑吗修改wordpress登陆界面