当前位置: 首页 > news >正文

网站是如何建立的外包网页

网站是如何建立的,外包网页,东营市住房和城乡建设局网站,wordpress的图片存在哪里课件链接#xff1a;https://cloud.189.cn/t/VNvmyimY7Vna#xff08;访问码#xff1a;e4cb#xff09;天翼云盘是中国电信推出的云存储服务#xff0c;为用户提供跨平台的文件存储、备份、同步及分享服务#xff0c;是国内领先的免费网盘#xff0c;安全、可靠、稳定、…课件链接https://cloud.189.cn/t/VNvmyimY7Vna访问码e4cb天翼云盘是中国电信推出的云存储服务为用户提供跨平台的文件存储、备份、同步及分享服务是国内领先的免费网盘安全、可靠、稳定、快速。天翼云盘为用户守护数据资产。https://cloud.189.cn/t/VNvmyimY7Vna%EF%BC%88%E8%AE%BF%E9%97%AE%E7%A0%81%EF%BC%9Ae4cb%EF%BC%89 原始数据来源于本课程的课件 RAG.pdf 文件需要Python解析pdf文件主要使用智谱清言的 embedding-3 将文本转向量化存储到 ChromaDB向量数据库中将向量查询的结果投喂给DeepSeek的deepseek-chat模型由它根据向量查询结果来回答用户提问。 .env文件 OPENAI_API_KEYsk-a6******9d OPENAI_BASE_URLhttps://api.deepseek.com/v1 OPENAI_MODELdeepseek-chat ZHIPU_BASE_URLhttps://open.bigmodel.cn/api/paas/v4/ ZHIPU_API_KEY4923c4dae*******lTGEx7 EMBEDDING_MODELembedding-3 启动向量数据库 chroma run --host 127.0.0.1 --port 5333 --path db_data 初始化 from openai import OpenAI from dotenv import load_dotenv import os import chromadb from chromadb.config import Settingsload_dotenv()# 将 api_key 传入到 openAI 当中 client OpenAI() ai_model os.getenv(OPENAI_MODEL) embed_model os.getenv(EMBEDDING_MODEL)from pdfminer.high_level import extract_pages from pdfminer.layout import LTTextContainerdef get_completion(prompt, modelai_model):封装 openai 接口messages [{role: user, content: prompt}]response client.chat.completions.create(modelmodel,messagesmessages,temperature0,)return response.choices[0].message.contentdef build_prompt(prompt_template, **kwargs):将 Prompt 模板赋值prompt prompt_templatefor k, v in kwargs.items():if isinstance(v, str):val velif isinstance(v, list) and all(isinstance(elem, str) for elem in v):val \n.join(v)else:val str(v)prompt prompt.replace(f__{k.upper()}__, val)return prompt 提示词 prompt_template 你是一个问答机器人。 你的任务是根据下述给定的已知信息回答用户问题。 确保你的回复完全依据下述已知信息。不要编造答案。 如果下述已知信息不足以回答用户的问题请直接回复我无法回答您的问题。 已知信息: __INFO__ 用户问 __QUERY__ 请用中文回答用户问题。解析pdf文件 def extract_text_from_pdf(filename, page_numbersNone, min_line_length1):从 PDF 文件中按指定页码提取文字paragraphs []ids []id_counter 0buffer full_text # 提取全部文本for i, page_layout in enumerate(extract_pages(filename)):# 如果指定了页码范围跳过范围外的页if page_numbers is not None and i not in page_numbers:continuefor element in page_layout:if isinstance(element, LTTextContainer):full_text element.get_text() \n# 按空行分隔将文本重新组织成段落lines full_text.split(\n)for text in lines:if len(text) min_line_length:buffer ( text) if not text.endswith(-) else text.strip(-)elif buffer:paragraphs.append(buffer)ids.append(fid{id_counter})buffer id_counter 1if buffer:paragraphs.append(buffer)ids.append(fid{id_counter})results {documents: paragraphs, ids: ids}return resultsparagraphs extract_text_from_pdf(RAG.pdf, page_numbers[4, 5],min_line_length10) 文本转向量函数 def get_embeddings(texts, modelembed_model):embedClient OpenAI(api_keyos.getenv(ZHIPU_API_KEY),base_urlos.getenv(ZHIPU_BASE_URL))data embedClient.embeddings.create(inputtexts, modelmodel).datareturn [x.embedding for x in data] 向量数据库连接器 class MyVectorDBConnector:def __init__(self, collection_name, embedding_fn):chroma_client chromadb.HttpClient(host127.0.0.1,port5333,)self.embedding_fn embedding_fnself.collection chroma_client.get_or_create_collection(namecollection_name)self.documents []def add_documents(self, contents):self.collection.add(embeddingsself.embedding_fn(contents.get(documents)),documentscontents.get(documents),idscontents.get(ids),)def search(self, query, top_n):results self.collection.query(query_embeddingsself.embedding_fn([query]),n_resultstop_n)return results# 创建一个向量数据库对象 vector_db MyVectorDBConnector(demo, get_embeddings) # 向向量数据库中添加文档 vector_db.add_documents(paragraphs) RAG机器人 class RAG_Bot:def __init__(self, vector_db, llm_api, n_results2):self.vector_db vector_dbself.llm_api llm_apiself.n_results n_resultsdef chat(self, user_query):# 1. 检索search_results self.vector_db.search(user_query, self.n_results)# 2. 构建 Promptprompt build_prompt(prompt_template, infosearch_results[documents][0], queryuser_query)# 3. 调用 LLMresponse self.llm_api(prompt)return response# 创建一个 RAG 机器人 bot RAG_Bot(vector_db,llm_apiget_completion ) 最后提问 # 用户查询 user_query 常用的向量数据库有哪些 response bot.chat(user_query) print(response) 运行效果
http://www.w-s-a.com/news/883924/

相关文章:

  • 单县网站建设优化大师电脑版官网
  • 番禺区住房和建设局物业网站浦东新区网站设计
  • 外贸网站外包WordPress仿牌
  • 如何设计网站logohtml5开发
  • 金坛建设银行总行网站网站开发费用如何记账
  • 贵阳企业网站设计制作湛江知名网站建设电话
  • 网站建设安全性高清效果图网站
  • 上海网站排名推广黄山公司做网站
  • 全国网站建设公司实力排名单页面网站建设
  • 网站建设方案 规划wordpress 要备案吗
  • 一个完整的网站 技术网站建设中 敬请期待.
  • 如何建一个公司的网站网上怎么推广公司产品
  • 十大旅游电子商务网站影楼网站制作
  • 深圳网站建设代理商网业打开慢的原因
  • 旅游网站经营模式在屈臣氏做网站运营
  • 做管理信息的网站com域名查询
  • 免费推广网站推荐外贸推广平台哪个好
  • 腾宁科技做网站399元全包企业校园网站建设
  • 海外医疗兼职网站建设公司取名字大全免费
  • 龙口市规划建设局网站vi设计和品牌设计的区别
  • 企业网站的总体设计网站建设评审验收会议主持词
  • 网站建设完成推广响应式网站设计开发
  • 电商网站用php做的吗网站开发流程可规划为那三个阶段
  • flash网站怎么做音乐停止深圳网站建设金瓷网络
  • 哪个网站可以做房产信息群发怎么做国内网站吗
  • 微商城网站建设公司的价格卖磁铁的网站怎么做的
  • 免费做做网站手机平台软件开发
  • 网站单页做301徐州百度网站快速优化
  • 织梦怎么制作手机网站漳州专业网站建设公司
  • 邓州做网站网络优化概念