当前位置: 首页 > news >正文

建筑公司网站建设wordpress搭建博客 简书

建筑公司网站建设,wordpress搭建博客 简书,广州最新黄码区域地图,做网站怎么做付费推广Llama 2是开源LLM发展的一个巨大里程碑。最大模型及其经过微调的变体位居Hugging Face Open LLM排行榜#xff08;https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard#xff09;前列。多个基准测试表明#xff0c;就性能而言#xff0c;它正在接近GPT-3.5…        Llama 2是开源LLM发展的一个巨大里程碑。最大模型及其经过微调的变体位居Hugging Face Open LLM排行榜https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard前列。多个基准测试表明就性能而言它正在接近GPT-3.5在某些情况下甚至超过它。所有这些都意味着对于从RAG系统到Agent的复杂LLM应用程序开源LLM是一种越来越可行和可靠的选择。 一、Llama-2–7B不擅长从文本到SQL 最小的Llama 2模型7B参数有一个缺点是它不太擅长生成SQL因此它不适用于结构化分析示例。例如我们尝试在给定以下提示模板的情况下提示Llama 2生成正确的SQL语句 You are a powerful text-to-SQL model. Your job is to answer questions about a database. You are given a question and context regarding one or more tables. ​You must output the SQL query that answers the question.​### Input:{input}​### Context:{context}​### Response: 在这里我们使用sqlcreatecontext数据集https://huggingface.co/datasets/b-mc2/sql-create-context的一个示例来测试一下效果 input: In 1981 which team picked overall 148?context: CREATE TABLE table_name_8 (team VARCHAR, year VARCHAR, overall_pick VARCHAR) 同时这里是生成的输出与正确输出的对比 Generated output: SELECT * FROM table_name_8 WHERE 1980 YEAR AND TEAM Boston Celtics ORDER BY OVERALL_PICK DESC LIMIT 1;​Correct output: SELECT team FROM table_name_8 WHERE year 1981 AND overall_pick 148 这显然并不理想。与ChatGPT和GPT-4不同原始的Llama 2不能生成期望的的格式和正确的SQL。 这正是微调的作用所在——如果有一个合适的文本到SQL数据的语料库我们可以教Llama 2更好地从自然语言生成SQL输出。微调有不同的方法可以更新模型的所有参数比如全量微调也可以冻结大模型参数仅微调附加参数比如LoRA。 二、微调Llama-2–7B使其可以从文本生成SQL 接下来我们将展示如何在文本到SQL数据集上微调Llama 2然后使用LlamaIndex的功能对任何SQL数据库进行结构化分析。 准备工作 微调数据集来自Hugging Face的b-mc2/sql-create-contexthttps://huggingface.co/datasets/b-mc2/sql-create-context base模型OpenLLaMa 的open_lama_7b_v2https://github.com/openlm-research/open_llama 步骤1加载微调LLaMa的训练数据 PS1以下代码来自doppel-bothttps://github.com/modal-labs/doppel-bot2许多Python代码都包含在src目录中3需要设置一个Modal帐户并生成token。 !pip install -r requirements.txt 首先我们使用Modal加载b-mc2/sql-create-context数据集并将其格式化为.jsonl文件。 modal run src.load_data_sql --data-dir data_sql 结果如下所示 # Modal stubs allow our function to run remotelystub.function( retriesRetries( max_retries3, initial_delay5.0, backoff_coefficient2.0, ), timeout60 * 60 * 2, network_file_systems{VOL_MOUNT_PATH.as_posix(): output_vol}, cloudgcp,)def load_data_sql(data_dir: str data_sql): from datasets import load_dataset​ dataset load_dataset(b-mc2/sql-create-context)​ dataset_splits {train: dataset[train]} out_path get_data_path(data_dir)​ out_path.parent.mkdir(parentsTrue, exist_okTrue)​ for key, ds in dataset_splits.items(): with open(out_path, w) as f: for item in ds: newitem { input: item[question], context: item[context], output: item[answer], } f.write(json.dumps(newitem) \n) 步骤2运行微调脚本 在微调数据集微调llama2模型代码如下 modal run src.finetune_sql --data-dir data_sql --model-dir model_sql 微调脚本会执行以下步骤 将数据集拆分为训练和验证拆分 train_val data[train].train_test_split(test_sizeval_set_size, shuffleTrue, seed42)train_data train_val[train].shuffle().map(generate_and_tokenize_prompt)val_data train_val[test].shuffle().map(generate_and_tokenize_prompt) 将每个拆分为元组的格式输入Prompt、标签输入query和上下文被格式化为输入Prompt然后对输入Prompt和标签进行 tokenize模型采用自回归的方法预测下一个token来进行训练。 def generate_and_tokenize_prompt(data_point): full_prompt generate_prompt_sql( data_point[input], data_point[context], data_point[output], ) tokenized_full_prompt tokenize(full_prompt) if not train_on_inputs: raise NotImplementedError(not implemented yet) return tokenized_full_prompt PS输入Prompt与开始测试llama2的格式完全相同。 运行微调脚本时模型将保存在model_dir指定的远程云目录中如果未指定则设置为默认值。 步骤3评估微调后模型 该模型已经进行了微调可以从云端提供服务。下面我们使用b-mc2/sql-create-context中的示例数据进行一些基本评估比较微调后模型与原始Llama 2模型的性能。 modal run src.eval_sql::main 结果表明微调后的模型有了巨大的改进 Input 1: {input: Which region (year) has Abigail at number 7, Sophia at number 1 and Aaliyah at number 5?, context: CREATE TABLE table_name_12 (region__year_ VARCHAR, no_5 VARCHAR, no_7 VARCHAR, no_1 VARCHAR), output: SELECT region__year_ FROM table_name_12 WHERE no_7 abigail AND no_1 sophia ANDno_5 aaliyah}Output 1 (finetuned model): SELECT region__year_ FROM table_name_12 WHERE no_7 abigail AND no_1 aaliyah AND no_5 sophiaOutput 1 (base model): SELECT * FROM table_name_12 WHERE region__year 2018 AND no_5 Abigail AND no_7 Sophia AND no_1 Aaliyah;​​Input 2: {input: Name the result/games for 54741, context: CREATE TABLE table_21436373_11 (result_games VARCHAR, attendance VARCHAR), output: SELECT result_games FROM table_21436373_11 WHERE attendance 54741}Output 2 (finetuned model): SELECT result_games FROM table_21436373_11 WHERE attendance 54741Output 2 (base model): SELECT * FROM table_21436373_11 WHERE result_games name AND attendance 0; 步骤4将微调模型与LlamaIndex集成 我们现在可以在LlamaIndex中使用这个模型在任何数据库上进行文本到SQL。 我们首先定义一个测试SQL数据库然后可以使用该数据库来测试模型的推理能力。 我们创建了一个玩具city_stats表其中包含城市名称、人口和国家信息并用几个示例城市填充它。 db_file cities.dbengine create_engine(fsqlite:///{db_file})metadata_obj MetaData()# create city SQL tabletable_name city_statscity_stats_table Table( table_name, metadata_obj, Column(city_name, String(16), primary_keyTrue), Column(population, Integer), Column(country, String(16), nullableFalse),)metadata_obj.create_all(engine) 这存储在cities.db文件中。 然后我们可以使用Modal将微调后的模型和该数据库文件加载到LlamaIndex中的NLSQLTableQueryEngine中——该查询引擎允许用户轻松地开始在给定的数据库上执行文本到SQL。 modal run src.inference_sql_llamaindex::main --query Which city has the highest population? --sqlite-file-path nbs/cities.db --model-dir model_sql --use-finetuned-model True 我们得到如下回复 SQL Query: SELECT MAX(population) FROM city_stats WHERE country United StatesResponse: [(2679000,)] 三、结论 本文提供了一种非常高级的方法来开始微调生成SQL语句的Llama 2模型并展示了如何使用LlamaIndex将其端到端插入到文本到SQL工作流中。 参考文献 [1] https://blog.llamaindex.ai/easily-finetune-llama-2-for-your-text-to-sql-applications-ecd53640e10d [2] https://github.com/run-llama/modal_finetune_sql [3] https://github.com/run-llama/modal_finetune_sql/blob/main/tutorial.ipynb
http://www.w-s-a.com/news/583025/

相关文章:

  • 网站开发需要公司做网站费用计入什么科目
  • 网站优化有哪些类型免费制作app的傻瓜软件
  • 如何做网站咨询wordpress get
  • 企业网站建设网站做网站用别人的图片
  • 站长统计代码个人网站源代码
  • 求推荐专门做借条的网站公众号排版编辑器
  • 动态做网站网站开发语言查询 蔡学镛
  • 莆田网站建设创意自助建站英文
  • cms系统创建静态网站龙岗网站建设哪家好
  • 自己做的网站被封了邢台规划局网站建设
  • 网站建设项目合同wordpress主题没法用
  • 个旧市哪里有做网站wordpress内页php页面
  • 程序员接活的平台网站互联网平台建设方案
  • 网站安全建设模板深圳企业管理咨询公司
  • 做网站 还是淘宝店wordpress分类链接后加
  • wordpress腾讯云 COSseo内容优化心得
  • 特价旅游机票网站建设i营销
  • 如何成立网站深圳创业项目
  • 建设商业网站惠州网站建设推荐乐云seo
  • 如何申请免费域名做网站免费推广神器
  • 自媒体人专用网站安岳网站建设
  • 特乐网站建设做网站推广要多少钱
  • 山东省建设安全生产协会网站义乌跨境电商公司前十名
  • 做网站优化就是发文章吗起飞页自助建站平台的特点
  • 做网站还是做app好慈溪机械加工网
  • 上传下载文件网站开发的php源码腾讯企点
  • 给分管领导网站建设情况汇报怎么写网络运营的岗位职责及任职要求
  • 电线电缆技术支持中山网站建设广告设计培训学校有哪些
  • 如何禁止通过ip访问网站wordpress无法调用主题布局和图片
  • 江西建设工程信息网站重庆网站推广大全