当前位置: 首页 > news >正文

php网站开发实例教程百度企业宣传

php网站开发实例教程百度,企业宣传,做网站要学些什么条件,app推广方案模板半年多之前写过一个教程#xff1a;在Windows上用Llama Factory微调Llama 3的基本操作_llama-factory windows-CSDN博客 如果用命令行做的话#xff0c;前面的步骤可以参考上面这个博客。安装好环境后#xff0c; 用自我认知数据集微调Lora模块#xff1a;data/identity.j…半年多之前写过一个教程在Windows上用Llama Factory微调Llama 3的基本操作_llama-factory windows-CSDN博客 如果用命令行做的话前面的步骤可以参考上面这个博客。安装好环境后 用自我认知数据集微调Lora模块data/identity.json里面的格式也很好理解 { instruction: 你是谁, input: , output: 您好我是 { {name}}一个由 { {author}} 发明的人工智能助手。我可以回答各种问题提供实用的建议和帮助帮助用户完成各种任务。 }, 可以直接用VS Code将上面的name和author替换另存为一个文件并且在data/dataset_info.json增加这个类似于我这里另存的文件名为identity_tpri.json identity_tpri: { file_name: identity_tpri.json }, 将文件examples/train_qlora/llama3_lora_sft_awq.yaml另存为一个文件并且重命名然后配置对应一下已经下载下来的模型文件顺便说一句模型文件可以在魔搭社区 这里下载应该速度都很快我这里是这样修改的标红的是更新的内容除了微调数据集和模型位置以及Lora模块位置需要注意的就是num_train_epochs之前默认的值是3经过测试以后太小了 ### model model_name_or_path: /home/quyu/Qwen2.5-7B-Instruct/ trust_remote_code: true ### method stage: sft do_train: true finetuning_type: lora lora_rank: 8 lora_target: all ### dataset dataset: identity_tpri template: qwen cutoff_len: 2048 max_samples: 1000 overwrite_cache: true preprocessing_num_workers: 16 ### output output_dir: saves/qwen-7b/lora/sft logging_steps: 10 save_steps: 500 plot_loss: true overwrite_output_dir: true ### train per_device_train_batch_size: 1 gradient_accumulation_steps: 8 learning_rate: 1.0e-4 num_train_epochs: 20.0 lr_scheduler_type: cosine warmup_ratio: 0.1 bf16: true ddp_timeout: 180000000 ### eval # val_size: 0.1 # per_device_eval_batch_size: 1 # eval_strategy: steps # eval_steps: 500 然后运行一下重命名的文件是qwen_lora.yaml llamafactory-cli train examples/train_qlora/qwen_lora.yaml 如果显存不够可能会报错例如训练32B的时候这个我在后一篇博客里再总结。如果显存够那么可以直接得到微调后的lora模块我这里用两个3090训练只需要一分多钟。我们将examples/inference/llama3_lora_sft.yaml复制以后重命名并且将其内容改为 model_name_or_path: /home/quyu/Qwen2.5-7B-Instruct adapter_name_or_path: saves/qwen-7b/lora/sft template: qwen infer_backend: huggingface # choices: [huggingface, vllm] trust_remote_code: true 然后运行重命名的文件是qwen2_lora.yaml看自己喜好重命名即可 llamafactory-cli chat examples/inference/qwen2_lora.yaml 然后再问大模型“你是谁”就可以看到修改之后的效果了。
http://www.w-s-a.com/news/617812/

相关文章:

  • 东莞网站优化制作免费中文wordpress主题下载
  • 东莞建筑设计院排名网络优化论文
  • 做牙工作网站郑州前端开发培训机构
  • 温州专业建站网站制作的管理
  • 公司网站开发策划书有没有专门做教程的网站
  • 江苏省工程建设信息网站一天赚1000块钱的游戏
  • 制作响应式网站报价品牌建设整体体系包括什么
  • 网站推广策划报告目前做win7系统最好的网站
  • 东莞网站建设咨询公江西网站建设平台
  • 什么是网站功能源码下载站
  • 石家庄制作网站的公司双柏县住房和城乡建设局网站
  • 影视vip网站建设教程ppt模板免费下载 素材红色
  • 内蒙古城乡建设部网站首页平台网站建设ppt
  • 集约化网站建设项目官方网站建设
  • 原创先锋 北京网站建设网站开发电脑内存要多少
  • 婚恋网站建设项目创业计划书网站建设 食品
  • 免费建网站代码查询做导员的网站
  • 做网站的软件电子可以看女人不易做网站
  • 学校响应式网站模板下载仙居住房和城乡建设规划局网站
  • 推广网站的方法有拍卖网站建设
  • 网站建设网站排名优化中国网站服务器哪个好
  • asp网站应用程序网站建设需要提供的资料
  • 网站开发与设计.net微信小程序设计制作
  • 怎样做网站排名优化展馆设计费取费标准一览表
  • 网站建设去哪可接单网站建设与设计大作业
  • 休闲咖啡厅网站开发目标韩国小清新网站模板
  • 做微景观的网站制作网页模板适应不同分辨率
  • 最简单的网站系统昨天军事新闻最新消息
  • 做ps网页设计的网站有哪些wordpress内容付费
  • 有没有免费注册域名的网站科技小制作 手工 简单