贵阳做网站好的公司有哪些,湛江做网站公司,一线互联网公司有哪些,网站开发简历目录 1、下载训练脚本2、 下载模型2.1、申请下载权限2.2、模型下载 3、模型微调3.1、使用单卡微调3.2、使用多卡训练#xff1a; 1、下载训练脚本
首先我们从github上下载Llama 2的微调代码#xff1a;GitHub - facebookresearch/llama-recipes: Examples and recipes for L… 目录 1、下载训练脚本2、 下载模型2.1、申请下载权限2.2、模型下载 3、模型微调3.1、使用单卡微调3.2、使用多卡训练 1、下载训练脚本
首先我们从github上下载Llama 2的微调代码GitHub - facebookresearch/llama-recipes: Examples and recipes for Llama 2 model
执行命令
git clone https://github.com/facebookresearch/llama-recipes
cd llama-recipes下载完成之后安装对应环境执行命令
pip install -r requirements.txt2、 下载模型
在这里我补充一下模型下载权限的申请
2.1、申请下载权限
需先在Meta上申请权限国家选中国不行要选其他国家 https://ai.meta.com/resources/models-and-libraries/llama-downloads/
申请的邮箱必须是跟huggingface注册邮箱一致
申请完权限之后你会收到邮件 然后再去HuggingFace上submit权限申请连接在下面 https://huggingface.co/meta-llama/Llama-2-7b-hf
打开后点击提交
提交后还要等待仓库作者的确认请求将在 1-2 天内得到处理
实测大概一个小时会有邮件通知已授权邮件如下 然后回到HuggingFace
点击头像-setting-Access Tokens 里面获取tokens 没有的话就自己创建一个token也就是点击new token再把创建的token复制下来
2.2、模型下载
有了权限就可以从HuggingFace上下载模型https://huggingface.co/meta-llama
打开可看到模型有多个 这里我们选择Llama-2-7b-hf
通过代码下载
下面的your token就是要填从你自己的HuggingFace复制下来的token根据上面的步骤走过来你已经申请过权限了所以token可用 import huggingface_hubhuggingface_hub.snapshot_download(meta-llama/Llama-2-7b-hf,local_dir./Llama-2-7b-hf,tokenyour token
)import huggingface_hubhuggingface_hub.snapshot_download(meta-llama/Llama-2-7b-hf,local_dir./Llama-2-7b-hf,token**********************
)3、模型微调
3.1、使用单卡微调
#创建模型输出文件
mkdir output# 使用单卡
export CUDA_VISIBLE_DEVICES0#开始训练
python llama_finetuning.py --use_peft --peft_method lora --quantization --model_name Llama-2-7b-hf --output_dir output3.2、使用多卡训练
比如多GPU单节点 torchrun --nnodes 1 --nproc_per_node 4 examples/finetuning.py --enable_fsdp --use_peft --peft_method lora --model_name /path_of_model_folder/7B --fsdp_config.pure_bf16 --output_dir path/to/save/PEFT/model