当前位置: 首页 > news >正文

宁波网站优化如何东莞网站建设总结

宁波网站优化如何,东莞网站建设总结,数字营销推广平台,介绍一个软件的步骤karpathy/nanoGPT: The simplest, fastest repository for training/finetuning medium-sized GPTs. (github.com) 原有模型使用的莎士比亚的戏剧数据集, 如果需要一个写唐诗机器人#xff0c;需要使用唐诗的文本数据#xff0c; 一个不错的唐诗#xff0c;宋词数据的下载…karpathy/nanoGPT: The simplest, fastest repository for training/finetuning medium-sized GPTs. (github.com) 原有模型使用的莎士比亚的戏剧数据集, 如果需要一个写唐诗机器人需要使用唐诗的文本数据 一个不错的唐诗宋词数据的下载资源地址 https://github.com/chinese-poet 这个数据集里面包含搜集到的唐诗宋词元曲小说文本数据。 一 数据准备 1. 先下载全唐诗数据保存到 data/poemtext/tang-poetry下 2. 进行数据的预处理 format-data.py # -*- coding: utf-8 -*- import glob import json datas_jsonglob.glob(./tang-poetry/poet*.json) #1匹配所有唐诗json文件for data_json in datas_json[:]: #2处理匹配的每一个文件with open(data_json,r,encodingutf-8) as f:ts_data json.load(f)for each_ts in ts_data[:]: #3处理文件中每段数据只要五言诗和2句的paragraphs_list each_ts[paragraphs]if len(paragraphs_list) 2 and len(paragraphs_list[0])12 and len(paragraphs_list[1]) 12:with open(tang_poet.txt,a,encodingutf-8) as f2:f2.write(.join(paragraphs_list))f2.write(\n)f open(tang_poet.txt,r,encodingutf-8) print(len(f.readlines())) prepare.py import os import requests import tiktoken import numpy as np# download the tiny shakespeare dataset input_file_path os.path.join(os.path.dirname(__file__), tang_poet.txt) with open(input_file_path, r) as f:data f.read() n len(data) train_data data[:int(n*0.9)] val_data data[int(n*0.9):]# encode with tiktoken gpt2 bpe enc tiktoken.get_encoding(gpt2) train_ids enc.encode_ordinary(train_data) val_ids enc.encode_ordinary(val_data) print(ftrain has {len(train_ids):,} tokens) print(fval has {len(val_ids):,} tokens)# export to bin files train_ids np.array(train_ids, dtypenp.uint16) val_ids np.array(val_ids, dtypenp.uint16) train_ids.tofile(os.path.join(os.path.dirname(__file__), train.bin)) val_ids.tofile(os.path.join(os.path.dirname(__file__), val.bin)) 二 配置文件准备 参考   train_shakespeare_char.py 三 开始训练 参考   train_shakespeare_char.py # mac pro m1机器上 python3 train.py config/train_poemtext_char.py --devicemps --compileFalse --eval_iters20 --log_interval1 --block_size64 --batch_size12 --n_layer4 --n_head4 --n_embd128 --max_iters1000 --lr_decay_iters1000 --dropout0.0 四 生成唐诗 python3 sample.py --out_dirout-poemtext-char --devicemps参考 迷你版ChatGPT开源教你怎么用nanoGPT训练一个写小说的AI机器人 - 知乎 (zhihu.com) Gpt进阶(二): 以古诗集为例,训练一个自己的古诗词gpt模型 - 知乎 (zhihu.com)
http://www.w-s-a.com/news/494540/

相关文章:

  • 网站广告是内容营销吗wordpress增加背景图片
  • 网站建设技术jsp课程设计响应式布局网站开发
  • 东莞网站排名优化seo套路网站怎么做的
  • 我做网站网络建站一般多少钱
  • 如何快速提升网站关键词排名房地产网站开发毕业设计
  • 做网站 提交源码 论坛sem分析是什么意思
  • 网站建设与部署阿里云大学百度付费推广有几种方式
  • 作品集怎么做网站个人简历模板免费下
  • 工业网站素材重庆关键词自动排名
  • 拖拽式网站建设费用微网站怎么做的好名字
  • 长沙电信网站备案谷歌推广怎么做最有效
  • 网站建设与管理总结报告华为开发者联盟
  • 门诊部网站建设天空建筑网站
  • 扬州市城乡建设网站高端品牌鞋子有哪些牌子
  • 杭州网站建设招聘网长沙网络销售公司
  • 网站制作一年多少钱免费做电子章网站
  • 信誉好的营销网站建设徐州市铜山新区建设局网站
  • 建行网站关于我们山西seo和网络推广
  • 1m带宽做网站怎么样深圳网站建设制作开发公司
  • 网站建设 服务内容 费用郴州网站建设公司哪里有
  • 网站关键词重要性育才网站建设
  • 网络安全形势下怎么建设学校网站wordpress最新主题下载
  • 自己建设网站需要什么条件.gs域名做网站怎么样
  • 网上做公益的网站推广手机卡返佣平台
  • 网站是公司域名是个人可以南京建设银行官方网站
  • 做互联网网站的会抓百度网盟推广 网站
  • 商务网站开发设计结论微信报名小程序怎么制作
  • 网站建设销售简历wordpress七比2
  • 制作网站报价工程项目查询哪个网站
  • 深圳移动网站建设制作公司网站建设的认识