当前位置: 首页 > news >正文

温州网站建设维护怎么做好网站开发、设计

温州网站建设维护,怎么做好网站开发、设计,微盟互联网公司排名,威海做企业网站论文阅读笔记AI篇 —— Transformer模型理论实战 #xff08;四#xff09; 一、理论1.1 理论研读1.2 什么是AI Agent? 二、实战2.1 先导知识2.1.1 tensor的创建与使用2.1.2 PyTorch的模块2.1.2.1 torch.nn.Module类的继承与使用2.1.2.2 torch.nn.Linear类 2.2 Transformer代… 论文阅读笔记AI篇 —— Transformer模型理论实战 四 一、理论1.1 理论研读1.2 什么是AI Agent? 二、实战2.1 先导知识2.1.1 tensor的创建与使用2.1.2 PyTorch的模块2.1.2.1 torch.nn.Module类的继承与使用2.1.2.2 torch.nn.Linear类 2.2 Transformer代码实现 一、理论 1.1 理论研读 参考文章或视频链接[1] 《论文阅读笔记AI篇 —— Transformer模型理论实战 (一)》- CSDN[2] 《论文阅读笔记AI篇 —— Transformer模型理论实战 (二)》- CSDN[3] 《论文阅读笔记AI篇 —— Transformer模型理论实战 (三)》- CSDN 1.2 什么是AI Agent? 如果说钢铁侠中的J.A.R.V.I.S.(贾维斯)是一个AGI通用人工智能的话那么现阶段的AI Agent只是做到了感知任务、规划任务、执行任务。下面这张图的这个过程看上去和强化学习是一模一样的。 Agent结构图——参考视频[1] 参考文章或视频链接[1]【动画科普AI Agent大模型之后为何要卷它】- bilibili[2]【【卢菁老师说】Agent就是一场彻头彻尾的AI泡沫】- bilibili[3] 《读懂AI Agent基于大模型的人工智能代理》[4] LLM之Agent一使用GPT-4开启AutoGPT Agent自动化任务完整指南 二、实战 2.1 先导知识 2.1.1 tensor的创建与使用 对于一维的tensor它是没有形状而言的你不能准确的称它为行向量row vector或列向量col vector只有你明确的指定之后它才有准确的形状。 但是在数学中肯定是要有明确的意义的要么n*1要么1*n总得有个说法说法就是认为是列向量n*1见参考文章[2]。 import torch import torch.nn as nndef test1_tensor():x torch.tensor([1, 1, 1, 1])print(Before reshape:, x.shape)# x x.reshape(4, 1)x x.view(4, 1) # 与reshape一样print(x)print(After reshape(4,1):, x.shape)# x x.reshape(1, 4)x x.view(1, 4) # 与reshape一样print(x)print(After reshape(1,4):, x.shape)if __name__ __main__:test1_tensor()Console Output Before reshape: torch.Size([4])tensor([[1],[1],[1],[1]]) After reshape(4,1): torch.Size([4, 1])tensor([[1, 1, 1, 1]]) After reshape(1,4): torch.Size([1, 4])参考文章或视频链接[1] Introduction to PyTorch Tensors - PyTorch[2] Is there any reason for using the word “column” in the context of one-dimensional tensor? 2.1.2 PyTorch的模块 2.1.2.1 torch.nn.Module类的继承与使用 强调一点你自己实现的所有模块应该都是继承了nn.Module这个Class的这也是PyTorch官方文档所强调的不要觉得可以去掉nn.Module的继承继承了这个类才会有一些便捷的方法可供调用否则你都要自己实现一遍。 class Encoder(nn.Module): # (1)Encoder继承了nn.Moduledef __init__(self):# ...def forward(self, enc_inputs): # 你不需要显示调用该方法因为在nn.Module.__call__里已经默认实现了对该方法的调用# ...class Decoder(nn.Module): # (2)Decoder继承了nn.Moduledef __init__(self):# ...def forward(self, dec_inputs, enc_inputs, enc_outputs): # 你不需要显示调用该方法因为在nn.Module.__call__里已经默认实现了对该方法的调用# ...参考文章或视频链接[1] Module — PyTorch 2.1 documentation[2] Learning Day 22: What is nn.Module in Pytorch[3] Why do we need to inherit from nn.Module in PyTorch? - stackoverflow 2.1.2.2 torch.nn.Linear类 关于Linear层有一点问题就是它的权重矩阵nn.Linear(4,3)中的4表示输入特征的维度3表示输出特征的维度按理来说是一个4 * 3的矩阵才对但是输出结果偏不这是因为常规的线性运算是写成这样的假设维度已知 o u t W 3 ∗ 4 i n 4 ∗ 1 b 3 ∗ 1 out W_{3*4}in_{4*1} b_{3*1} outW3∗4​in4∗1​b3∗1​但网络层以从左至右的视角看去 i n in in在 W W W矩阵的左边写成这样的形式 o u t ( i n 1 ∗ 4 W 3 ∗ 4 T ) T b 3 ∗ 1 ( i n 1 ∗ 4 W 4 ∗ 3 ) T b 3 ∗ 1 out (in_{1*4}W_{3*4}^T)^T b_{3*1} (in_{1*4}W_{4*3})^T b_{3*1} out(in1∗4​W3∗4T​)Tb3∗1​(in1∗4​W4∗3​)Tb3∗1​就很自然的模拟了这个视角这样就能解释为什么输出的shape是反过来的。 请看参考文章[1]。 import torch import torch.nn as nndef test2_Linear_weight():linear_layer nn.Linear(4,3)print(linear_layer.shape) # torch.Size([3, 4]) if __name__ __main__:test2_Linear_weight()参考文章或视频链接[1] Why does PyTorch’s Linear layer store the weight in shape (out, in) and transpose it in the forward pass? - stackoverflow 2.2 Transformer代码实现 请看参考文章[1]与[4]我认为写的足够详细也足够易懂有些torch.transpose()的操作不太好从字面上读懂就debug看看无非就是高维矩阵的转置和二维矩阵的转置也没本质区别。 参考文章或视频链接本文代码来源[1] 《Transformer 代码详解(Pytorch版)》- CSDN[2] 【Transformer代码实现】- bilibili重点观看此视频[3] [重置版]从零实现transfomer模型 || 理解ChatGPT基石 || pytorch- bilibili这篇写的也不错可以重点阅读[4] 《Transformer原理与代码实现》- CSDN
http://www.w-s-a.com/news/284459/

相关文章:

  • 佛山 做网站公司有哪些网站排名忽然不见了
  • 广告网站建设最专业东莞大朗网站设计
  • 网站做流量的论坛贴吧分销商城系统源码
  • 新手建立网站的步骤网站建设费怎么入分录
  • 哪里建网站性价比高做网站赚取广告费
  • 邢台集团网站建设价格微信怎么做捐钱的网站
  • 做网站费用需要分摊吗装修公司一般多少钱一平方
  • 公司主页的网站格式wordpress自动推送给百度
  • 网站建设辶金手指排名十二wordpress 当数据库
  • 无锡手机网站建设服务苏州展厅设计企业
  • 无锡网站制作需要多少钱北京二次感染最新消息
  • 网站开发视频播放无画面杭州房产信息网官网
  • 网站开发 改进如何创建公众号平台
  • wordpress网站响应很慢只有asp网站代码可以重新编译吗
  • 哪个网站教做饭做的好wordpress热点文章
  • 可以做推广东西的网站重庆网站建设 重庆网站制作
  • 珠海网站建设培训学校wordpress去版权 合法
  • 建设食品商购网站学校网站设计实验报告
  • 建个网站多少钱沭阳奥体小区做网站的
  • 广州视频网站建站公司php网页设计作业代码
  • 成都公司网站设计如何制作网址最简单的方法
  • 温州 做网站福建住房城乡建设部网站
  • 网站自动化采集成都网站设计费用
  • 广东专业网站定制建设淘宝网站的人员组织结构
  • 网站改版seo无锡有多少家公司
  • h5美食制作网站模板下载wordpress大学百度云
  • 零陵做网站建立网站的公司平台
  • 某企业电子商务网站建设网站开发实验结论
  • 自己做的网站突然打不开杭州哪些做网站公司好
  • 株洲专业建设网站免费cms内容管理系统