当前位置：首页 > news >正文

33岁改行做网站建设传奇手游大型网站

news 2025/12/17 9:14:20

33岁改行做网站建设,传奇手游大型网站,做环境设计的网站,推广普通话手抄报模板可打印查询#xff08;自主提示#xff09;和键#xff08;非自主提示#xff09;之间的交互形成了注意力汇聚#xff1b; 注意力汇聚有选择地聚合了值#xff08;感官输入#xff09;以生成最终的输出。本节将介绍注意力汇聚的更多细节#xff0c; 以便从宏观上了解注意力机…查询自主提示和键非自主提示之间的交互形成了注意力汇聚注意力汇聚有选择地聚合了值感官输入以生成最终的输出。本节将介绍注意力汇聚的更多细节以便从宏观上了解注意力机制在实践中的运作方式。具体来说1964年提出的Nadaraya-Watson核回归模型是一个简单但完整的例子可以用于演示具有注意力机制的机器学习。 import torch from torch import nn from d2l import torch as d2l 生成数据集在这里生成了50个训练样本和\(50\)个测试样本。为了更好地可视化之后的注意力模式需要将训练样本进行排序。 n_train 50 # 训练样本数 x_train, _ torch.sort(torch.rand(n_train) * 5) # 排序后的训练样本def f(x):return 2 * torch.sin(x) x**0.8y_train f(x_train) torch.normal(0.0, 0.5, (n_train,)) # 训练样本的输出 x_test torch.arange(0, 5, 0.1) # 测试样本 y_truth f(x_test) # 测试样本的真实输出 n_test len(x_test) # 测试样本数 n_test 下面的函数将绘制所有的训练样本样本由圆圈表示不带噪声项的真实数据生成函数\(f\)标记为“Truth” 以及学习得到的预测函数标记为“Pred”。 def plot_kernel_reg(y_hat):d2l.plot(x_test, [y_truth, y_hat], x, y, legend[Truth, Pred],xlim[0, 5], ylim[-1, 5])d2l.plt.plot(x_train, y_train, o, alpha0.5); 平均汇聚如下图所示这个估计器确实不够聪明。真实函数(f)“Truth”和预测函数“Pred”相差很大。 y_hat torch.repeat_interleave(y_train.mean(), n_test) plot_kernel_reg(y_hat)

查看全文

http://www.w-s-a.com/news/443628/