网站开发常用的开发工具,网站内容建设 内容审核流程,大连网站开发 简维科技,用dw做网站的教程逻辑回归用来处理二分类问题
softmax用来处理多分类问题#xff1a;比如llm在generate的时候#xff0c;每个batch里面的一个样本的一个一次generate就是softmax生成一个大小为vocab_size的向量的概率分布#xff0c;然后再采样
逻辑回归#xff08;logistic regression比如llm在generate的时候每个batch里面的一个样本的一个一次generate就是softmax生成一个大小为vocab_size的向量的概率分布然后再采样
逻辑回归logistic regression的核心sigmoid函数 当W·x趋近于负无穷时sigmoid输出接近于0当趋近于正无穷时接近于1来生成分类预测的概率 损失函数 对数损失作为损失函数 softmax softmax函数输出每个类别的概率概率总和为1
损失函数 log-softmax