当前位置: 首页 > news >正文

不写代码做网站电子商务网站建设效益分析

不写代码做网站,电子商务网站建设效益分析,全国连锁十强婚纱摄影,深圳在线直播最大熵模型#xff08;maximum entropy model#xff09;由最大熵原理推导实现 最大熵原理 最大熵原理是概率模型学习的一个准则。最大熵原理认为#xff0c;学习概率模型时#xff0c;在所有可能的概率模型#xff08;分布#xff09;中#xff0c;熵最大的模型时最好…最大熵模型maximum entropy model由最大熵原理推导实现 最大熵原理 最大熵原理是概率模型学习的一个准则。最大熵原理认为学习概率模型时在所有可能的概率模型分布中熵最大的模型时最好的模型。通常用约束条件来确定概率模型的集合所以最大熵原理也可以表述为在满足约束条件的模型集合中选取熵最大的模型。 假设离散随机变量 X X X的概率分布时 P ( X ) P\left(X\right) P(X)则其熵是 H ( P ) − ∑ x P ( x ) log ⁡ P ( x ) H\left(P\right) -\sum_{x}P\left(x\right)\log P\left(x\right) H(P)−x∑​P(x)logP(x) 熵满足下列不等式 0 ≤ H ( P ) ≤ log ⁡ ∣ X ∣ 0\le H\left(P\right) \le \log \left|X\right| 0≤H(P)≤log∣X∣ 其中 ∣ X ∣ \left|X\right| ∣X∣是 X X X的取值个数当且仅当 X X X的分布是均匀分布时右边的等号成立。 这就是说当 X X X服从均匀分布时熵最大 证明 max ⁡ p i − ∑ i 1 n p i log ⁡ p i s.t.  ∑ i 1 n p i 1 \begin{aligned} \max _{p_{i}}-\sum_{i1}^{n} p_{i} \log p_{i} \\ \text { s.t. } \sum_{i1}^{n} p_{i}1 \end{aligned} ​pi​max​−i1∑n​pi​logpi​ s.t. i1∑n​pi​1​ 显然 − ∑ i 1 n p i log ⁡ p i ≥ 0 -\sum_{i1}^{n} p_{i} \log p_{i} \ge 0 −∑i1n​pi​logpi​≥0 当 p i p_i pi​中其中一个为 1 1 1其他为 0 0 0时 − ∑ i 1 n p i log ⁡ p i 0 -\sum_{i1}^{n} p_{i} \log p_{i} 0 −∑i1n​pi​logpi​0 拉格朗日函数 L ( P , λ ) − ∑ i 1 n p i log ⁡ p i − λ ( ∑ i 1 n p i − 1 ) L\left(P, \lambda\right) -\sum_{i1}^{n} p_{i} \log p_{i} - \lambda\left(\sum_{i1}^{n} p_{i} - 1\right) L(P,λ)−i1∑n​pi​logpi​−λ(i1∑n​pi​−1) 求导 ∂ L ∂ p i − log ⁡ p i − 1 − λ 0 \frac{\partial L}{\partial p_i} -\log p_i - 1-\lambda 0 ∂pi​∂L​−logpi​−1−λ0 于是 log ⁡ p 1 log ⁡ p 2 ⋯ log ⁡ p n − λ − 1 \log p_1\log p_2 \cdots \log p_n -\lambda - 1 logp1​logp2​⋯logpn​−λ−1 进而 p 1 p 2 ⋯ p n p_1 p_2\cdots p_n p1​p2​⋯pn​ 最大熵模型的定义 最大熵原理时统计学习的一般原理将它应用到分类得到最大熵模型 假设分类模型时一个条件概率分布 P ( Y ∣ X ) P\left(Y|X\right) P(Y∣X) X ∈ X ⊆ R n X\in\mathcal{X}\subseteq \mathbb{R}^n X∈X⊆Rn表示输入 Y ∈ Y Y\in\mathcal{Y} Y∈Y表示输出 X \mathcal{X} X和 Y \mathcal{Y} Y分别是输入和输出的集合。 这个模型表示的是对于给定的输入 X X X以条件概率 P ( Y ∣ X ) P\left(Y|X\right) P(Y∣X)输出 Y Y Y 给定一个训练数据集 T { ( x 1 , y 1 ) , ⋯ , ( x N , y N ) } T \left\{\left(\mathbf{x}_1,y_1\right),\cdots,\left(\mathbf{x}_N,y_N\right)\right\} T{(x1​,y1​),⋯,(xN​,yN​)} 学习的目标是用最大熵原理选择最好的分类模型 首先考虑模型应该满足的条件。给定训练数据集可以确定联合分布 P ( X , Y ) P\left(X,Y\right) P(X,Y)的经验分布和边缘分布 P ( X ) P\left(X\right) P(X)的经验分布分别以 P ~ ( X , Y ) \tilde{P}\left(X,Y\right) P~(X,Y)和 P ~ ( X ) \tilde{P}\left(X\right) P~(X)表示。这里 P ~ ( X x , Y y ) v ( X x , Y y ) N P ~ ( X x ) v ( X x ) N \tilde{P}\left(X\mathbf{x},Yy\right)\frac{v\left(X\mathbf{x},Yy\right)}{N}\\ \tilde{P}\left(X\mathbf{x}\right) \frac{v\left(X \mathbf{x}\right)}{N} P~(Xx,Yy)Nv(Xx,Yy)​P~(Xx)Nv(Xx)​ 其中 v ( X x , Y y ) v\left(X\mathbf{x},Y y\right) v(Xx,Yy)表示训练数据中样本 ( x , y ) \left(\mathbf{x},y\right) (x,y)出现的频率 v ( X x ) v\left(X\mathbf{x}\right) v(Xx)表示训练数据中输入 x \mathbf{x} x出现的频率 N N N表示训练样本容量 用特征函数feature function f ( x , y ) f\left(\mathbf{x}, y\right) f(x,y)描述输入 x \mathbf{x} x和输出 y y y之间的某一个事实其定义是 f ( x , y ) { 1 , x 与 y 满足某一事实 0 , 否则 f\left(\mathbf{x},y\right) \begin{cases} 1, \mathbf{x}与y满足某一事实\\ 0, 否则 \end{cases} f(x,y){1,0,​x与y满足某一事实否则​ 特征函数 f ( x , y ) f\left(x,y\right) f(x,y)关于经验分布 P ~ ( X , Y ) \tilde{P}\left(X,Y\right) P~(X,Y)的期望值用 E P ~ ( f ) E_{\tilde{P}}\left(f\right) EP~​(f)表示 E P ~ ( f ) ∑ x , y P ~ ( x , y ) f ( x , y ) E_{\tilde{P}}\left(f\right)\sum_{\mathbf{x},y}\tilde{P}\left(\mathbf{x},y\right)f\left(\mathbf{x},y\right) EP~​(f)x,y∑​P~(x,y)f(x,y) 特征函数 f ( x , y ) f\left(\mathbf{x},y\right) f(x,y)关于模型 P ( Y ∣ X ) P\left(Y|X\right) P(Y∣X)与经验分布 P ~ ( X ) \tilde{P}\left(X\right) P~(X)的期望值用 E P ( f ) E_P\left(f\right) EP​(f)表示 E P ( f ) ∑ x , y P ~ ( x ) P ( y ∣ x ) f ( x , y ) E_P\left(f\right) \sum_{\mathbf{x},y}\tilde{P}\left(\mathbf{x}\right)P\left(y|\mathbf{x}\right)f\left(\mathbf{x},y\right) EP​(f)x,y∑​P~(x)P(y∣x)f(x,y) 如果模型能够获取训练数据中的信息那么就可以假设这两个期望值相等即 E P ( f ) E P ~ ( f ) E_P\left(f\right)E_{\tilde{P}}\left(f\right) EP​(f)EP~​(f) 或者 ∑ x , y P ~ ( x ) P ( y ∣ x ) f ( x , y ) ∑ x , y P ~ ( x , y ) f ( x , y ) \sum_{\mathbf{x},y}\tilde{P}\left(\mathbf{x}\right)P\left(y|\mathbf{x}\right)f\left(\mathbf{x},y\right)\sum_{\mathbf{x},y}\tilde{P}\left(\mathbf{x},y\right)f\left(\mathbf{x},y\right) x,y∑​P~(x)P(y∣x)f(x,y)x,y∑​P~(x,y)f(x,y) 上式作为模型学习的约束条件 假设有 n n n个特征函数 f i ( x , y ) f_i\left(\mathbf{x},y\right) fi​(x,y)那么就有 n n n个约束条件 最大熵模型假设满足所有约束条件的模型集合为 C ≡ { P ∈ P ∣ E p ( f i ) E P ~ ( f i ) , i 1 , 2 , ⋯ , n } \mathcal{C}\equiv\left\{P\in\mathcal{P}|E_p\left(f_i\right) E_{\tilde{P}}\left(f_i\right),\quad i 1,2,\cdots, n\right\} C≡{P∈P∣Ep​(fi​)EP~​(fi​),i1,2,⋯,n} 定义在条件概率分布 P ( Y ∣ X ) P\left(Y|X\right) P(Y∣X)上的条件熵为 H ( P ) − ∑ x , y P ~ ( x ) P ( y ∣ x ) log ⁡ P ( y ∣ x ) H\left(P\right) -\sum_{\mathbf{x},y}\tilde{P}\left(\mathbf{x}\right)P\left(y|\mathbf{x}\right)\log P\left(y|\mathbf{x}\right) H(P)−x,y∑​P~(x)P(y∣x)logP(y∣x) 则模型集合 C \mathcal{C} C中条件熵 H ( P ) H\left(P\right) H(P)最大的模型称为最大熵模型。 其中 log ⁡ ln ⁡ log ⁡ e \log \ln \log_e loglnloge​ 最大熵模型的学习 最大熵模型的学习过程就是求解最大熵模型的过程。最大熵模型的学习可以形式化为约束最大化问题 对于给定的训练数据集 T { ( x 1 , y 1 ) , ⋯ , ( x N , y N ) } T\left\{\left(\mathbf{x}_1,y_1\right), \cdots, \left(\mathbf{x}_N, y_N\right)\right\} T{(x1​,y1​),⋯,(xN​,yN​)}以及特征函数 f i ( x , y ) f_i\left(\mathbf{x},y\right) fi​(x,y)最大熵的学习等价于约束最优化问题 max ⁡ P ∈ C H ( P ) − ∑ x , y P ~ ( x ) P ( y ∣ x ) log ⁡ P ( y ∣ x ) s . t . E P ( f i ) E P ~ ( f i ) , i 1 , 2 , ⋯ , n ∑ y P ( y ∣ x ) 1 \begin{aligned} \max_{P\in \mathcal{C}} H\left(P\right) -\sum_{\mathbf{x},y}\tilde{P}\left(\mathbf{x}\right)P\left(y|\mathbf{x}\right)\log P\left(y|\mathbf{x}\right)\\ s.t. E_P\left(f_i\right) E_{\tilde{P}}\left(f_i\right),\quad i 1,2,\cdots, n\\ \sum_{y}P\left(y|\mathbf{x}\right) 1 \end{aligned} P∈Cmax​s.t.​H(P)−x,y∑​P~(x)P(y∣x)logP(y∣x)EP​(fi​)EP~​(fi​),i1,2,⋯,ny∑​P(y∣x)1​ 改成最小化 min ⁡ P ∈ C − H ( P ) ∑ x , y P ~ ( x ) P ( y ∣ x ) log ⁡ P ( y ∣ x ) s . t . E P ( f i ) E P ~ ( f i ) , i 1 , 2 , ⋯ , n ∑ y P ( y ∣ x ) 1 \begin{aligned} \min_{P\in \mathcal{C}} -H\left(P\right) \sum_{\mathbf{x},y}\tilde{P}\left(\mathbf{x}\right)P\left(y|\mathbf{x}\right)\log P\left(y|\mathbf{x}\right)\\ s.t. E_P\left(f_i\right) E_{\tilde{P}}\left(f_i\right),\quad i 1,2,\cdots, n\\ \sum_{y}P\left(y|\mathbf{x}\right) 1 \end{aligned} P∈Cmin​s.t.​−H(P)x,y∑​P~(x)P(y∣x)logP(y∣x)EP​(fi​)EP~​(fi​),i1,2,⋯,ny∑​P(y∣x)1​ 拉格朗日函数 L ( P , w ) − H ( P ) w 0 ( 1 − ∑ y P ( y ∣ x ) ) ∑ i 1 n w i ( E P ~ ( f i ) − E P ( f i ) ) ∑ x , y P ~ ( x ) P ( y ∣ x ) log ⁡ P ( y ∣ x ) w 0 ( 1 − ∑ y P ( y ∣ x ) ) ∑ i 1 n w i ( ∑ x , y P ~ ( x , y ) f ( x , y ) − ∑ x , y P ~ ( x ) P ( y ∣ x ) f ( x , y ) ) \begin{aligned} L\left(P,\mathbf{w}\right) -H\left(P\right) w_0\left(1 - \sum_{y}P\left(y|\mathbf{x}\right)\right)\sum_{i1}^{n}w_i\left(E_{\tilde{P}}\left(f_i\right) - E_P\left(f_i\right)\right)\\ \sum_{\mathbf{x},y}\tilde{P}\left(\mathbf{x}\right)P\left(y|\mathbf{x}\right)\log P\left(y|\mathbf{x}\right)w_0\left(1 - \sum_{y}P\left(y|\mathbf{x}\right)\right)\\ \quad \sum_{i1}^{n}w_i\left(\sum_{\mathbf{x},y}\tilde{P}\left(\mathbf{x},y\right)f\left(\mathbf{x},y\right) - \sum_{\mathbf{x},y}\tilde{P}\left(\mathbf{x}\right)P\left(y|\mathbf{x}\right)f\left(\mathbf{x},y\right)\right) \end{aligned} L(P,w)​−H(P)w0​(1−y∑​P(y∣x))i1∑n​wi​(EP~​(fi​)−EP​(fi​))x,y∑​P~(x)P(y∣x)logP(y∣x)w0​(1−y∑​P(y∣x))i1∑n​wi​(x,y∑​P~(x,y)f(x,y)−x,y∑​P~(x)P(y∣x)f(x,y))​ 原始问题 min ⁡ P ∈ C max ⁡ w L ( P , w ) \min_{P\in \mathcal{C}}\max_{\mathbf{w}} L\left(P,\mathbf{w}\right) P∈Cmin​wmax​L(P,w) 对偶问题 max ⁡ w min ⁡ P ∈ C L ( P , w ) \max_{\mathbf{w}}\min_{P\in \mathcal{C}} L\left(P,\mathbf{w}\right) wmax​P∈Cmin​L(P,w) 目标函数是凸的约束条件是等式约束于是满足广义Slater条件, 所以原始问题与对偶问题等价 设 ψ ( w ) min ⁡ P ∈ C L ( P , w ) L ( P w , w ) \psi\left(\mathbf{w}\right) \min_{P\in \mathcal{C}} L\left(P,\mathbf{w}\right)L\left(P_\mathbf{w},\mathbf{w}\right) ψ(w)P∈Cmin​L(P,w)L(Pw​,w) 其中 P w arg ⁡ min ⁡ P ∈ C L ( P , w ) P w ( y ∣ x ) P_{\mathbf{w}}\arg\min_{P\in\mathcal{C}} L\left(P,\mathbf{w}\right) P_{\mathbf{w}}\left(y|\mathbf{x}\right) Pw​argP∈Cmin​L(P,w)Pw​(y∣x) ∂ L ∂ P ( y ∣ x ) ∑ x , y P ~ ( x ) ( log ⁡ P ( y ∣ x ) 1 ) − ∑ y w 0 − ∑ x , y ( P ~ ( x ) ∑ i 1 n w i f i ( x , y ) ) ∑ x , y P ~ ( x ) ( log ⁡ P ( y ∣ x ) 1 − w 0 − ∑ i 1 n w i f i ( x , y ) ) 0 \begin{aligned} \frac{\partial L}{\partial P\left(y|\mathbf{x}\right)} \sum_{\mathbf{x},y} \tilde{P}\left(\mathbf{x}\right)\left(\log P\left(y|\mathbf{x}\right) 1\right)-\sum_{y}w_0-\sum_{\mathbf{x},y}\left(\tilde{P}\left(\mathbf{x}\right)\sum_{i1}^{n}w_if_i\left(\mathbf{x},y\right)\right)\\ \sum_{\mathbf{x},y}\tilde{P}\left(\mathbf{x}\right)\left(\log P\left(y|\mathbf{x}\right) 1-w_0-\sum_{i1}^{n}w_if_i\left(\mathbf{x},y\right)\right)\\ 0 \end{aligned} ∂P(y∣x)∂L​​x,y∑​P~(x)(logP(y∣x)1)−y∑​w0​−x,y∑​(P~(x)i1∑n​wi​fi​(x,y))x,y∑​P~(x)(logP(y∣x)1−w0​−i1∑n​wi​fi​(x,y))0​ 在 P ~ ( x ) 0 \tilde{P}\left(\mathbf{x}\right)0 P~(x)0的情况下 P ( y ∣ x ) e x p ( ∑ i 1 n w i f i ( x , y ) w 0 − 1 ) e x p ( ∑ i 1 n w i f i ( x , y ) ) e x p ( 1 − w 0 ) P\left(y|\mathbf{x}\right) exp\left(\sum_{i1}^{n}w_if_i\left(\mathbf{x},y\right) w_0 - 1\right)\frac{exp\left(\sum_{i1}^{n}w_if_i\left(\mathbf{x},y\right)\right)}{exp\left(1-w_0\right)} P(y∣x)exp(i1∑n​wi​fi​(x,y)w0​−1)exp(1−w0​)exp(∑i1n​wi​fi​(x,y))​ 利用 ∑ y P ( y ∣ x ) 1 \sum_{y} P\left(y|\mathbf{x}\right) 1 ∑y​P(y∣x)1,得 P w ( y ∣ x ) 1 Z w ( x ) e x p ( ∑ i 1 n w i f i ( x , y ) ) P_{\mathbf{w}}\left(y|\mathbf{x}\right) \frac{1}{Z_{\mathbf{w}}\left(\mathbf{x}\right)}exp\left(\sum_{i1}^{n}w_if_i\left(\mathbf{x},y\right)\right) Pw​(y∣x)Zw​(x)1​exp(i1∑n​wi​fi​(x,y)) 其中 Z w ( x ) ∑ y e x p ( ∑ i 1 n w i f i ( x , y ) ) Z_{\mathbf{w}}\left(\mathbf{x}\right) \sum_{y}exp\left(\sum_{i1}^{n}w_if_i\left(\mathbf{x},y\right)\right) Zw​(x)y∑​exp(i1∑n​wi​fi​(x,y)) 其中 Z w ( x ) Z_{\mathbf{w}}\left(\mathbf{x}\right) Zw​(x)称为规范化因子 P w P w ( y ∣ x ) P_{\mathbf{w}}P_{\mathbf{w}}\left(y|\mathbf{x}\right) Pw​Pw​(y∣x)就是最大熵模型。这里 w \mathbf{w} w是最大熵模型中的参数向量 之后求解 max ⁡ ψ ( w ) \max\psi\left(\mathbf{w}\right) maxψ(w) 令 w ∗ arg ⁡ max ⁡ w ψ ( w ) \mathbf{w}^{*} \arg\max_{\mathbf{w}}\psi\left(\mathbf{w}\right) w∗argwmax​ψ(w) 极大似然估计 下面证明对偶函数的极大化等价于最大熵模型的极大似然估计 训练数据的经验概率分布 P ~ ( X , Y ) \tilde{P}\left(X,Y\right) P~(X,Y)条件概率分布 P ( Y ∣ X ) P\left(Y|X\right) P(Y∣X)的对数似然函数表示为 L P ~ ( P w ) log ⁡ π x , y P ( y ∣ x ) P ~ ( x , y ) ∑ x , y P ~ ( x , y ) log ⁡ P ( y ∣ x ) L_{\tilde{P}} \left(P_{\mathbf{w}}\right) \log \pi_{\mathbf{x},y}P\left(y|\mathbf{x}\right)^{\tilde{P}\left(\mathbf{x},y\right)} \sum_{\mathbf{x},y}\tilde{P}\left(\mathbf{x},y\right) \log P\left(y|\mathbf{x}\right) LP~​(Pw​)logπx,y​P(y∣x)P~(x,y)x,y∑​P~(x,y)logP(y∣x) L P ~ ( P w ) ∑ x , y P ~ ( x , y ) log ⁡ P ( y ∣ x ) ∑ x , y P ~ ( x , y ) ∑ i 1 n w i f i ( x , y ) − ∑ x , y P ~ ( x , y ) log ⁡ Z w ( x ) ∑ x , y P ~ ( x , y ) ∑ i 1 n w i f i ( x , y ) − ∑ x P ~ ( x ) log ⁡ Z w ( x ) \begin{aligned} L_{\tilde{P}}\left(P_{\mathbf{w}}\right) \sum_{\mathbf{x},y} \tilde{P}\left(\mathbf{x},y\right) \log P\left(y|\mathbf{x}\right)\\ \sum_{\mathbf{x},y}\tilde{P}\left(\mathbf{x},y\right)\sum_{i1}^{n}w_i f_i\left(\mathbf{x},y\right) - \sum_{\mathbf{x},y}\tilde{P}\left(\mathbf{x},y\right)\log Z_{\mathbf{w}}\left(\mathbf{x}\right)\\ \sum_{\mathbf{x},y}\tilde{P}\left(\mathbf{x},y\right)\sum_{i1}^{n}w_i f_i\left(\mathbf{x},y\right) - \sum_{\mathbf{x}}\tilde{P}\left(\mathbf{x}\right)\log Z_{\mathbf{w}}\left(\mathbf{x}\right) \end{aligned} LP~​(Pw​)​x,y∑​P~(x,y)logP(y∣x)x,y∑​P~(x,y)i1∑n​wi​fi​(x,y)−x,y∑​P~(x,y)logZw​(x)x,y∑​P~(x,y)i1∑n​wi​fi​(x,y)−x∑​P~(x)logZw​(x)​ 接着 ψ ( w ) ∑ x , y P ~ ( x ) P w ( y , x ) log ⁡ P w ( y ∣ x ) ∑ i 1 n w i ( ∑ x , y P ~ ( x , y ) f i ( x , y ) − ∑ x , y P ~ ( x ) P w ( y ∣ x ) f i ( x , y ) ) ∑ x , y P ~ ( x , y ) ∑ i 1 n w i f i ( x , y ) ∑ x , y P ~ ( x ) P w ( y ∣ x ) ( log ⁡ P w ( y ∣ x ) − ∑ i 1 n w i f i ( x , y ) ) ∑ x , y P ~ ( x , y ) ∑ i 1 n w i f i ( x , y ) − ∑ x , y P ~ ( x ) P w ( y ∣ x ) log ⁡ Z w ( x ) ∑ x , y P ~ ( x , y ) ∑ i 1 n w i f i ( x , y ) − ∑ x , y P ~ ( x ) log ⁡ Z w ( x ) \begin{aligned} \psi\left(\mathbf{w}\right) \sum_{\mathbf{x},y}\tilde{P}\left(\mathbf{x}\right)P_{\mathbf{w}}\left(y,\mathbf{x}\right)\log P_{\mathbf{w}}\left(y|\mathbf{x}\right) \\ \quad \sum_{i1}^n w_i\left(\sum_{\mathbf{x},y}\tilde{P}\left(\mathbf{x},y\right)f_i\left(\mathbf{x},y\right) - \sum_{\mathbf{x},y}\tilde{P}\left(\mathbf{x}\right)P_{\mathbf{w}}\left(y|\mathbf{x}\right)f_i\left(\mathbf{x},y\right)\right)\\ \sum_{\mathbf{x},y}\tilde{P}\left(\mathbf{x},y\right)\sum_{i1}^{n}w_i f_i\left(\mathbf{x},y\right) \sum_{\mathbf{x},y}\tilde{P}\left(\mathbf{x}\right) P_{\mathbf{w}}\left(y|\mathbf{x}\right)\left(\log P_{\mathbf{w}}\left(y|\mathbf{x}\right) - \sum_{i1}^{n}w_if_i\left(\mathbf{x},y\right)\right)\\ \sum_{\mathbf{x},y}\tilde{P}\left(\mathbf{x},y\right)\sum_{i1}^{n}w_i f_i\left(\mathbf{x},y\right)-\sum_{\mathbf{x},y}\tilde{P}\left(\mathbf{x}\right)P_{\mathbf{w}}\left(y|\mathbf{x}\right)\log Z_{\mathbf{w}}\left(\mathbf{x}\right)\\ \sum_{\mathbf{x},y}\tilde{P}\left(\mathbf{x},y\right)\sum_{i1}^{n}w_i f_i\left(\mathbf{x},y\right)-\sum_{\mathbf{x},y}\tilde{P}\left(\mathbf{x}\right)\log Z_{\mathbf{w}}\left(\mathbf{x}\right)\\ \end{aligned} ψ(w)​x,y∑​P~(x)Pw​(y,x)logPw​(y∣x)i1∑n​wi​(x,y∑​P~(x,y)fi​(x,y)−x,y∑​P~(x)Pw​(y∣x)fi​(x,y))x,y∑​P~(x,y)i1∑n​wi​fi​(x,y)x,y∑​P~(x)Pw​(y∣x)(logPw​(y∣x)−i1∑n​wi​fi​(x,y))x,y∑​P~(x,y)i1∑n​wi​fi​(x,y)−x,y∑​P~(x)Pw​(y∣x)logZw​(x)x,y∑​P~(x,y)i1∑n​wi​fi​(x,y)−x,y∑​P~(x)logZw​(x)​ 这样最大熵模型的学习问题就转化为具体求解对数似然函数极大化或对偶函数极大化的问题 可以将最大熵模型写成更一般的形式 1 Z w ( x ) e x p ( ∑ i 1 n w i f i ( x , y ) ) \frac{1}{Z_{\mathbf{w}}\left(\mathbf{x}\right)}exp\left(\sum_{i1}^{n}w_i f_i\left(\mathbf{x},y\right)\right) Zw​(x)1​exp(i1∑n​wi​fi​(x,y)) 其中 Z w ( x ) ∑ y e x p ( ∑ i 1 n w i f i ( x , y ) ) Z_{\mathbf{w}}\left(\mathbf{x}\right)\sum_{y}exp\left(\sum_{i1}^{n}w_i f_i\left(\mathbf{x},y\right)\right) Zw​(x)y∑​exp(i1∑n​wi​fi​(x,y)) 这里 x ∈ R n \mathbf{x}\in\mathbb{R}^n x∈Rn为输入 y ∈ { 1 , 2 , ⋯ , K } y\in\left\{1,2,\cdots, K\right\} y∈{1,2,⋯,K}为输出 w ∈ R n \mathbf{w}\in\mathbb{R}^n w∈Rn为权值向量 f i ( x , y ) f_i\left(\mathbf{x},y\right) fi​(x,y)为任意实值特征函数 参考 统计学习方法(李航)
http://www.w-s-a.com/news/555865/

相关文章:

  • 怎么自己弄网站免费网站设计用什么软件
  • 网站分几种access做网站数据方法
  • 网站默认图片s001网站建设公司
  • 淘宝的电子商务网站的建设东莞哪里有网站制作公司
  • 西安网站制作怎么联系wordpress登陆界面打开慢
  • 高端工作网站网站推广seo代理
  • 一般找素材都是做哪几个网站呢推广引流工具
  • 必须做网站等级保护html网页设计题库
  • 移动端网站开发 float手机在线建网站
  • 教育网站模板下载做汽车网站开题报告的意义
  • 网站首页做后台链接昌平网站制作
  • 营销型门户网站建设浏览器下载免费大全
  • 快三网站开发推广普通话手抄报内容50字
  • 沈阳专业做网站开发公司asp网站搭建教程
  • 网站建设代码福州小程序开发平台
  • 了解做房产广告的网站手机版官方网站的建设
  • 如何与别的网站做友情链接做网站排名大概要多少钱
  • 东莞市锂电池网站建设HTML5怎么做自适应网站
  • 江苏城乡建设学校网站群晖建立wordpress
  • wordpress导入网站模板seo自学网官网
  • 购物网站服务器带宽北京网站开发周期
  • 同性做视频网站网站怎么添加栏目
  • 新余网站设计seo自学网站
  • 新乡个人网站建设价格wordpress数据插件
  • 你是网站设计有限公司的项目经理网站推广的重要性
  • 网站定制开发怎么写泸州设计公司有哪些
  • 上海网站建设zj kt迅速编程做网站
  • 郑州服装 网站建设网站栏目合理性
  • 平面设计在线网站最新汽油价格调整最新消息
  • 刷单网站建设wordpress缩略图 裁剪