当前位置: 首页 > news >正文

山东做网站公司哪家好百度小程序优化合作公司

山东做网站公司哪家好,百度小程序优化合作公司,租用大型服务器多少钱,官方网站英语CRNN#xff1a;用于识别图中文本的深度学习模型 CRNN介绍#xff1a;用于识别图中文本的深度学习模型CRNN的结构组成部分工作原理 CRNN结构分析卷积层#xff08;Convolutional Layers#xff09;递归层#xff08;Recurrent Layers#xff09;转录层#xff08;Transc… CRNN用于识别图中文本的深度学习模型 CRNN介绍用于识别图中文本的深度学习模型CRNN的结构组成部分工作原理 CRNN结构分析卷积层Convolutional Layers递归层Recurrent Layers转录层Transcription Layer CRNN在文本识别中的应用识别不定长文本单词和场景文本的识别强大的泛化能力 CRNN的优势与局限性优势局限性 CRNN介绍用于识别图中文本的深度学习模型 在计算机视觉和机器学习的领域中文本识别是一个重要的研究领域它旨在从图像中检测和识别文字。CRNNConvolutional Recurrent Neural Network卷积递归神经网络是这个领域内的一个代表性的框架它融合了卷积神经网络CNN和递归神经网络RNN特别适用于对图像中的序列文本进行识别。 CRNN的结构 组成部分 CRNN模型主要包含三个部分一个用于提取图像特征的卷积层序列、一个用于序列建模的递归层序列和一个转录层将递归层的输出解码为一个文本序列。 工作原理 卷积层负责提取图像的特征这些特征随后被展平并输入到递归层。在递归层中RNN处理输入序列并且能够在序列的每个时间步捕捉上下文信息。这对于理解文本的意义尤其重要因为文本的特定字符通常需要对前文和后文的了解。最后是转录层通常使用CTC即Connectionist Temporal Classification对RNN的输出进行解码生成最终的文本序列。 CRNN结构分析 卷积层Convolutional Layers CRNN的第一部分是一系列卷积层用于从输入图像中提取视觉特征。设输入图像为 I 通过 L 层卷积操作后得到的特征图feature map为 F L c o n v ( I ; W L , b L ) F^L conv(I; W^L, b^L) FLconv(I;WL,bL) 其中 W^L和 b^L 分别代表第 L 层的卷积权重和偏置。卷积操作提取的特征 F^L将被送入后续的递归层进行进一步的处理。 递归层Recurrent Layers 递归层的作用是对特征序列进行建模捕捉序列中的时间依赖性。最常用的RNN单元是长短时记忆LSTM它在处理长序列数据时表现出色。LSTM有三个门控机制遗忘门 f_t输入门 i_t 和输出门 o_t 。LSTM单元中在时间步 t 的状态更新公式如下 遗忘门: f t σ ( W f ⋅ [ h t − 1 , x t ] b f ) f_t \sigma(W_f \cdot [h_{t-1}, x_t] b_f) ft​σ(Wf​⋅[ht−1​,xt​]bf​) 输入门: i t σ ( W i ⋅ [ h t − 1 , x t ] b i ) i_t \sigma(W_i \cdot [h_{t-1}, x_t] b_i) it​σ(Wi​⋅[ht−1​,xt​]bi​) 输出门: o t σ ( W o ⋅ [ h t − 1 , x t ] b o ) o_t \sigma(W_o \cdot [h_{t-1}, x_t] b_o) ot​σ(Wo​⋅[ht−1​,xt​]bo​) 新记忆单元内容: C ~ t tanh ⁡ ( W C ⋅ [ h t − 1 , x t ] b C ) \tilde{C}_t \tanh(W_C \cdot [h_{t-1}, x_t] b_C) C~t​tanh(WC​⋅[ht−1​,xt​]bC​) 记忆单元更新: C t f t ∗ C t − 1 i t ∗ C ~ t C_t f_t * C_{t-1} i_t * \tilde{C}_t Ct​ft​∗Ct−1​it​∗C~t​ 隐藏状态更新: h t o t ∗ tanh ⁡ ( C t ) h_t o_t * \tanh(C_t) ht​ot​∗tanh(Ct​) 在CRNN中通常使用双向LSTMBi-LSTM在每个时间步 t 同时考虑先前h_{t-1} 和后续h_{t1} 的上下文信息。 转录层Transcription Layer CRNN的最后部分是转录层负责将递归层的输出映射到最终的序列标签。转录通常通过CTCConnectionist Temporal Classification完成CTC利用概率论原理解决无对齐数据的序列学习问题其目标是最大化条件概率 P ( π ∣ x ) P(\pi|x) P(π∣x) 其中π表示一个路径它通过删除重复的标签和空白标签来映射到最终的标签序列l 。CTC的目标函数定义如下 P ( l ∣ x ) ∑ π ↦ l P ( π ∣ x ) P(l|x) \sum_{\pi \mapsto l} P(\pi|x) P(l∣x)π↦l∑​P(π∣x) 该函数对所有可能映射到标签序列 l 的路径π的概率求和。 CRNN在文本识别中的应用 识别不定长文本 CRNN特别适用于识别图像中的不定长文本。它不需要预先定义文本的长度这给识别流程带来了极大的灵活性。 单词和场景文本的识别 CRNN不仅可以在图像中识别单个字符或者单词还能很好地工作在识别自然场景中的文本如街道标志、广告牌等。 强大的泛化能力 CRNN已被证实在多个文本识别数据集上表现出色并能够很好地泛化到新的、未见过的图像。 CRNN的优势与局限性 优势 端到端学习: CRNN能够从原始图像直接学习到文本识别所需要的最终输出无需手动特征提取或其他预处理步骤。对于图像扭曲的鲁棒性: CRNN对图像的畸变和扭曲有很好的适应性提高了模型在现实世界应用的实用性。 局限性 计算成本: CRNN结合了CNN和RNN两个复杂的模型可能导致较高的计算成本。训练数据: 获得大量带有标注的训练数据对于训练CRNN模型来说至关重要但这有时候可能既昂贵又耗时。
http://www.w-s-a.com/news/574440/

相关文章:

  • 丰宁县有做网站的吗?维护一个网站一年多少钱
  • 杭州网站设计渠道wordpress购物主题
  • 山东政务网站建设文字logo免费设计在线生成
  • 韩雪个人网站唐山网络运营推广
  • 查建设工程业绩在哪个网站网站建设优化服务如何
  • 江苏省建设工程安全监督网站商洛网站制作
  • 海淀网站建设wzjs51网页设计页面配色分析
  • 网站的备案流程图垦利网站制作
  • 行业用品网站怎么建设外链买东西的网站都有哪些
  • 淘宝做促销的网站集团门户网站建设策划
  • 网站排行榜查询怎样把个人介绍放到百度
  • vps 网站上传河北省招投标信息网
  • 武进网站建设咨询网站定制公司选哪家
  • 郑州市建设投资集团公司网站深圳企业网站建设推荐公司
  • 天津个人网站备案查询dz网站恢复数据库
  • 关于网站建设的期刊文献宣传片文案
  • 物业网站模板下载wordpress+菜单大小
  • 网站建设案例教程视频空间刷赞网站推广
  • 网站建设借鉴做外贸球衣用什么网站
  • 网站建设的前途微信公众号制作网站
  • 做网站之前要安装什么网站改进建议有哪些
  • 网站建设+管理系统开发山东专业网站建设公司
  • 基础微网站开发咨询中国印花图案设计网站
  • 找最新游戏做视频网站天津市招标投标公共服务平台
  • 电影订票网站怎么做注册地址出租多少钱
  • 做网站的规划和设想怎样做能让招聘网站记住密码
  • 建站知乎网站公告建设方案
  • 济南市住房和城乡建设局官方网站淮阳住房和城乡建设网站
  • 网站的设计特点有哪些seo推广要多少钱
  • wordpress开通多站点好处软件开发外包公司的设计一般多少钱