当前位置: 首页 > news >正文

长沙招聘网站制作鄂州建设工程造价信息网

长沙招聘网站制作,鄂州建设工程造价信息网,关于域名用于非网站用途的承诺书,手机wap网站 设计1 分词 分词是自然语言处理的基础#xff0c;分词准确度直接决定了后面的词性标注、句法分析、词向量以及文本分析的质量。英文语句使用空格将单词进行分隔#xff0c;除了某些特定词#xff0c;如how many#xff0c;New York等外#xff0c;大部分情况下不需要考虑分词… 1 分词 分词是自然语言处理的基础分词准确度直接决定了后面的词性标注、句法分析、词向量以及文本分析的质量。英文语句使用空格将单词进行分隔除了某些特定词如how manyNew York等外大部分情况下不需要考虑分词问题。但有些情况下没有空格则需要好的分词算法。 简单的分词算法主要有 2 正向最大匹配 从左到右尽可能划分出一段连续字符使得其等于词典中的某个词然后将这段连续字符提取出来对余下的部分进行同样的操作。如果第一个字符不是词典中任何一个词的前缀那么这个字符单独作为一个词。 3 逆向最大匹配 跟正向最大匹配的唯一不同是从右到左尽可能划分出一段连续字符。 4 双向最大匹配 歧义指对于一个句子有多个分词结果。汉语文本中 90.0%左右的句子FMM 和 BMM 的切分完全重合且正确9.0%左右的句子 FMM 和 BMM 切分不同但其中必有一个是正确的(歧义检测成功)只有不到1.0 %的句子或者 FMM 和 BMM 的切分虽重合却是错的或者FMM 和 BMM 切分 不同但两个都不对(歧义检测失败)。   本文介绍了基于单词搜索树Trie Tree的单词断句分词 Word Breaker算法及其源代码。 5 节点信息 public class TrieNode {public TrieNode[] children { get; set; } new TrieNode[26];// isEndOfWord is true if the node represents// end of a wordpublic bool isEndOfWord { get; set; } false;public TrieNode(){isEndOfWord false;for (int i 0; i 26; i){children[i] null;}} } public class TrieNode {     public TrieNode[] children { get; set; } new TrieNode[26]; // isEndOfWord is true if the node represents     // end of a word     public bool isEndOfWord { get; set; } false; public TrieNode()     {         isEndOfWord false;         for (int i 0; i 26; i)         {             children[i] null;         }     } } 6 字典分词算法 using System; using System.Text;namespace Legalsoft.Truffer.Algorithm {public static class Trie_Tree_Word_Breaker{public static void Insert(TrieNode root, string key){TrieNode pCrawl root;for (int i 0; i key.Length; i){int index key[i] - a;if (pCrawl.children[index] null){pCrawl.children[index] new TrieNode();}pCrawl pCrawl.children[index];}pCrawl.isEndOfWord true;}public static bool Search(TrieNode root, string key){TrieNode pCrawl root;for (int i 0; i key.Length; i){int index key[i] - a;if (pCrawl.children[index] null){return false;}pCrawl pCrawl.children[index];}return (pCrawl ! null pCrawl.isEndOfWord);}public static bool Word_Break(string str, TrieNode root){int size str.Length;if (size 0){return true;}for (int i 1; i size; i){if (Search(root, str.Substring(0, i)) Word_Break(str.Substring(i, size - i), root)){return true;}}return false;}public static string Drive(){string[] dictionary {mobile, huawei,sam, sung, ma,mango, icecream,and, go, i, like,ice, cream };int n dictionary.Length;TrieNode root new TrieNode();// Construct triefor (int i 0; i n; i){Insert(root, dictionary[i]);}StringBuilder sb new StringBuilder();sb.AppendLine(Word_Break(ilikehuawei, root) br);sb.AppendLine(Word_Break(iiiiiiii, root) br);sb.AppendLine(Word_Break(, root) br);sb.AppendLine(Word_Break(ilikelikeimangoiii, root) br);sb.AppendLine(Word_Break(huaweiandmango, root) br);sb.AppendLine(Word_Break(huaweiandmangok, root) br);return sb.ToString();}} } using System; using System.Text; namespace Legalsoft.Truffer.Algorithm {     public static class Trie_Tree_Word_Breaker     {         public static void Insert(TrieNode root, string key)         {             TrieNode pCrawl root; for (int i 0; i key.Length; i)             {                 int index key[i] - a;                 if (pCrawl.children[index] null)                 {                     pCrawl.children[index] new TrieNode();                 }                 pCrawl pCrawl.children[index];             } pCrawl.isEndOfWord true;         } public static bool Search(TrieNode root, string key)         {             TrieNode pCrawl root;             for (int i 0; i key.Length; i)             {                 int index key[i] - a;                 if (pCrawl.children[index] null)                 {                     return false;                 }                 pCrawl pCrawl.children[index];             }             return (pCrawl ! null pCrawl.isEndOfWord);         } public static bool Word_Break(string str, TrieNode root)         {             int size str.Length; if (size 0)             {                 return true;             }             for (int i 1; i size; i)             {                 if (Search(root, str.Substring(0, i)) Word_Break(str.Substring(i, size - i), root))                 {                     return true;                 }             } return false;         } public static string Drive()         {             string[] dictionary {                 mobile, huawei,                 sam, sung, ma,                 mango, icecream,                 and, go, i, like,                 ice, cream              }; int n dictionary.Length;             TrieNode root new TrieNode(); // Construct trie             for (int i 0; i n; i)             {                 Insert(root, dictionary[i]);             } StringBuilder sb new StringBuilder();             sb.AppendLine(Word_Break(ilikehuawei, root) br);             sb.AppendLine(Word_Break(iiiiiiii, root) br);             sb.AppendLine(Word_Break(, root) br);             sb.AppendLine(Word_Break(ilikelikeimangoiii, root) br);             sb.AppendLine(Word_Break(huaweiandmango, root) br);             sb.AppendLine(Word_Break(huaweiandmangok, root) br);             return sb.ToString();         }     } }
http://www.w-s-a.com/news/821179/

相关文章:

  • 买空间哪个网站好做我的世界背景图的网站
  • 南京哪里做网站wordpress 增加子目录
  • 刚做的网站搜全名查不到网站很难被百度收录
  • 网站建设与管理期末做网站买空间用共享ip
  • 网络合同怎么签有效南京seo公司哪家
  • 厦门建设网官方网站上海网络网站建
  • 网站制作西安郑州网站建设动态
  • 外贸网站免费推广温州做网站技术员
  • 武冈 网站建设做网站能收回吗
  • 网站做前端把网站扒下来以后怎么做
  • 网站模板素材下载手机做任务佣金的网站
  • 机关网站建设考核测评总结做网站sqlserver排序
  • 凉山州建设厅官方网站html5下载教程
  • 内网网站建设方面政策id97网站怎么做的
  • 福州企业建站系统七米网站建设
  • 长春seo建站北京做机床的公司网站
  • 网站维护具体做啥如何开发wap网站
  • 公司网站设计费计入什么科目潍坊公司网站制作
  • 拖拽式网站开发模具钢东莞网站建设
  • 彩票娱乐网站建设模块化网站开发
  • 孝感网站设计用自己的名字设计头像
  • 高明网站建设哪家好深圳vi设计公司全力设计
  • 工程技术cpu游戏优化加速软件
  • 一起做网店网站入驻收费wordpress 自定义评论样式
  • 深圳高端网站建设公司排名app软件开发sh365
  • 泰州网站整站优化惠州做网站多少钱
  • 做博客网站的php代码一建论坛建工教育网
  • 邢台网站制作费用单页营销网站后台
  • 红色网站建设的比较好的高校用vs2010做购物网站
  • 网站域名备案号查询网页设计实验报告总结模板