当前位置: 首页 > news >正文

怎样制作网站站点知名的wordpress主题

怎样制作网站站点,知名的wordpress主题,网站建设 小程序,写作网站哪个比较赚钱需求 **文本推荐#xff1a;**有多个文本字符串#xff0c;如何设计一个简单的统计方法#xff08;从词频的角度设计#xff09;#xff0c;来计算出多个文本字符串两两之间的相似度#xff0c;并输出大于指定相似度阈值的文本 分析理解 使用Java实现文本相似度计算的…需求 **文本推荐**有多个文本字符串如何设计一个简单的统计方法从词频的角度设计来计算出多个文本字符串两两之间的相似度并输出大于指定相似度阈值的文本 分析理解 使用Java实现文本相似度计算的一种方法是通过构建词频向量并计算余弦相似度具体介绍如下简单易懂 代码实现 复杂粘贴可以直接运行 !-- 使用HanLP进行分词 --dependencygroupIdcom.hankcs/groupIdartifactIdhanlp/artifactIdversionportable-1.8.4/version/dependencyimport com.hankcs.hanlp.tokenizer.StandardTokenizer; import java.util.*; import java.util.stream.Collectors;public class ChineseTextRecommender {// 使用HanLP进行中文分词// 构建词频向量// 假设我们有两个文本文档我们想衡量它们的主题相似性。每个文档可以被表示为一个向量其中包含词频TF或TF-IDF值。// 文档A: the cat sat on the mat on the mat// 文档B: the cat and the dog played// 我们选择几个关键词the, cat, sat, on, mat, and, dog, played。每个词在文档中出现的次数词频可以构成一个向量。// 向量A: [2, 1, 1, 1, 2, 0, 0, 0]the, cat, sat, on, mat, and, dog, played// 向量B: [1, 1, 0, 0, 0, 1, 1, 1]public static MapString, Integer buildTermVector(String text) {ListString words StandardTokenizer.segment(text).stream().map(term - term.word).collect(Collectors.toList());MapString, Integer termVector new HashMap();for (String word : words) {termVector.put(word, termVector.getOrDefault(word, 0) 1);}return termVector;}// 计算余弦相似度public static double cosineSimilarity(MapString, Integer vectorA, MapString, Integer vectorB) {double dotProduct 0.0;double normA 0.0;double normB 0.0;for (String key : vectorA.keySet()) {dotProduct vectorA.get(key) * (vectorB.getOrDefault(key, 0));normA Math.pow(vectorA.get(key), 2);}for (String key : vectorB.keySet()) {normB Math.pow(vectorB.get(key), 2);}if (normA 0 || normB 0) {return 0.0;}return dotProduct / (Math.sqrt(normA) * Math.sqrt(normB));}// 推荐与指定文本相似度高的文本 texts为待判断文本列表public static ListString recommendTexts(ListString texts, String targetText, double threshold) {MapString, Double similarityScores new HashMap();MapString, Integer targetVector buildTermVector(targetText);for (String text : texts) {MapString, Integer textVector buildTermVector(text);double similarity cosineSimilarity(targetVector, textVector);similarityScores.put(text, similarity);System.out.println(text ----Similarity: similarity);}return similarityScores.entrySet().stream().filter(entry - entry.getValue() threshold).map(Map.Entry::getKey).collect(Collectors.toList());}public static void main(String[] args) {// 相似度分别为0.91 0.59 0.54 0.799 0.791ListString texts Arrays.asList(这是一个测试文档吗, 这是第二个文档, 这是第三个文档,这是一个文档吗,这是第一个测试文档吧哈哈);String targetText 这是一个测试文档;double threshold 0.8; // 理论上阈值在0.5左右都可以接受ListString recommendedTexts recommendTexts(texts, targetText, threshold);System.out.println(推荐文本:);recommendedTexts.forEach(System.out::println);} }输出结果
http://www.w-s-a.com/news/484201/

相关文章:

  • 山东省建设备案网站审批国际新闻最新消息10条简短
  • 成都市建设网扬尘监控网站短域名转换
  • 怎么做手机网站潍坊建设银行网站
  • 做网站分什么软件品牌设计培训
  • 太原网站设计排名设计本装修效果图
  • 网站个人中心模板石家庄网站系统开发
  • 优秀的电子商务网站教育公司网站建设文案
  • 网站开发市场成本网站链接推广工具
  • 猪八戒做网站排名常州seo博客
  • wordpress 网站遭篡改如何优化公司的网站
  • 汉中公司做网站网站建设的风格设置
  • 网站建议怎么写怎么做网页连接
  • 站长工具seo综合查询下载安装软件平台搭建包括哪几个方面
  • 做网站怎么存放视频支付功能网站建设
  • 庆阳手机网站设计兰州网站的优化
  • 企业网站托管有必要吗项目管理资格证书
  • 检索类的网站建设个人博客网页模板图片
  • 贵阳网站建设搜q479185700做网站有什么语言好
  • 制作公司主页网站贵阳网站建设技术托管
  • 广西建设网站网址多少钱南京江北新区地图
  • 网站建设及优化 赣icp外包服务美剧
  • wordpress添加菜单深圳优化网站排名
  • 免费下载建设银行官方网站重点专业建设验收网站
  • 建行官方网站登录怎样制作悬浮的WordPress
  • 建设一个网站需要几个角色广告设计与制作就业前景
  • 侵入别人的网站怎么做怎么修改网站排版
  • 网站如何提交百度收录什么最便宜网站建设
  • 商丘网站建设想象力网络做公司网站需要准备什么
  • 滁州新手跨境电商建站哪家好网站推广运作怎么做
  • 烟台有没有做网站大连建设工程信息网专家库