当前位置: 首页 > news >正文

进不了建设银行网站买购网

进不了建设银行网站,买购网,湘潭市哪里做网站,seo综合查询网站源码【GNN/深度学习】常用的图数据集#xff08;图结构#xff09; 文章目录【GNN/深度学习】常用的图数据集#xff08;图结构#xff09;1. 介绍2. 图数据集2.1 Cora2.2 Citeseer2.3 Pubmed2.4 DBLP2.5 ACM2.6 AMAP AMAC2.7 WIKI2.8 COCS2.9 BAT2.10 EAT2.11 UAT2.12 C…【GNN/深度学习】常用的图数据集图结构 文章目录【GNN/深度学习】常用的图数据集图结构1. 介绍2. 图数据集2.1 Cora2.2 Citeseer2.3 Pubmed2.4 DBLP2.5 ACM2.6 AMAP AMAC2.7 WIKI2.8 COCS2.9 BAT2.10 EAT2.11 UAT2.12 Corafull3. 如何读取文件4. 下载链接5. 参考1. 介绍 近年来深度学习越来越关注图方向的任务通过利用图神经网络去挖掘现实中各种可以利用图来表示事物社交网络论文引用网络分子结构等等来学习更好的表示去实现下游任务。 图数据是由一些点和一些线构成的能表示一些实体之间的关系图中的点就是实体线就是实体间的关系。如下图v就是顶点e是边u是整张图。attrinbutesfeature是信息的意思每个点、每条边、每个图都是有信息的。 2. 图数据集 下面我们就来介绍深度学习中常用的图数据集Cora、Citeseer(Cite)、Pubmed、DBLP、ACM、AMAP、AMAC、Corafull、WIKI、COCS、BAT、EAT、UAT。 每个数据集都包括 label图节点的真实标签feat图节点的自身属性adj图结构对应的邻接矩阵 数据集的下载链接附在后文。 2.1 Cora Cora数据集包括2708份科学出版物分为7类。引文网络由5429个链接组成。数据集中的每个出版物都由一个0/1值的词向量描述表示字典中对应的词是否存在。这本词典由1433个独特的单词组成。 2.2 Citeseer Citeseer数据集包含3312份科学出版物分为六类。引文网络由4732个链接组成。数据集中的每个出版物都由一个0/1值的词向量描述表示字典中对应的词是否存在。这部词典由3703个独特的单词组成。 2.3 Pubmed Pubmed数据集包括Pubmed数据库中有关糖尿病的19717篇科学论文分为三类。引文网络由44338个链接组成。数据集中的每个出版物都由字典中的TF/IDF加权词向量描述该字典由500个唯一的单词组成。 2.4 DBLP DBLP数据集是来自dblp网站的作者网络。如果是共同作者关系则两个作者之间有一条边。作者将研究内容分为四个方面数据库、数据挖掘、机器学习和信息检索。我们根据每个作者提交的会议来标记他们的研究领域。作者特征是由关键字表示的词袋中的元素。 2.5 ACM 这是来自ACM数据集的论文网络。如果两篇论文是同一作者写的那么两篇论文之间就有一条边。论文特征是关键词的词袋。我们选取在KDD、SIGMOD、SIGCOMM、MobiCOMM上发表的论文按研究领域分为数据库、无线通信、数据挖掘三类。 2.6 AMAP AMAC A-Photo和A-Computers提取自Amazon共购图其中节点表示产品边表示两种产品是否经常共购特征表示用bag-of-words编码的产品评论标签是预定义的产品类别。 2.7 WIKI 维基百科(WIKI)是由世界各地的志愿者创建和编辑的在线百科全书。该数据集是由整个英文维基百科页面组成的单词共现网络。该数据包含2405个节点17981条边和19个标签。 2.8 COCS Coauthor-CS和Coauthor-Physics是基于微软学术图的两个包含合著关系的学术网络。图中的节点表示作者边表示合著关系。在每个数据集中作者根据研究领域分别被分为15类和5类节点特征是论文关键词的词袋表示。 2.9 BAT 数据来自国家民航局(ANAC) 2016年1月至12月。它有131个节点1038条边(直径为5)。机场活动是由相应年份的降落和起飞总数来衡量的。 2.10 EAT 数据来自欧盟统计局(Eurostat) 2016年1月至11月。它有399个节点5995条边(直径为5)。机场活动是由相应时期的降落加起飞的总数来衡量的。 2.11 UAT 数据来自美国交通统计局2016年1月至10月。它有1190个节点13599条边(直径为8)。机场活动是通过相应时期通过机场(到达和离开)的总人数来衡量的。 2.12 Corafull Corafull数据集包括19793个节点、每个节点含有8710维的表示并含有63421条边包含70个类别。 3. 如何读取文件 解压之后放在项目文件下的dataset下之后便可以利用如下函数进行读入。 def load_graph_data(dataset_name, show_detailsFalse):- Param dataset_name: the name of the datasetshow_details: if show the details of dataset- Return: the features, labels and adjload_path dataset/ dataset_name / dataset_namefeat np.load(load_path_feat.npy, allow_pickleTrue)label np.load(load_path_label.npy, allow_pickleTrue)adj np.load(load_path_adj.npy, allow_pickleTrue)if show_details:print(dataset name: , dataset_name)print(feature shape: , feat.shape)print(label shape: , label.shape)print(adj shape: , adj.shape)print(undirected edge num: , int(np.nonzero(adj)[0].shape[0]/2))print(category num: , max(label)-min(label)1)print(category distribution: )for i in range(max(label)1):print(label, i, end:)print(len(label[np.where(label i)]))featur_dim feat.shape[1]return feat, label, adj4. 下载链接 图数据集下载链接 5. 参考 【1】https://github.com/yueliu1999/DCRN
http://www.w-s-a.com/news/48904/

相关文章:

  • 上海网站建设公司 珍岛宁波免费自助建站模板
  • 南昌知名的网站建设公司南京网站开发选南京乐识赞
  • 外贸网站建设 深圳seo怎么提升关键词的排名
  • 网站推广效果的评价google关键词
  • 模板网站建站哪家好做微信充值网站
  • 抽奖的网站怎么做的广州小程序定制开发
  • 网站的文件夹建设企业网站公积金
  • 做网站的的价位网站建设 考试题目
  • 深圳比邻网站建设北京优化服务
  • 菏泽网站建设哪家好电子商务网络安全
  • 仿一个网站广州网站建设正规公司
  • 网站建设 目的seo网站关键词排名快速
  • 什么叫做响应式网站自媒体全平台发布
  • 企业网站 案例哪里需要人做钓鱼网站
  • 厚街东莞网站建设网站开发者调试模式
  • 网站推广营销联系方式wordpress adminlte
  • 哪些网站可以做文字链广告卖水果网站建设的策划书
  • 雕刻业务网站怎么做企业qq官网
  • 新华书店的做的数字阅读网站wordpress编辑器格式
  • jq做6个网站做什么好广西临桂建设局网站
  • 网站新闻图片尺寸南京网站设计公司
  • 重庆seo建站网站服务器 安全
  • 咸宁做网站的公司桂林网站建设兼职
  • 教做网站网站开发行业分析
  • 忻州网站建设培训友情链接交换形式有哪些
  • 佛山做外贸网站渠道外贸常用网站
  • 文章收录网站网站及新媒体建设办法
  • 招聘网站排行榜2021找建网站公司
  • 网站建设制作宝塔面板活动宣传推广的形式有哪些
  • 掉关键词网站敏捷软件开发流程