当前位置: 首页 > news >正文

好看的网站案例wordpress装饰

好看的网站案例,wordpress装饰,如何学剪辑视频教程,域名注册新网文章目录 关于 Pareidoscope安装使用方法输入格式语料库查询 将语料库转换为 SQLite3 数据库两种语言结构之间的关联简单词素分析关联共现和伴随词素分析相关的更大结构可视化关联结构 关于 Pareidoscope Pareidoscope 是一组 用于确定任意语言结构之间 关联的工具#xff0c… 文章目录 关于 Pareidoscope安装使用方法输入格式语料库查询 将语料库转换为 SQLite3 数据库两种语言结构之间的关联简单词素分析关联共现和伴随词素分析相关的更大结构可视化关联结构 关于 Pareidoscope Pareidoscope 是一组 用于确定任意语言结构之间 关联的工具例如词语搭配、词语和结构共构或更大语言结构之间的关联。关于底层共现模型参见 Proisl (2019)。 安装 Pareidoscope 可在 PyPI 上找到并可以使用 pip 进行安装 pip3 install Pareidoscope或者您可以下载并解压缩最新版本 或克隆 Git 仓库 git clone https://github.com/tsproisl/Pareidoscope.git在新的目录中运行以下命令 python3 setup.py install使用方法 输入格式 语料库 语料库可以提供两种不同的格式CoNLL-U 格式或 CWB-treebank 格式。 CoNLL-U 是用于 Universal Dependencies 项目 (Nivre 等人2016) CWB-treebank 语料库的格式。 格式在UD 文档中指定。以下是一个从文档中改编的示例 1 他们 他们 PRON PRP _ 2 nsubj 2:nsubj|4:nsubj _ 2 买 买 VERB VBP _ 0 root 0:root _ 3 和 和 CONJ CC _ 4 cc 4:cc _ 4 卖 卖 VERB VBP _ 2 conj 0:root|2:conj _ 5 书 书 NOUN NNS _ 2 obj 2:obj|4:obj _ 6 . . PUNCT . _ 2 punct 2:punct _这里有十个制表符分隔的列。前五列是单词 ID、单词形式、词元、通用词性标签和语言特定的词性标签。第六列和第十列在这个例子中为空用于形态学特征和杂项注释。在第七列到第九列编码了这个句子的依存分析。第七列和第八列编码了构成树所需的基本依存关系。第七列指示支配词的 ID第八列指示支配词和当前词之间的依存关系类型。在第九列可以表示一个增强的依存图它不一定要是树形结构。 有关 CWB-treebank 格式的详细信息请参阅Proisl 和 Uhrig (2012)。 查询 查询图可以以 NetworkX Hagberg 等人2008 所理解的节点-链接格式提供的 JSON 序列化形式。所有命令行工具都可以操作多个查询因此即使对于单个查询也必须提供一个查询列表。以下是一个包含一个元素的列表的示例该列表包含用于查找动词 give 的单调递减使用关联更大结构的查询图更多示例查询在 doc 目录中提供 [{graph: {description: 动词 give 的单调递减使用},nodes: [{id: 0,wc: VERB,lemma: give,focus_point: true,not_outdep: [iobj, obl]},{id: 1}],links: [{source: 0,target: 1,relation: obj}]} ]查询表示为具有两个必选键的字典nodes 用于顶点links 用于边。在 graph 键下可以存储查询的描述等信息。查询图的顶点和边都表示为字典列表。边通过其源和目标顶点的 ID 以及可选的依赖关系类型来指定。顶点必须具有 ID并且可以具有其他可选属性。 可以用于顶点的属性取决于查询的类型。以下属性始终可以使用word、pos、lemma、wc、root、not_indep一个列表、not_outdep一个列表。前五个属性也可以通过在它们前面加 not_ 来否定例如 not_wc: NOUN 表示顶点不应为名词。 对于使用 pareidoscope_association_strength 确定两个结构之间的关联强度可以使用以下附加属性。属性 query 必须用于每个顶点并取值 A、B 或 AB。此属性指示顶点是否属于 GA、GB 或两者都属于即 GC。对于标记为 query: AB 的顶点可以使用可选的属性 only_A 和 only_B。这些属性是列表指示哪些其他属性仅适用于 GA 或 GB。图的关注点顶点可以通过将 focus_point: true 设置来标记。属性 only_A 和 only_B 也可以用于边。 对于使用 pareidoscope_collexeme_analysis 进行简单的词素分析必须将 collo_item 属性设置为 true 对于词素顶点。此顶点是自动的关注点。 对于使用 pareidoscope_covarying_collexemes 进行关系共现和共变词素分析必须将两个词素顶点的 collo_A 和 collo_B 属性设置为 true。可以使用 focus_point 属性来标记关注点顶点。 对于使用 pareidoscope_associated_structures 查找关联的更大结构可以通过将 focus_point: true 设置来标记关注点顶点。 将语料库转换为 SQLite3 数据库 对于以下大多数程序需要将您的语料库转换为 SQLite3 数据库。这可以显著加快高度选择性的查询对于需要检查语料库中几乎每句话的非常一般的查询这的影响较小。 CoNNL-U 或 CWB-treebank 格式的语料库可以使用 pareidoscope_corpus_to_sqlite 转换为 SQLite3 数据库。使用选项 -h 运行程序将输出包含详细使用信息的帮助消息。以下是一个示例我们将转换训练部分的 英语通用依存句法语料库 (en-ud-train.conllu; 我们使用包含在 UD treebanks 2.0 版本 中的版本)它是 CoNLL-U 格式并创建数据库 en-ud-train.db pareidoscope_corpus_to_sqlite --db en-ud-train.db --format conllu en-ud-train.conllu两种语言结构之间的关联 程序 pareidoscope_association_strength 确定两种语言结构之间的关联强度。 以下是一个关于双重及物动词与有定语的直接宾语共现的示例查询此查询以及其他查询可以在查询文件 ex_association_two_structures.json 中找到 [{graph: {description: 双重及物动词与有定语的直接宾语的共现},nodes: [{id: 0,wc: VERB,query: AB,focus_point: true},{id: 1,query: A},{id: 2,wc: NOUN,query: AB},{id: 3,query: B}],links: [{source: 0,target: 1,relation: iobj},{source: 0,target: 2,relation: obj},{source: 2,target: 3,relation: det}]} ]动词 “the” 和直接宾语是两种语言结构的一部分因此被标记为 AB。间接宾语仅属于双重及物动词标记为 A而定语仅属于另一种语言结构标记为 B。此外动词被标记为焦点点顶点。 以下是调用程序的示例使用 -h 选项获取详细使用信息 pareidoscope_association_strength --format db -o associations en-ud-train.db ex_association_two_structures.json在此示例中我们在上面转换的语料库上运行 ex_association_two_structures.json 中指定的查询。选项 --format db 表示我们在 SQLite3 数据库上操作此程序也可以直接在 CoNLL-U 或 CWB-treebank 格式的语料库文件上操作。结果以制表符分隔的格式写入 associations.tsv包含每个查询和每个计数方法的频率 O11, R1, C1 和 N不一致的数量以及三个关联度量似然比、t-分数、Dice 系数。 简单词素分析 程序 pareidoscope_collexeme_analysis 执行简单的词素分析即它确定语言结构与给定结构槽中出现的词形或词根之间的关联强度。为此必须在查询中用 collo_item: true 标记 collo 项顶点。以下是一个示例查询取自查询文件 ex_collexeme_analysis.json用于找到与双宾语相关的动词 [{graph: {description: 与双宾语相关的动词},nodes: [{id: 0,wc: VERB,collo_item: true},{id: 1},{id: 2}],links: [{source: 0,target: 1,relation: iobj},{source: 0,target: 2,relation: obj}]} ]以下是调用程序的示例使用 -h 选项获取详细使用信息 pareidoscope_collexeme_analysis -o collexemes en-ud-train.db ex_collexeme_analysis.json在这个示例中我们在上述转换的语料库上运行 ex_collexeme_analysis.json 中指定的查询。程序接受可选的 -c 选项我们可以指定 collo 项是词形还是词根默认为后者。 结果以制表符分隔的格式写入 collexemes.tsv并包含每个查询和共现词根的频率 O11, R1, C1 和 N 以及三个关联度量对数似然、t-分数、Dice 系数。 对于简单词素分析四种计数方法中有三种是完全等价的。由于在这种情况下由于可能存在的大量不一致性计算句子数量没有多少意义所以我们不包括该计数方法。因此我们不需要区分不同的计数方法也不需要包括不一致性的字段。结果按对数似然排序。 关联共现和伴随词素分析 程序 pareidoscope_covarying_collexemes 执行伴随词素分析对于由单个依存关系组成的语言结构相当于分析关联共现。该程序确定在语言结构的两个槽位中共同出现的词形或词干之间的关联。为此必须将这两个槽位标记为 collo_A: true 和 collo_B: true 在查询中。以下是一个示例查询从查询文件 ex_covarying_collexemes.json 中提取该查询确定 into-因果关系中的动词之间的关联 [{graph: {description: Into-causative, i.e. verb someone into verbing},nodes: [{id: 0,wc: VERB,collo_A: true},{id: 1,pos: VBG,collo_B: true},{id: 2},{id: 3,lemma: into}],links: [{source: 0,target: 1,relation: advcl},{source: 0,target: 2,relation: obj},{source: 1,target: 3,relation: mark}]} ]以下是一个调用程序的示例使用 -h 选项获取详细使用信息 pareidoscope_covarying_collexemes -o covarying en-ud-train.db ex_covarying_collexemes.json在这个例子中我们在上述转换的语料库上运行 ex_covarying_collexemes.json 中指定的查询。程序接受一个可选选项 -c其中我们可以指定共同出现的项目应该是词形还是词干后者是默认值。 结果写入 covarying.tsv采用制表符分隔的格式并包含每个查询的共现项目对和计数方法、频率 O11, R1, C1 和 N、不一致的数量以及三个关联度量对数似然、t-得分、Dice 系数。结果按对数似然排序以确定计数焦点。 相关的更大结构 程序 pareidoscope_associated_structures 确定与查询结构相关联的更大去词化语言结构。它考虑所有星形更大的结构即所有新顶点都必须与查询顶点相邻的结构这些结构与查询结构在至少 --min-coocc 句子默认5中共同出现并且顶点数最多为 --max-size默认7。更大结构的顶点被去词化并且只包含词类信息wc 属性。以下是一个查询示例该查询寻找与动词 give 的单及物用法相关联的更大结构 [{graph: {description: 动词 give 的单及物用法},nodes: [{id: 0,wc: VERB,lemma: give,focus_point: true,not_outdep: [iobj, obl]},{id: 1}],links: [{source: 0,target: 1,relation: obj}]} ]以下是调用程序的一个示例使用选项 -h 获取详细使用信息 pareidoscope_associated_structures -o assoc_struc en-ud-train.db ex_associated_structures.json在此示例中我们在上述转换后的语料库上运行 ex_associated_structures.json 中指定的查询。 结果以制表符分隔的格式写入 assoc_struc.tsv并包含每个查询的相关更大结构和计数方法、频率 O11, R1, C1 和 N不一致的数量以及三个关联度量对数似然比、t-得分、Dice 系数。结果按对数似然比对计数焦点点进行排序。 可视化关联结构 pareidoscope_associated_structures 输出的关联较大结构以节点-链接格式呈现与查询图相同可以使用程序 pareidoscope_draw_graphs 进行可视化。请注意这要求您的计算机上已安装 Graphviz 和 Python 包 pydot。 以下是如何调用程序的一个示例使用选项 -h 获取详细的用法信息 tail -n 2 assoc_struc.tsv | head | cut -f2 | pareidoscope_draw_graphs -o draw -在这个示例中我们使用上一个命令创建的输出文件提取十个最强烈关联的较大结构使用 GNU coreutils并绘制它们。图像将写入 draw 目录。以下是为与单向传递性 give 最强烈关联的四个较大结构创建的可视化。
http://www.w-s-a.com/news/208416/

相关文章:

  • 企业网站宽度给多少手机软件开发公司排名
  • 装修设计网站哪个平台最好免费自助建站工具
  • 网站建设规划结构网站服务费怎么做分录
  • 哪里有做网站的公司微商怎么开店步骤
  • 访问不了服务器的网站北京工业产品设计公司
  • 怎么棋牌网站建设口碑好的福州网站建设
  • 怎么样注册一个网站南通网站定制搭建
  • 网站免费正能量软件下载wordpress 多本小说
  • 临淄网站制作价格低长沙谷歌seo收费
  • 吴江公司网站建设电话免费的那种软件
  • 大淘客网站如何做seo网络广告设计公司
  • 厦门网络营销顾问湘潭网站seo
  • asp.net个人网站淮南 搭建一个企业展示网站
  • 备案关闭网站wordpress 替换
  • 台州建设网站制作wordpress乱码
  • 互联网时代 网站建设做交互设计的网站
  • 网站屏蔽中文浏览器湘潭做网站广告的公司
  • 好看的单页面网站模板免费下载手机网站经典案例
  • 优秀网站建设平台建筑模板工厂价格尺寸
  • 合肥微信网站建设旅游景区网站模板
  • 一个只做百合的网站wordpress文章和博客的区别
  • 编写网站策划方案网站哪里有
  • 网站做得好的公司国家防疫政策最新调整
  • 设计优秀的企业网站做行测的网站
  • 提供做网站公司有哪些关键词优化诊断
  • 建站合肥网络公司seo免费建手机商城网站吗
  • 设计师投资做项目网站外贸网站建设工作室
  • 无聊的网站wordpress的alt属性插件
  • 个股期权系统网站开发小清新wordpress模板
  • 全中文网站开发建筑公司企业愿景文案