知识图是一个可重复使用的数据层,用于回答多个数据孤岛的复杂查询。通过以表和图形的形式显示和组织上下文化数据,它们可以实现峰顶连接。他们可以快速接受新的信息,分类和标准,因为它们旨在捕获数据的不断变化。在Python中有不同的库来执行知识图。让我们检查一下其中的一些。
知识图的python软件包
1. pykg2vec
pykg2vec是一个python软件包,它实现知识图嵌入算法和灵活的嵌入管道构建元素。该图书馆旨在帮助学者和程序员使用知识库进行快速测试算法,或使用模块化块调整包装为其算法。
pykg2vec是使用TensorFlow构建的,但是由于越来越多的作者利用Pytorch创建了KGE模型,因此它与Pytorch进行了切换。 TF版本仍在TF2-Master分支中可用。除了主要的模型培训程序外,Pykg2Vec还使用多处理来生成迷你批次并进行评估以最大程度地减少整体完成时间。
功能
- 贝叶斯超参数优化
- 学习嵌入的检查技术
- 支持最先进的KGE模型变体和评估数据集
- 允许在TSV或PANDAS兼容格式中导出学习的嵌入
- KPI概述可视化视图,具体取决于TSNE(平均等级,命中率)多种格式
好处
- 交互式可视化
- 个性化数据集
第二
pykeen(Python知识嵌入)是一个Python库,可构建和评估知识图和嵌入模型。在Pykeen 1.0中,我们可以直接估算所有频繁等级类别的聚合度量。例如平均,乐观和悲观,可以比较它们的差异。
它可以确定模型准确地预测各种三元组相同得分的实例,这通常是不受欢迎的行为。 Pytorch模块用于将其用于Python 3.7+。它包括一组使用Pytest和Tox执行的综合测试过程。您可以在travis-ci-Ci的集成环境中执行。
功能
- 培训方法:LCWA和SLCWA
- 统一和Bernoulli负面采样器
- 使用Optuna优化超参数
- 早期停止
- 评估指标:调整后的平均等级,平均等级,ROC-AUC得分
好处
- 这是唯一使用自动内存优化来验证测试和训练期间未超过内存限制的库。
- 用户可以由于多种社区驱动的工具而复制和维护图。
3.扩展
知识图嵌入可以用于各种任务,包括知识图完成,信息检索和基于链接的分类,以命名一些。 Amplaph是第一个民主化图表学习的开源工具包,从而从现有图中发现全新的知识。
Ampligraph软件包包括可以生成知识图嵌入(KGE)的机器学习模型,项目的低级向量表示以及构成知识图的关系。
这些模型使用低维矢量来编码图形的节点和关系。结果,依赖这些图的后续系统,例如提问软件,提高效率。
它减少了知识图嵌入的入口障碍,使这些模型甚至最不熟练的用户都可以使用,并建立了一个可以从免费软件API中受益的专业人员社区,可以在知识图上学习。
功能
自定义:您可以增强基于扩展的估计器来创建自定义知识图嵌入框架。
支持:它可以在CPU和GPU上运行以加速训练程序。
更少的代码:其API削减了在知识图中预测代码所需的代码。
好处
- 开源API
- 它可以预测图形之间的缺失关系。
- 链接预测也大大改进了从文本中自动产生的图表的策划。 。
4. libkge
libkge的主要目的是促进对KGE模型和培训技术的可重复研究。与单独的模型类别相比,选择的训练方法和超参数可显着影响仿真结果。
LIBKGE的目标是提供简单的培训,超参数优化和可以与任何模型一起使用的评估程序。平台中的每个可能的旋钮或启发式方法都可以通过有据可查的配置文件明确可用。最常见的KGE模型包含在Libkge中,您可以引入新型号。彻底的记录机制和设备有助于深入检查。
功能
- 早期终止
- 检查点
- 高平行性潜力
- 您可以随时暂停并重新启动
- 有或没有相互作用,所有模型都可以使用。
- 大批量大小的自动内存管理
好处
- Libkge结构合理。可以将单个模块组合和匹配,并且可以快速合并其他组件。
- 测试的当前配置与模型一起保存以提高评估和一致性。
- 在测试期间,Libkge记录了大量数据,并跟踪诸如运行时,内存利用,训练流失和评估方法等性能指标。
5. GraphVite
主库和Python包装器包括GraphVite平台。 Python包装器启用了核心库类的自动包装步骤。它还为数据集和各种应用程序提供了实施。
核心库以C+11和CUDA编写,Pybind11用于将其链接到Python。它涵盖了所有GraphVite的计算相关类,例如图形,分析仪和优化算法。开发人员可以将所有这些组件捆绑到类似于Python接口的类中。
该体系结构允许在Python接口中进行动态数据类型,并优化编译时间以达到最佳效率。它还包括九个主要模型及其与标准数据集的比较。用户可以快速练习复杂的图形嵌入方法,并使用Python接口在短时间内获得结果。用户可以利用核心界面来开发视觉深度学习方法,而不必担心调度。
功能
- 节点嵌入
- 知识图嵌入
- 高维数据可视化
- 在统一平台上学习算法的复制
好处
- 高速
- 您可以从大型图中学习
- 可视化图表或高维信息有效
- 增强工作原型和模型修改有效性