Skip to content

Navigation Menu

Sign in
Appearance settings

Search code, repositories, users, issues, pull requests...

Provide feedback

We read every piece of feedback, and take your input very seriously.

Saved searches

Use saved searches to filter your results more quickly

Sign up
Appearance settings

行业知识图谱,关系抽取,数据清洗,ncov,疫情数据,百科,医疗,保险,汽车,垃圾分类,产业链,投资,高考,行业专家圈子,CXO圈子

License

Notifications You must be signed in to change notification settings

chriswangweb/KGData

Folders and files

NameName
Last commit message
Last commit date

Latest commit

History

53 Commits

Repository files navigation

KGData

你的⭐️我更新的动力

各个行业知识图谱分享,关系抽取,数据清洗,提供 neo4j 批量导入格式,图片不出来的看这里:https://www.jianshu.com/p/25e5e07b2464

Menu

Topic Description status
百科通用数据 百科通用数据 已完成,部分公开
医疗数据 疾病,症状,科室,用药等 已完成
垃圾分类 上海垃圾分类数据 已完成,完全公开
汽车配件-车灯 各种型号各种年份汽车对应的各类车灯,安装方式 已完成
新冠疫情 新冠疫情公开的行为轨迹,可供做知识推理【公益免费】 V1.0完成
保险产品 保险产品知识图谱,全网最全,种类超2.7w 完成
产业链 行业,公司,产品,上下游 完成
打井 打井知识图谱 已完成
教育学-大学专业设置 教育学-大学专业设置 已完成
高考 学校,专业,分数线等 已完成
投资决策 创始人,企业,财务等 已完成
行业专家圈子 实验室,论文等 已完成
CXO圈子 CXO姓名,岗位,公司等 已完成

《百科数据》

中文知识图谱,4000w实体,一亿关系,这是我精心整理、清洗、去重后的数据,数据格式已经处理,可用 neo4j-admin 直接导入,所有数据来源都是公开的百科或新闻数据。

由于 github文件大小限制,以下给出了部分数据,并附上了使用步骤,适合研究生交作业用,接受定制服务

使用步骤

1.首先你要自行安装 neo4j 下载地址:https://neo4j.com/download/

2.由于本方式是覆盖导入,建议创建一个全新的知识图谱库

3.解压后将两个文件放入 import 目录

4.在命令行执行导入语句

bin/neo4j-admin import --id-type=STRING --multiline-fields=true \
 --nodes "import/entity10.csv" \
 --relationships "import/relationship10.csv" \

tips:

1.windows下请去掉命令中的换行符

2.windows下如果提示路径不对,可以将文件路径替换为完整路径

导入成功显示如下:

IMPORT DONE in 3s 337ms. 
Imported:
 100000 nodes
 88362 relationships
 288361 properties
Peak memory usage: 1.03 GB

5.启动 neo4j,查看导入的数据

MATCH (ee:my_entity) WHERE ee.name = "文天祥" RETURN ee; 点击展开子节点,返回效果如下

image

《医疗数据》

V3.5以上版本导入方法:

1.stop要操作的库

2.操作库 manager-》open terminal

3.执行命令 bin/neo4j-admin load --from=/path/to/file/2020-03-241.dump --database=graph.db --force

旧的导入方法:

1.创建一个新的图谱(注意不要启动)

2.下载数据

例如:链接:https://pan.baidu.com/s/1kMynr6lu13wyqTag7xUlpQ

3.将数据解压到 data/databases 下

4.启动服务

5.查看效果

image

6.微信小程序(微信搜索:小橙机器人)

image

本图谱+NLU+DM+GPT-3

扫码体验

image

《垃圾分类》

1.使用方式同医疗数据

3.效果

image

4.落地效果

https://www.bilibili.com/video/BV1BM4y117q8/

硬件列表

树莓派4B,舵机4,PCA9685舵机驱动板1,垃圾桶模型,摄像头,5块钱的音箱 image image

架构图

image

新冠疫情

这个研究没用,以后不再更新

全网首份包含患者出行轨迹的知识图谱,换了超过 10 个数据源,目前的数据源算是最好的,但是还是包含较多的脏数据,后续会整理个精准度更高的版本

整理步骤如下:

Topic Description
病人基本信息 ok
关联病人 -
发病 -
确诊 ok
离鄂 -
出行信息 ok
活动 ok

1.使用方式同医疗数据

网络不好的可以使用网盘地址 链接:https://pan.baidu.com/s/12-fLMV4jEc7BRXj4dUKQGg 密码:b08l

3.效果

image

汽车配件-车灯

哪个男人会不爱车

1.使用方式同医疗数据

2.数据地址

3.效果

image

保险产品

全网最全,种类超2.7w

  • 公司名称
  • 产品名称
  • 产品类别
  • 设计类型
  • 产品特殊属性
  • 承保方式
  • 保险期间类型
  • 产品交费方式
  • 产品条款文字编码
  • 产品销售状态
  • 停止销售日期

1.使用方式同医疗数据

2.数据地址:链接: https://pan.baidu.com/s/1ItgHr_YmT1iNsWbdZ4FF8g 密码: fh86 闲鱼搜索鱼塘:知识图谱

3.效果

image image

工业产业链

工业产品分类,公司,产品,上下游(上下游数据对齐目前不足)

1.使用方式

LOAD CSV FROM 'file:///product.csv' AS line merge (:Product { id:line[0],name: line[1]})
LOAD CSV FROM "file:///product.csv" AS line match (from:Product{name:line[1]}),(to:Product{name:line[4]}) merge (from)-[r:Parent{level:line[3]}]->(to)

3.效果

image image

CXO

CXO圈子

1.使用方式

LOAD CSV FROM 'file:///peoper.csv' AS line merge (:CXO { 姓名: line[0], 公司: line[1], 岗位:line[2]})
LOAD CSV FROM 'file:///peoper.csv' AS line merge (:company { title: line[1]})
LOAD CSV FROM 'file:///peoper.csv' AS line match (from:CXO {姓名:line[0]}),(to:company {title:line[1]}) merge (from)-[r:belong]->(to);

2.数据 peoper.csv

3.效果

image

联系作者

作者微信:AI-decoder

搞得不赖,赏

image

About

行业知识图谱,关系抽取,数据清洗,ncov,疫情数据,百科,医疗,保险,汽车,垃圾分类,产业链,投资,高考,行业专家圈子,CXO圈子

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

AltStyle によって変換されたページ (->オリジナル) /