Go to file
xxupiano c02b54791c test 2021-09-25 17:13:32 +08:00
.github move to .github 2019-12-04 10:42:55 +08:00
benchmark version2.5 2021-08-16 19:55:16 +08:00
example test 2021-09-25 17:09:16 +08:00
pics add pic 2021-09-24 16:45:01 +08:00
pretrained update readme 2019-12-03 22:59:23 +08:00
src/deepke test 2021-09-25 17:09:16 +08:00
tutorial-notebooks test 2021-09-23 16:23:03 +08:00
.gitignore Update .gitignore 2019-12-06 12:43:45 +08:00
LICENSE Create LICENSE 2019-12-03 19:21:39 +08:00
README.md test 2021-09-25 17:13:32 +08:00
README_ENGLISH.md test 2021-09-09 21:12:31 +08:00
setup.py test 2021-09-18 14:39:07 +08:00

README.md


DeepKE

Build GitHub Documentation GitHub release Contributor Covenant DOI

简体中文 | English

基于深度学习的开源中文知识图谱抽取框架

DeepKE 提供了多种知识抽取模型。

在线演示

演示的demo地址

  1. RE

    1.STANDARD
    
    2.FEW-SHOT
    
    3.DOCUMENT
    
  2. NER

    STANDARD
    
  3. AE

    STANDARD
    

快速上手

  1. RE

    数据为csv文件样式范例为

    Sentence Relation Head Head_offset Tail Tail_offset
    《岳父也是爹》是王军执导的电视剧,由马恩然、范明主演。 导演 岳父也是爹 1 王军 8
    《九玄珠》是在纵横中文网连载的一部小说,作者是龙马。 连载网站 九玄珠 1 纵横中文网 7
    提起杭州的美景,西湖总是第一个映入脑海的词语。 所在城市 西湖 8 杭州 2

    具体流程请进入详细的README中RE包括了以下三个子功能

    STANDARD

    FEW-SHORT

    DOCUMENT

  2. NER

    数据为txt文件样式范例为

    Sentence Person Location Organization
    本报北京9月4日讯记者杨涌报道部分省区人民日报宣传发行工作座谈会9月3日在4日在京举行。 杨涌 北京,京 人民日报
    《红楼梦》是中央电视台和中国电视剧制作中心根据中国古典文学名著《红楼梦》摄制于1987年的一部古装连续剧由王扶林导演周汝昌、王蒙、周岭等多位红学家参与制作。 王扶林,周汝昌,王蒙,周岭 / 中央电视台,中国电视剧制作中心
    秦始皇兵马俑位于陕西省西安市1961年被国务院公布为第一批全国重点文物保护单位是世界八大奇迹之一。 秦始皇 陕西省西安市 国务院

    具体流程请进入详细的README中

    STANDARD

  3. AE

    数据为csv文件样式范例为

    Sentence Attribute Entity Entity_offset Attribute_value Attribute_value_offset
    张冬梅汉族1968年2月生河南淇县人1988年7月加入中国共产党1989年9月参加工作中央党校经济管理专业毕业中央党校研究生学历 民族 张冬梅 0 汉族 6
    杨缨,字绵公,号钓溪,松溪县人,祖籍将乐,是北宋理学家杨时的七世孙 朝代 杨缨 0 北宋 22
    2014年10月1日许鞍华执导的电影《黄金时代》上映冯绍峰饰演与之差别极大的民国东北爷们萧军演技受到肯定 上映时间 黄金时代 19 2014年10月1日 0

    具体流程请进入详细的README中:

    STANDARD

模型架构

Deepke的架构图如下所示

备注(常见问题)

  1. 使用 Anaconda 时,建议添加国内镜像,下载速度更快。如清华镜像

  2. 使用 pip 时,建议使用国内镜像,下载速度更快,如阿里云镜像。

  3. 安装后提示 ModuleNotFoundError: No module named 'past',输入命令 pip install future 即可解决。

  4. 使用语言预训练模型时,在线安装下载模型比较慢,更建议提前下载好,存放到 pretrained 文件夹内。具体存放文件要求见文件夹内的 readme.md。

致谢

引用