deepke/example/re/few-shot/README_CN.md

1.7 KiB
Raw Permalink Blame History

快速上手

English | 简体中文

环境依赖

python == 3.8

  • torch == 1.5
  • transformers == 3.4.0
  • hydra-core == 1.0.6
  • deepke

克隆代码

git clone https://github.com/zjunlp/DeepKE.git
cd DeepKE/example/re/few-shot

使用pip安装

首先创建python虚拟环境再进入虚拟环境

  • 安装依赖: pip install -r requirements.txt

使用数据进行训练预测

  • 存放数据: 可先下载数据 wget 120.27.214.45/Data/re/few_shot/data.tar.gz在此目录下

    data 文件夹下存放训练数据。模型采用的数据集是SEMEVALSEMEVAL数据集来自于2010年的国际语义评测大会中Task 8"Multi-Way Classification of Semantic Relations Between Pairs of Nominals"。

  • SEMEVAL包含以下数据

    • rel2id.json关系标签到ID的映射

    • temp.txt:关系标签处理

    • test.txt 测试集

    • train.txt:训练集

    • val.txt:验证集

  • 开始训练模型加载和保存位置以及配置可以在conf的.yaml文件中修改

    • 对数据集SEMEVAL进行few-shot训练python run.py

    • 训练好的模型默认保存在当前目录

  • 从上次训练的模型开始训练:设置.yaml中的train_from_saved_model为上次保存模型的路径

  • 每次训练的日志保存路径默认保存在当前目录,可以通过.yaml中的log_dir来配置

  • 进行预测: python predict.py

模型内容

KnowPrompt