deepke/example/re/few-shot
tlk1997 ad59b62acc
Update README.md
2021-10-10 20:53:04 +08:00
..
conf Update train.yaml 2021-10-10 20:46:10 +08:00
data Add files via upload 2021-10-10 19:18:44 +08:00
README.md Update README.md 2021-10-10 20:53:04 +08:00
predict.py test 2021-10-10 20:51:09 +08:00
requirements.txt Add files via upload 2021-10-10 19:18:44 +08:00
run.py test 2021-10-10 20:51:09 +08:00

README.md

快速上手

环境依赖

python == 3.8

  • torch == 1.5
  • transformers == 3.4.0
  • hydra-core == 1.0.6
  • deepke

克隆代码

git clone git@github.com:zjunlp/DeepKE.git

使用pip安装

首先创建python虚拟环境再进入虚拟环境

  • 安装依赖: pip install -r requirements.txt

使用数据进行训练预测

  • 存放数据:在 data 文件夹下存放训练数据。模型采用的数据集是SEMEVALSEMEVAL数据集来自于2010年的国际语义评测大会中Task 8"Multi-Way Classification of Semantic Relations Between Pairs of Nominals"。

  • SEMEVAL包含以下数据

    • rel2id.json关系标签到ID的映射

    • temp.txt:关系标签处理

    • test.txt 测试集

    • train.txt:训练集

    • val.txt:验证集

  • 开始训练模型加载和保存位置以及配置可以在conf的.yaml文件中修改

    • 对数据集SEMEVAL进行few-shot训练python run.py

    • 训练好的模型默认保存在根目录

  • 从上次训练的模型开始训练:设置.yaml中的train_from_saved_model为上次保存模型的路径

  • 每次训练的日志保存路径默认保存在根目录,可以通过.yaml中的log_dir来配置

  • 进行预测: python predict.py

模型内容

KnowPrompt