doccano-数据标注工具使用

1、安装

在python环境下使用命令

pip install doccano

即可安装doccano

2、初始化

# 初始化数据库
doccano init

# 创建一个超级用户,用户名和密码为 admin
doccano createuser --username admin --password admin

image-20231130171840347

3、启动doccano

doccano webserver --port 8000

如遇到启动不成功,可以换个端口试试。

image-20231130171650734

再打开一个终端 启动任务队列

doccano task

image-20231130171913347

因为最近的项目需要使用到NLP,但是找了几个云服务商,都没有想要的接口,所以就使用

百度—飞浆

来做数据的处理和分析,先使用该工具进行数据标注后,再导入进行训练。

序列标注:适配命名实体识别、关系抽取、事件抽取、评价观点抽取等任务。 文本分类:适配文本分类、句子级情感倾向分类等任务

详细的后续操作:PaddleNLP/model_zoo/uie/doccano.md at develop · PaddlePaddle/PaddleNLP (github.com)