目录
目录README.md

=======标注工具=======

功能介绍

1、为当前文本打标签(可以多个)

2、提取文本中的“地名”、“人名”、“中心词”。(每项均可有多个值)

—————————————————————————————————————

python环境配置及外部依赖包

1、python2.7

2、wxPython4.0.4

3、其余python版本也可以,代码适用python2及python3

—————————————————————————————————————

文件说明

data文件夹

—-data/example.json:包含待标注文件

—-data/records/record_01.txt:标注结果

data_process文件夹

—-file2file.py:文件处理类

—-generate_json.py:生成最终的符合标注要求的.json数据

tool文件夹

—-basewin.py:主要是界面布局

—-mainwin.py:包含标注程序的主要逻辑,包含主函数,继承了basewin.py中的类。

—————————————————————————————————————

使用步骤

运行mainwin.py:

1、在运行mainwin.py前,需要依据自己的.json数据以及标签(tags)需求,对标注工具进行一些设置。

2、设置分为3步

3、查看mainwin.py,即可查看3步设置的提示,依次进行设置。

标注具体操作:

1、单击tag按钮,就为该文本选择了该标签(可点击多个)。

2、点击选中“地名”或“人名”或“中心词”后,鼠标在上述文本中,拖动,选中内容,可选多个内容,就为这个选中的标签赋值了。

3、点击“下一条”,进入下一条数据的标注。

4、关闭主窗口后(程序结束运行),已标注文件会保存,下次重新运行程序时,程序会自动从上次标注位置开始载入数据。

5、标注完成。

—————————————————————————————————————

界面展示

主界面

标注结果

—————————————————————————————————————

致谢

本标注工具代码改编自下面这位大佬,附上大佬的博客:https://www.cnblogs.com/JohnRain/

关于
250.0 KB
邀请码
    Gitlink(确实开源)
  • 加入我们
  • 官网邮箱:gitlink@ccf.org.cn
  • QQ群
  • QQ群
  • 公众号
  • 公众号

©Copyright 2023 CCF 开源发展委员会
Powered by Trustie& IntelliDE 京ICP备13000930号