Skip to content

Latest commit

 

History

History
29 lines (12 loc) · 782 Bytes

README.md

File metadata and controls

29 lines (12 loc) · 782 Bytes

基于法律裁判文书的事件抽取及其应用

简介

针对交通肇事案件的裁判文书进行事件要素抽取

  • 数据来源OpenLaw

  • 预处理:去除标点、注释、冗余词等

  • 分词:尝试了词典匹配法、隐马尔科夫模型、jieba、中科院PYNLPIR系统和哈工大LTP系统,最终选取了哈工大LTP系统

  • 词性标注、命名实体识别:使用了哈工大LTP系统

  • 事件要素抽取:目前使用了CRF模型,不久将加入LSTM等方法

  • 应用部分:在上述工作的基础上,增加一些实际应用场景。包括判决结果的预测、案件相似度的比较等


欢迎愿意共同开发的同学加入我们! wechat : shin-sangokumusou