【ChatIE】论文解读：Zero-Shot Information Extraction via Chatting with ChatGPT-阿里云开发者社区

【ChatIE】论文解读：Zero-Shot Information Extraction via Chatting with ChatGPT

2024-05-09 34

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【ChatIE】论文解读：Zero-Shot Information Extraction via Chatting with ChatGPT

论文：Zero-Shot Information Extraction via Chatting with ChatGPT

作者：Xiang Wei, Xingyu Cui, Ning Cheng, Xiaobin Wang, Xin Zhang, Shen Huang, Pengjun Xie, Jinan Xu, Yufeng Chen, Meishan Zhang, Yong Jiang, Wenjuan Han

时间：2023

zero-shot information extraction 的目是从未注释的文本中构建信息提取(IE)系统，由于大模型发展迅速，其下游任务效果有了质的提升，文章中考虑采用prompt技巧进行信息提取，观察zero-shot 提取信息的可取性；

为此创建了一个二阶段的多回合问答框架ChatIE，并在三个IE任务上广泛地评估：整体关系三重提取、命名实体识别和事件提取。在两种语言的6个数据集上的经验结果表明，ChatIE取得了令人印象深刻的性能；

介绍

首先information extration 的目的是从非结构化的文本中提取出结构化的信息，并将结构化的信息转化为结构化的数据格式，信息提取主要由三块任务构成：三元组提取，实体命名识别，事件提取 entity-relation triple extract (RE), named entity recognition (NER), event extraction (EE)；

在一般的处理工作中，以RE任务中PURE模型举例子[2010.12812] A Frustratingly Easy Approach for Entity and Relation Extraction (arxiv.org)，首先识别出两个实体，然后再预测两个实体之间的关系，虽然说效果很好，但是这只适用于特别的任务并且是监督训练的，需要大量的标注数据；

由于一般IE方法的特殊性和昂贵性，这里转向研究ChatGPT的prompt来进行IE任务处理；

作者提出了一个两阶段的多轮问答框架，在第一阶段找出相应的元素类型，在第二阶段对每个元素类型进行链式信息提取；利用该框架进行信息提取的效果很明显；