基于种子自扩展的命名实体关系抽取方法的研究
阅读量:
68
摘要:
信息抽取对语言信息的自动化处理有着重要的意义,而命名实体之间关系是信息抽取中的一个重要研究课题。它与信息检索、问答系统、信息过滤有直接的关联,同时,作为一项基础性研究,它对于自动文摘、机器翻译、内容理解、语境生成、文本分类以及数字图书馆建设都有重要的研究意义。 对于命名实体之间关系的抽取,主要有知识工程和自动训练两种主要的方法。知识工程的方法有相对较好的效果。但是它也有明显的不足,知识工程的方法的开发非常昂贵,且适应性不强。越来越多的学者都开始致力于自动训练方法的研究。 本文在目前命名实体之间关系抽取的研究现状下,对命名实体之间关系抽取进行了比较深入的探讨。本文的主要工作是利用统计学的方法,利用自动训练的方法自动获取知识进行命名实体之间关系的抽取。研究工作主要包括以下两个方面: (1)提出了一种基于种子自扩展的命名实体之间关系抽取的方法,运用这种方法可以对大规模文本集合中的命名实体之间关系进行抽取; (2)基于向量空间模型,并采用潜在语义分析和特征提取等技术,完成了对关系抽取时信息的获取。 通过以上两种方法,使命名实体之间关系抽取结果的性能大大提高。 本文提出的方法在开放语料的测试中,取得了平均72.9%的召回率和平均69.3%的准确率,从而验证了方法的有效性。
展开
学位级别:
硕士
DOI:
CNKI:CDMD:2.2006.077902
通过文献互助平台发起求助,成功后即可免费获取论文全文。
相似文献
参考文献
引证文献
辅助模式
引用
文献可以批量引用啦~
欢迎点我试用!