基于种子自扩展的命名实体关系抽取方法的研究

阅读量：

作者：

展开

摘要：

信息抽取对语言信息的自动化处理有着重要的意义,而命名实体之间关系是信息抽取中的一个重要研究课题。它与信息检索、问答系统、信息过滤有直接的关联,同时,作为一项基础性研究,它对于自动文摘、机器翻译、内容理解、语境生成、文本分类以及数字图书馆建设都有重要的研究意义。对于命名实体之间关系的抽取,主要有知识工程和自动训练两种主要的方法。知识工程的方法有相对较好的效果。但是它也有明显的不足,知识工程的方法的开发非常昂贵,且适应性不强。越来越多的学者都开始致力于自动训练方法的研究。本文在目前命名实体之间关系抽取的研究现状下,对命名实体之间关系抽取进行了比较深入的探讨。本文的主要工作是利用统计学的方法,利用自动训练的方法自动获取知识进行命名实体之间关系的抽取。研究工作主要包括以下两个方面: (1)提出了一种基于种子自扩展的命名实体之间关系抽取的方法,运用这种方法可以对大规模文本集合中的命名实体之间关系进行抽取; (2)基于向量空间模型,并采用潜在语义分析和特征提取等技术,完成了对关系抽取时信息的获取。通过以上两种方法,使命名实体之间关系抽取结果的性能大大提高。本文提出的方法在开放语料的测试中,取得了平均72.9%的召回率和平均69.3%的准确率,从而验证了方法的有效性。

展开

关键词：

信息抽取；命名实体之间关系抽取；自动训练方法；种子自扩展；自然语言理解

学位级别：

硕士

DOI：

CNKI:CDMD:2.2006.077902

收藏引用批量引用报错分享

全部来源求助全文

kns.cnki.net

通过文献互助平台发起求助，成功后即可免费获取论文全文。

请先登入

我们已与文献出版商建立了直接购买合作。

你可以通过身份认证进行实名认证，认证成功后本次下载的费用将由您所在的图书馆支付

您可以直接购买此文献，1~5分钟即可下载全文，部分资源由于网络原因可能需要更长时间，请您耐心等待哦~

身份认证全文购买

相似文献

参考文献

引证文献

面向中文文本的空间方位关系抽取方法研究
并通过扩展匹配算法实现基于规则的空间方位关系抽取方法.实验表明,使用不同词性类型的空间词汇同时作为种子词,选择丰富的特征向量,通过BootStrapping迭代方法获取的新增...
蒋文明 - 南京师范大学
被引量: 11发表: 2010年
基于BERT的中文多关系抽取方法研究
命名实体识别关系抽取前置模型分类串联任务BERT模型构建三元组时在文本句子中抽取多个三元组的研究较少,且大多基于英文语境,为此提出了一种基于B E RT的中文多关系抽...
黄梅根刘佳乐刘川 - 《计算机工程与应用》
被引量: 0发表: 2021年
基于BERT的中文多关系抽取方法研究
命名实体识别关系抽取前置模型分类串联任务BERT模型构建三元组时在文本句子中抽取多个三元组的研究较少,且大多基于英文语境,为此提出了一种基于BERT的中文多关系抽取模...
黄梅根，刘佳乐，刘川 - 《计算机工程与应用》
被引量: 0发表: 2021年
多特征融合的实体与关系联合抽取方法研究
随着信息化技术的不断发展,各种文本数据获得爆炸式的增长速度,呈现出规模大,多样化,价值高的特征.这些非结构化的文本数据往往隐藏着大量有价值的知识,但同时也存在着...
姚龙飞 - 太原理工大学
被引量: 0发表: 2023年
一种基于深度学习的命名实体关系抽取与构建方法
本发明提供了一种基于深度学习的命名实体关系抽取与构建方法,用于互联网信息技术领域.本方法针对某一特定领域,在垂直网站上抓取领域内的新闻数据,对获取的新闻数据进行预处理;新闻数据分词,抽取关键词,生成行业词库,利用行业词库对新闻数据重新分词;抽取种...
袁伟，邓攀，闫碧莹，...
被引量: 0发表: 2014年
基于英汉平行语料库的命名实体对自动获取方法研究
命名实体主要包括人名、地名和组织机构名,是标识某一特定实体的词或词组。而双语命名实体等价对是指来自两种不同语言的具有互译关系的命名实体对。现阶段全球化进程不...
张静 - 北京交通大学
被引量: 0发表: 2015年
基于协同自扩展的命名实体集合扩展方法及查询推荐方法
本发明公开了一种基于协同自扩展的命名实体集合扩展方法及查询推荐方法。本方法为:1)根据输入的种子集合,对每一种子生成一模板并对该模板的质量进行评估;2)利用选取的模板进行实例抽取,并建立每一所选模板的模板-实例关系;3)对于每一所选模板,根据所有所选...
孙乐，石贝
被引量: 0发表: 0年
开放域命名实体抽取关键技术研究
4, 提出了融合模板与网络标签扩展的开放域命名实体抽取方法,部分解决了如何准确描述候选实体语义问题为更准确地刻画候选实体的语义信息,本文首先提出了一种基于网络...
齐振宇 - 《毕业生》
被引量: 0发表: 2013年