保藏本站
《天津大学》 2012年
保藏 | 手机翻开
二维码
手机客户端翻开本文

地名本体实体与联系抽取研讨

蒋方玲  
【摘要】:近年来,突发事件一再发作。应急办理的重要性越来越杰出。应急办理的进程中触及多方面数据的交融。怎么快速、精确的供给相关的数据是急需研讨的问题。跟着互联网的开展,网络上的数据呈指数级增加,这些数据中包含了许多应急办理需求的信息。地名信息是应急信息的中心支撑点。本文进行地名本体实体和联系抽取研讨,抽取地名相关的实体和实体间的联系,为应急数据的抽取和语义化奠定中心根底。 实体和联系的抽取归于天然言语处理中的命名实体辨认和联系抽取。现在干流的办法有依据规矩的办法和依据机器学习的办法。本文在抽取的进程中依据原始文本中实体和联系的特色别离量体裁衣地采取了依据规矩和依据机器学习的办法。 因为业界没有树立好的地名范畴抽取的语料库,本文首要树立了地名本体抽取的实体体系和联系体系,然后依据抽取进程中重视的特征树立实体抽取和联系抽取所需求的语料,具体介绍了语料库构建的进程。对地名本体实体依据其在原始文本中呈现的规矩进行了分类,别离选用依据规矩的办法和运用最大熵进行机器学习的办法。首要总结了四类地名本体实体的抽取规矩,然后关于其他的几类地名本体实体,首要对机器学习进程中运用的特征进行了剖析,依据标示的语料,运用最大熵进行了地名实体的抽取。关于联系的抽取,首要剖析了联系的特色,选用依据特征向量的办法,运用SVM进行联系的抽取。依据语料的特色,提出了依据规矩的办法抽取地名本体的联系。一起,剖析了联系的特色,拟定了相关的规矩,从已有的联系动身,推导出隐含的联系,进一步丰厚地名本体联系库。 最终,规划和完成了地名本体实体和联系抽取渠道,并将抽取的数据运用到了实践的语义地名查找引擎中,实践证明,抽取的实体和联系数据很大程度上提升了用户体会,协助了用户更便利、更敏捷、更精确的地名相关数据。
【学位颁发单位】:天津大学
【学位等级】:硕士
【学位颁发年份】:2012
【分类号】:TP391.1

【参考文献】
我国期刊全文数据库
前5条
1
周俊生;戴新宇;尹存燕;陈家骏;;依据层叠条件随机场模型的中文安排名主动辨认[J];电子学报;2006年05期
2
刘克彬;李芳;刘磊;韩颖;;依据核函数中文联系主动抽取体系的完成[J];核算机研讨与开展;2007年08期
3
蒋方玲;王文俊;杨鹏;徐佳佳;;中文地名本体模型研讨[J];核算机工程与运用;2011年25期
4
王宁,葛瑞芳,苑春法,黄锦辉,李文捷;中文金融新闻中公司名的辨认[J];中文信息学报;2002年02期
5
董静;孙乐;冯元勇;黄瑞红;;中文实体联系抽取中的特征挑选研讨[J];中文信息学报;2007年04期
我国硕士188bet全文数据库
前1条
1
张志田;无监督联系抽取办法研讨[D];哈尔滨工业大学;2007年
【共引文献】
我国期刊全文数据库
前10条
1
李玉森;张雪英;袁正午;;面向GIS的地舆命名实体辨认研讨[J];重庆邮电大学学报(天然科学版);2008年06期
2
李建平;王慧强;卢爱平;郝洪亮;冯光升;;依据条件随机场的网络安全态势量化感知办法[J];传感器与微体系;2010年10期
3
黄德根;李泽中;万如;;依据SVM和CRF的双层模型中文安排名辨认[J];大连理工大学学报;2010年05期
4
周顺先;林亚平;王耀南;易叶青;;依据二阶隐马尔可夫模型的文本信息抽取[J];电子学报;2007年11期
5
黄晨;;语义联系抽取开展现状及抽取办法的研讨[J];福建电脑;2009年06期
6
7
王昌厚;;依据条件随机场的中文命名体辨认[J];福建电脑;2012年02期
8
刘海鹏;王小捷;;依据条件随机场和常识库的手机短信命名实体辨认[J];广西师范大学学报(天然科学版);2009年01期
9
胡广朋;程辉;邵玉宝;;依据层叠条件随机场的网络侵略辨认[J];江苏科技大学学报(天然科学版);2008年05期
10
李军;王丁;王鑫;;依据模板匹配的中文安排名辨认[J];信息技能;2008年06期
我国重要会议论文全文数据库
前10条
1
于江德;王希杰;樊孝忠;;汉语词法剖析中上文和下文孰重孰轻[A];我国核算言语学研讨前沿开展(2009-2011)[C];2011年
2
何正焱;王厚峰;;产品品牌称号发掘[A];我国核算言语学研讨前沿开展(2009-2011)[C];2011年
3
俞鸿魁;张华平;刘群;吕学强;施水才;;依据层叠隐马尔可夫模型的中文命名实体辨认[A];全国网络与信息安全技能研讨会'2005论文集(下册)[C];2005年
4
吴雪军;朱靖波;王会珍;叶娜;张宇新;;Co-Training的机器学习办法在中文安排名辨认中的运用[A];言语核算与依据内容的文本处理——全国第七届核算言语学联合学术会议论文集[C];2003年
5
李斌;;中文单字国名简称的主动辨认[A];第二届全国学生核算言语学研讨会论文集[C];2004年
6
乔春庚;肖诗斌;孙丽华;施水才;;规矩与核算相结合的案子称号辨认[A];第三届学生核算言语学研讨会论文集[C];2006年
7
郑家恒;谭红叶;王兴义;;依据形式匹配的中文专有名词辨认[A];民族言语文字信息技能研讨——第十一届全国民族言语文字信息学术研讨会论文集[C];2007年
8
陈禹;史晓东;向晓雯;张润延;;依据混合办法的中文命名实体辨认[A];内容核算的研讨与运用前沿——第九届全国核算言语学学术会议论文集[C];2007年
9
陈慧;张普;;依据DCC动态流转语料库的中文安排名监测与研讨[A];内容核算的研讨与运用前沿——第九届全国核算言语学学术会议论文集[C];2007年
10
徐薇;付滨;刘柳;苑春法;李文捷;;中文命名实体辨认体系的范畴扩展[A];内容核算的研讨与运用前沿——第九届全国核算言语学学术会议论文集[C];2007年
我国博士188bet全文数据库
前10条
1
2
3
吴承荣;www.188bet.com[D];复旦大学;2011年
4
张浩;视频运动人体行为辨认与分类办法研讨[D];西安电子科技大学;2011年
6
刘运;DDoS Flooding进犯检测技能研讨[D];国防科学技能大学;2011年
7
朱锁玲;命名实体辨认在方志内容发掘中的运用研讨[D];南京农业大学;2011年
8
罗芳;定见发掘中若干要害问题研讨[D];武汉理工大学;2011年
9
刘荣辉;多阶段自适应差分进化算法及运用研讨[D];东华大学;2012年
10
张素香;信息抽取中要害技能的研讨[D];北京邮电大学;2007年
我国硕士188bet全文数据库
前10条
1
王东亮;依据条件随机场模型的中文人名辨认的研讨[D];大连理工大学;2010年
2
3
5
6
7
张宜浩;依据最大熵模型的中文实体联系主动抽取研讨[D];昆明理工大学;2010年
9
朱姗;依据本体的电子产品实体联系抽取研讨[D];西安电子科技大学;2011年
10
牛彦清;中文问答体系的问句分类研讨[D];太原理工大学;2011年
【二级参考文献】
我国期刊全文数据库
前10条
1
刘瑜;张毅;田原;薛露露;;广义地名及其本体研讨[J];地舆与地舆信息科学;2007年06期
2
刘群,张华平,俞鸿魁,程学旗;依据层叠隐马模型的汉语词法剖析[J];核算机研讨与开展;2004年08期
3
李保利,陈玉忠,俞士汶;信息抽取研讨总述[J];核算机工程与运用;2003年10期
4
张晓艳;王挺;陈火旺;;命名实体辨认研讨[J];核算机科学;2005年04期
5
何婷婷;徐超;李晶;赵君喆;;依据种子自扩展的命名实体联系抽取办法[J];核算机工程;2006年21期
6
鲁松,白硕;天然言语处理中词语上下文有用规模的定量描绘[J];核算机学报;2001年07期
7
鲁松,李晓黎,白硕,王实;文档中词语权重核算办法的改善[J];中文信息学报;2000年06期
8
张华平,刘群;依据N-最短途径办法的中文词语粗分模型[J];中文信息学报;2002年05期
9
周茜,赵明生,扈旻;中文文本分类中的特征挑选研讨[J];中文信息学报;2004年03期
10
车万翔,刘挺,李生;实体联系主动抽取[J];中文信息学报;2005年02期
我国博士188bet全文数据库
前1条
1
杨小兵;聚类剖析中若干要害技能的研讨[D];浙江大学;2005年
【类似文献】
我国期刊全文数据库
前10条
1
李腊元;核算机网络的一种通讯协议剖析[J];体系工程与电子技能;1995年10期
2
吴学斌;;地名过错何其多[J];我国记者;1992年03期
3
王士滨;石兴平;;核算机辅佐办理地名档案的优点多[J];黑龙江档案;1995年03期
4
蔡德民;;数字地名档案馆的特征及效果[J];河南科技;2006年10期
5
;树立健全地名档案作业[J];我国档案;1985年08期
6
初志贤;王密林;;北京地名剖析四例[J];新闻三昧;2004年11期
7
ZKD;;Google Earth不再“不服水土”[J];电脑爱好者;2006年23期
8
黄芳;;浅谈地名档案数字化建造[J];我国地名;2009年12期
9
钱娟;;旧忆新说——地名串起长远回忆[J];数字与缩微印象;2010年03期
10
张达荣;;搜列易错地名,以便正确运用[J];新闻记者;1993年07期
我国重要会议论文全文数据库
前10条
1
陈肖霞;王霞;;对朗诵语料的音素标示与研讨[A];第六届全国现代语音学学术会议论文集(下)[C];2003年
2
刘昆;张建平;颜永红;;核算言语模型中语料的挑选[A];我国声学学会2005年青年学术会议[CYCA'05]论文集[C];2005年
3
周文德;;重庆政区重复地名研讨[A];我国训诂学研讨会2010年学术年会论文摘要集[C];2010年
4
费小睿;陈玉娜;;汕头市区划地名网络查询体系的规划与完成[A];广东省测绘学会第九次会员代表大会暨学术交流会论文集[C];2010年
5
王庆;;北京部分大街地名标牌书写查询及考虑[A];语文现代化论丛(第八辑)[C];2008年
6
刘全旺;;向阳“北四社”地名之变迁[A];今世北京研讨(2011年第4期)[C];2011年
7
诺明花;张立强;刘汇丹;吴健;丁治明;;汉藏短语抽取[A];第五届全国青年核算言语学研讨会论文集[C];2010年
8
蒋宏飞;曹海龙;杨沐昀;;依据大规模语料的中文词聚类研讨与完成[A];第二届全国学生核算言语学研讨会论文集[C];2004年
9
刘亚斌;李爱军;;朗诵语料与天然白话的差异剖析[A];第六届全国人机语音通讯学术会议论文集[C];2001年
10
刘昊;王健;林鸿飞;;一种模板与图核交融的蛋白质联系抽取办法[A];第六届全国信息检索学术会议论文集[C];2010年
我国重要报纸全文数据库
前10条
1
全国政协常委、我国地舆学会前史地舆专业委员会主任、复旦大学教授 葛剑雄;改地名之风为何愈演愈烈[N];我国文明报;2010年
2
本报记者 潘青青;城市建造快 不少“地名”有点乱[N];台州日报;2010年
3
何敏锋 记者 汪东平;省地名建造推动会在浔举行[N];九江日报;2010年
4
宫廷煜;忻州市 万余条地名基本信息录入数据库[N];我国社会报;2011年
5
通讯员 周建华;市领导监察地名普查作业[N];嘉兴日报;2011年
6
记者 曹晓恒;马踏石,地名背面的待解之谜[N];金华日报;2011年
7
白伟;重生地名要契合“三大要求”[N];太原日报;2008年
8
涂志伟;台湾涉漳旧地名(一)[N];闽南日报;2008年
9
张真真;令人模糊的武汉地名[N];我国文明报;2008年
10
张培安;济宁地名的宿世此生[N];济宁日报;2008年
我国博士188bet全文数据库
前10条
1
何光芒;救灾保障体系规划研讨[D];天津大学;2006年
2
3
李淑霞;地名本体及其在地舆空间数据安排中的运用研讨[D];解放军信息工程大学;2009年
4
王君泽;依据大规模问答语料的问题检索体系[D];华中科技大学;2010年
5
李思;WEB观念发掘中要害问题的研讨[D];北京邮电大学;2012年
6
7
罗芳;定见发掘中若干要害问题研讨[D];武汉理工大学;2011年
8
赵世奇;依据核算的复述获取与生成技能研讨[D];哈尔滨工业大学;2009年
9
刘铁程;多思麦前史地舆研讨[D];兰州大学;2012年
10
赵晖;真实感汉语可视语音组成要害技能研讨[D];国防科学技能大学;2010年
我国硕士188bet全文数据库
前10条
1
蒋方玲;地名本体实体与联系抽取研讨[D];天津大学;2012年
3
乌恩图;1901-1911年间内蒙古地名研讨[D];内蒙古大学;2011年
4
董晓晓;我国地名的人文地舆特征及其空间散布研讨[D];山西师范大学;2012年
5
刘轩孑;西安地名与文明[D];西安外国语大学;2012年
6
于立平;图画视觉特征及其描绘词汇的对齐研讨[D];北京邮电大学;2010年
7
刘娟;韩国政治类语料特色研讨[D];我国人民解放军外国语学院;2005年
8
刘东生;面向专利文献的中文分词技能的研讨[D];沈阳航空工业学院;2010年
9
毋菲;数值信息的抽取办法研讨[D];山西大学;2010年
10
 方便付款方法
 订货知网充值卡
 订货热线
 协助中心