Insert title here
    登录 | 注册 | 期刊登录 | 收藏
 
 高级组合检索
电子学报 2006, Vol. 34 (5) :804 -809 <<-上一篇 下一篇 ->>
引用: 周俊生,戴新宇,尹存燕,等.基于层叠条件随机场模型的中文机构名自动识别[J].电子学报,2006,(5):804-809
Cite:ZHOUJun-sheng,DAIXin-yu,YINCun-yan,et.al.Automatic Recognition of Chinese Organization Name Based on Cascaded Conditional Random Fields[J].Acta Electronica Sinica,2006,(5):804-809
基于层叠条件随机场模型的中文机构名自动识别
周俊生1,2, 戴新宇1, 尹存燕1, 陈家骏1
1. 南京大学计算机软件新技术国家重点实验室,江苏南京 210093;2. 南京师范大学计算机科学系,江苏南京 210097
Automatic Recognition of Chinese Organization Name Based on Cascaded Conditional Random Fields
ZHOU Jun-sheng1,2, DAI Xin-yu1, YIN Cun-yan1, CHEN Jia-jun1
1. State Kay Laboratory for Novel Software Techonology,Nanjing University,Nanjing,Jiangsu 210093,China;2. Deptartment of Computer Science,Nanjing Normal University,Nanjing,Jiangsu 210097,China
全文:     原文
摘要: 中文机构名的自动识别是自然语言处理中的一个比较困难的问题.本文提出了一种新的基于层叠条件随机场模型的中文机构名自动识别算法.该算法在低层条件随机场模型中解决对人名、地名等简单命名实体的识别,将识别结果传递到高层模型,为高层的机构名条件随机场模型实现对复杂机构名的识别提供决策支持.文中为机构名条件随机场模型设计了有效的特征模板和特征自动选择算法.对大规模真实语料的开放测试中,召回率达到90.05%,准确率达到88.12%,性能优于其它中文机构名识别算法.
关键词条件随机场 中文机构名识别 命名实体
分类号: TP391
Abstract: Automatic recognition of Chinese organization name is a very difficult problem in many NLP tasks.This paper presents a new algorithm of Chinese organization name recognition based on cascaded conditional random fields.In the proposed algorithm,the person name and location name are first recognized by the lower model.The result then is passed to the high model and supports the decision of high model for recognition of the complicated organization names.We experimentally evaluate the algorithm on large-scale corpus.In open test,its recalling rate achieves 90.05% and the precision rate 88.12%.The evaluation results show that the algorithm based on cascaded conditional random fields significantly outperforms previous methods.
Keywords: conditional random fields Chinese organization name recognition named entity
收稿日期:2005-04-08      修回日期:2005-12-12     
[1]
[2]
[3]王东波,陈小荷,年洪东,基于条件随机场的有标记联合结构自动识别[J].中文信息学报,2008,(6):3-7
[4]HUANGJian-Bin,姬红兵,SUNHe-Li,基于混合跳链条件随机场的异构Web记录集成方法[J].软件学报,2008,(8):2149-2158
[5]李玉森,张雪英,袁正午,面向GIS的地理命名实体识别研究[J].重庆邮电大学学报(自然科学版),2008,(6):719-724
[6]薛征山,郭剑毅,余正涛,等.基于HMM的中文旅游景点的识别[J].昆明理工大学学报(自然科学版),2009,(6):44-48
[7]戴播,毛奇,袁春风,一种基于共坐标上升算法的人名识别方法[J].计算机应用与软件,2010,(4):7-9
[8]黄德根,焦世斗,周惠巍,基于子词的双层CRFs中文分词[J].计算机研究与发展,2010,(5):962-968
[9]
[10]李建平,王慧强,卢爱平,等.基于条件随机场的网络安全态势量化感知方法[J].传感器与微系统,2010,(10):83-86
[11]
[12]常娥,侯汉清,曹玲,古籍自动校勘的研究和实现[J].中文信息学报,2007,(2):83-88
[13]
[14]
[15]胡广朋,程辉,邵玉宝,基于层叠条件随机场的网络入侵识别[J].江苏科技大学学报(自然科学版),2008,(5):63-66
[16]郭剑毅,薛征山,余正涛,等.基于层叠条件随机场的旅游领域命名实体识别[J].中文信息学报,2009,(5):47-52
[17]黄天羽,石崇德,李凤霞,等.一种基于判别随机场模型的联机行为识别方法[J].计算机学报,2009,(2):275-281
[18]
[19]
[20]刘海鹏,王小捷,基于条件随机场和知识库的手机短信命名实体识别[J].广西师范大学学报(自然科学版),2009,(1):177-180
[21]张奇,金培权,岳丽华,基于CRF的网页动态关系抽取研究[J].中国科学技术大学学报,2010,(11):1197-1202
[22]滕青青,吉久明,郑荣廷,等.基于文献的中文命名实体识别算法适用性分析研究[J].情报杂志,2010,(9):157-161
[23]昝红英,张军珲,朱学锋,等.副词"就"的用法及其自动识别研究[J].中文信息学报,2010,(5):10-16
[24]唐旭日,陈小荷,许超,等.基于篇章的中文地名识别研究[J].中文信息学报,2010,(2):24-32
[25]蔡月红,朱倩,程显毅,基于Tri-training半监督学习的中文组织机构名识别[J].计算机应用研究,2010,(1):193-195
[26]佘俊,张学清,音乐命名实体识别方法[J].计算机应用,2010,(11):2928-2931
[27]
[28]HUANGJian-Bin,姬红兵,SUNHe-Li,基于混合跳链条件随机场的异构Web记录集成方法[J].软件学报,2008,(8):2149-2158
[29]张付志,侯娜,刘慧,等.一种基于启发式搜索的论文元数据提取算法[J].计算机应用与软件,2009,(9):86-88
[30]周波,蔡东风,基于条件随机场的中文组织机构名识别研究[J].沈阳航空航天大学学报,2009,(1):49-52
Insert title here
更多服务: 作者自存档 | 投稿导航 | 全球期刊检索 | 查找审稿人
关于我们 | 隐私申明 | 免责声明 | 意见反馈 | 合作服务
Magsci ©  版权所有
Copyright © 2010 - 2013 Magtech. All Rights Reserved.