基本信息
刘汇丹  男  硕导  中国科学院软件研究所
电子邮件: huidan@iscas.ac.cn
通信地址: 北京市海淀区中关村南四街4号,中科院软件所基础软件中心
邮政编码: 100190

招生信息

   
招生专业
081202-计算机软件与理论
招生方向
自然语言处理

教育背景

2009-09--2013-01   中国科学院大学   博士
2004-09--2007-07   中国科学院研究生院   硕士
2000-09--2004-07   北京交通大学   本科

工作经历

   
工作简历
2015-02~现在, 中国科学院软件研究所, 高级工程师
2009-11~2015-02,中国科学院软件研究所, 工程师
2007-07~2009-11,中国科学院软件研究所, 助理工程师

专利与奖励

   
奖励信息
(1) 2014 ACM SIGSPATICAL CUP 竞赛一等奖, 一等奖, 其他, 2014
专利成果
( 1 ) 一种图形用户界面的多语言自适应方法, 发明, 2009, 第 2 作者, 专利号: ZL200710120856.2
( 2 ) 一种解决文件名乱码的ZIP文件解压缩方法, 发明, 2017, 第 1 作者, 专利号: 201410406083.4
( 3 ) 一种基于部件的联机手写藏文字符的识别方法, 发明, 2012, 第 3 作者, 专利号: ZL201110326270.8
( 4 ) 一种基于词位标注的藏文分词方法, 发明, 2015, 第 1 作者, 专利号: 201110116500.8
( 5 ) 一种面向轻量级终端的路网匹配方法, 发明, 2016, 第 5 作者, 专利号: 201310104968.4
( 6 ) 一种字形加粗方法, 发明, 2017, 第 1 作者, 专利号: 201410363929.0
( 7 ) 提供云字库服务的方法和系统, 发明, 2015, 第 5 作者, 专利号: 2014107570383
( 8 ) 双语对齐语料的加工方法及装置, 发明, 2015, 第 1 作者, 专利号: 201510076025.4

出版信息

   
发表论文
(1) 基于深度学习的藏文分词方法, 计算机工程与设计, 2018, 第 2 作者
(2) CTTC: A Collection of Tibetan Text Corpora, Proceedings of LREC 2018 Workshop on Belt & Road: Language Resources and Evaluation, 2018, 第 1 作者
(3) 汉—藏人名用字音译规则研究, 中文信息学报, 2018, 第 3 作者
(4) 基于大规模网络语料的藏文音节拼写错误统计与分析, 中文信息学报, 2017, 第 1 作者
(5) 藏语音节标注研究, 中文信息学报, 2017, 第 2 作者
(6) Web 藏文文本资源挖掘与利用研究, 中文信息学报, 2017, 第 1 作者
(7) 藏文国际音标(拉萨音)自动转换研究, 中文信息学报, 2016, 第 2 作者
(8) 藏文编码字符集标准应用中的问题及对策, 中文信息学报, 2016, 第 2 作者
(9) A Chinese to Tibetan Machine Translation System with Multiple Translating Strategies, Himalayan Linguistics, 2016, 第 1 作者
(10) Tibetan Trisyllabic Light Verb Construction Recognition, Himalayan Linguistics, 2016, 第 3 作者
(11) Tibetan Trisyllabic Light Verb Construction Recognition, Himalayan Linguistics, 2016, 第 3 作者
(12) 藏文编码字符集标准应用中的问题及对策, 信息技术与标准化, 2016, 第 2 作者
(13) Tibetan Unknown Word Identification from News Corpora for Supporting Lexicon-based Tibetan Word Segmentation, Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing (Volume 2: Short Papers), 2015, 第 2 作者
(14) Tibetan Word Segmentation as Sub-syllable Tagging with Syllable’s Part-of-Speech Property, Chinese Computational Linguistics and Natural Language Processing Based on Naturally Annotated Big Data, 2015, 第 1 作者
(15) 基于藏语字性标注的词性预测研究, 中文信息学报, 2015, 第 2 作者
(16) Zipf’s Law and Statistical Data on Modern Tibetan, The 25th International Conference on Computational Linguistics (COLING 2014), 2014, 第 1 作者
(17) 新标准体系下的通用蒙古文变形显现模型的设计与实现, 中文信息学报, 2013, 第 2 作者
(18) 基于短语串实例的汉藏辅助翻译, 中文信息学报, 2013, 第 3 作者
(19) Tibetan base Noun Phrase Identification framework based on Chinese-Tibetan sentence aligned corpus, In Proceedings of the 24th International Conference on Computational Linguistics (COLING2012), 2012, 第 2 作者
(20) SegT:一个实用的藏文分词系统, 中文信息学报, 2012, 第 1 作者
(21) 基于关联度的汉藏多词单元等价对抽取方法, 中文信息学报, 2012, 第 2 作者
(22) Tibetan Word Segmentation as Syllable Tagging Using Conditional Random Fields, In Proceedings of the 25th Pacific Asia Conference on Language, Information and Computation (PACLIC-2011), 2011, 第 1 作者
(23) MRG-OHTC Database for Online Handwritten Tibetan Character Recognition, ICDAR, 2011, 第 2 作者
(24) Tibetan Number Identification Based on Classification of Number Components in Tibetan Word Segmentation, In Proceedings of the 23rd International Conference on Computational Linguistics, 2010, 第 1 作者
发表著作
(1) 藏文自动分词的理论与方法研究, 知识产权出版社, 2016-03, 第 2 作者

科研活动

   
科研项目
( 1 ) “中华字库”工程第23包“应用平台研发”, 参与, 国家级, 2011-04--2018-06
( 2 ) 藏语命名实体识别关键技术研究, 参与, 国家级, 2014-01--2016-12
( 3 ) 古籍引文自动校对技术研发, 参与, 院级, 2017-08--2017-12
( 4 ) 面向古籍文献出版的汉字繁简转换系统, 主持, 院级, 2018-10--2018-12
( 5 ) 繁简转换系统二期, 主持, 院级, 2019-06--2019-10
( 6 ) 古籍文本词频统计及分词研究, 主持, 国家级, 2019-01--2020-12

指导学生

已指导学生

金琪  硕士研究生  083500-软件工程  

现指导学生

伍家豪  硕士研究生  083500-软件工程