基本信息
杨雅婷  女  硕导  中国科学院新疆理化技术研究所
电子邮件: yangyt@ms.xjb.ac.cn
通信地址: 新疆乌鲁木齐市新市区北京南路40-1号
邮政编码: 830011

研究领域

多语言自然语言处理,跨语言机器翻译、文本内容理解

招生信息

招收硕士研究生

招生专业
081203-计算机应用技术
085211-计算机技术
招生方向
计算机应用技术,自然语言处理
计算机技术

教育背景

2007-09--2012-07   中国科学院   获得工学博士学位
2003-09--2007-06   长安大学信息工程学院   获得工学学士学位
学历

博士研究生

学位

工学博士学位

工作经历

中国科学院语言声学与内容理解重点实验室,博士后。中国科学院新疆理化技术研究所多语种信息技术研究室(新疆维吾尔自治区“民族语言语音文字信息处理”重点实验室、“民族语音文字信息处理联合实验室”),研究员,硕士研究生导师。


从事多语种信息处理关键技术研究,目前主要研究方向为机器翻译关键技术、语种识别关键技术、话题检测与内容理解关键技术等。中国科学院新疆理化技术研究所“一三五”重大突破“面向“一带一路”的多语言机器翻译系统研究与应用”技术负责人。NLPCCCCLCWMTIEEE GlobalSIP等国际、国内学术会议和学术期刊审稿人。


工作简历
2013-10~2017-02,中国科学院声学研究所, 博士后
2012-07~现在, 中国科学院新疆理化技术研究所, 副研究员
社会兼职
2017-02-15-今,中国计算机学会中文息处理专委会青工委, 副主席
2016-05-01-今,新疆自治区专家顾问团网络信息组秘书,
2013-04-15-今,中国中文信息学会青工委, 委员
2012-08-01-今,新疆自治区专家顾问团信息与交通组秘书,

教授课程

多语种信息处理技术

专利与奖励

专利:

(1)面向资源缺乏语言的实体链接系统

(2)多特征融合的文本相似性度量系统

奖励:

2019年新疆维吾尔自治区科技进步一等奖(排名第二)

奖励信息
(1) 先进工作者, 研究所(学校), 2015
(2) 优秀党务工作者, 研究所(学校), 2015
(3) “优秀党务工作者”荣誉, , 其他, 2013
(4) “先进工作者”荣誉, , 研究所(学校), 2013
(5) 中国科学院院长奖, , 院级, 2012
(6) “朱李月华优秀博士生奖”, , 院级, 2011
(7) “全国人际语音通讯学术会议最佳论文奖”, , 其他, 2011
(8) 中科院新疆理化技术研究所“优秀党员”荣誉, , 研究所(学校), 2011
(9) 中科院研究生院“三好学生标兵”荣誉, , 院级, 2011
(10) 中科院新疆理化技术研究所“优秀党员”荣誉, , 研究所(学校), 2010
(11) 中科院研究生院“优秀学生干部”荣誉, , 院级, 2010
(12) 中科院研究生院“三好学生”荣誉, , 院级, 2009
专利成果
[1] 马博, 地力夏提·阿布都热依木, 杨雅婷, 王磊, 周喜, 董瑞. 基于注意力机制多特征融合的虚假信息检测方法、装置、电子设备及存储介质. CN202111069695.5, 2021-09-13.

[2] 杨雅婷, 罗涵天, 马博, 董瑞, 王磊, 周喜. 一种基于胶囊网络的多语言情感分类方法、装置、设备及存储介质. CN202111067682.4, 2021-09-13.

[3] 杨雅婷, 张文博, 董瑞, 马博, 王磊, 周喜. 面向新闻的热点话题检测方法、装置及设备. CN: CN202110271853.9, 2021-07-23.

[4] 杨雅婷, 艾孜麦提·艾尼瓦尔, 董瑞, 马博, 王磊, 周喜. 基于汉语关键词的维吾尔语关键词生成方法、装置、电子设备及存储介质. CN: CN202110271879.3, 2021-07-23.

[5] 杨雅婷, 陈玺, 董瑞, 马博, 王磊, 周喜. 基于词向量替换数据增强的机器翻译模型训练方法、装置、电子设备及存储介质. CN202110271844.X, 2021-03-13.

[6] 马博, 郭世伟, 马玉鹏, 杨雅婷, 周喜, 王磊. 公共医疗卫生命名实体识别与实体链接方法、装置、电子设备及存储介质. CN202110195263.2, 2021-02-19.

[7] 马博, 蒋同海, 周喜, 杨雅婷, 王磊, 马玉鹏, 赵凡, 王轶. 面向连续时空加油数据的异常检测方法. CN: ZL201910509163.5, 2019-09-13.

[8] 蒋同海, 李晓, 马博, 王磊, 周喜, 赵凡, 杨雅婷. 面向资源缺乏语言的实体链接系统. 中国: ZL201510304943.8, 2018-03-20.

[9] 马博, 李晓, 蒋同海, 周喜, 王磊, 杨雅婷, 赵凡. 多特征融合的文本相似性度量系统. 中国: ZL201510072955.2, 2017-10-17.

出版信息

   
发表论文
[1] 郭世伟, 马博, 马玉鹏, 杨雅婷. 基于预训练模型和图卷积网络的中文短文本实体链接. 中文信息学报[J]. 2022, [2] 地力夏提·阿布都热依木, 马博, 杨雅婷, 王磊. 基于注意力机制多特征融合的虚假信息检测. 厦门大学学报(自然科学版)[J]. 2022, [3] 冯笑, 杨雅婷, 马博, 董瑞. 基于集成修剪的维汉神经机器翻译系统. 制造业自动化[J]. 2022, [4] 杨振宇, 王磊, 马博, 杨雅婷, 董瑞, 艾孜麦提·艾瓦尼尔, 王震. 一种针对维汉的跨语言远程监督方法. 计算机工程[J]. 2022, [5] 罗涵天, 杨雅婷, 马博, 董瑞, 李晓. 加入梯度均衡机制的端到端方面级情感分析. 计算机工程与设计[J]. 2022, [6] 冯笑, 杨雅婷, 董瑞, 艾孜买提·艾瓦尼尔, 马博. 基于回译和集成学习的维汉神经机器翻译方法. 兰州理工大学学报[J]. 2022, [7] 罗涵天, 杨雅婷, 董瑞, 马博. 基于时间注意力胶囊网络的维吾尔语情感分类模型. 中文信息学报[J]. 2022, [8] 张朋捷, 王磊, 马博, 杨雅婷, 董瑞, 艾孜买提·艾瓦尼尔. 基于预训练语言模型的维吾尔语事件抽取研究. 计算机工程与设计[J]. 2022, [9] Zhen Wang, Yating Yang, Xi Zhou, Bo Ma, Lei Wang, Rui Dong, Azmat Anwar. An Answer Space Clustered Prompting Method without Answer Engineering. ACL2022null. 2022, [10] Yajuan Wang, Xiao Li, Yating Yang, Azmat Anwar, Rui Dong. Hybrid System Combination Framework for Uyghur–Chinese Machine Translation. Information[J]. 2021, 12(98): https://doaj.org/article/da10c6f3d72944b5b21435fe4a4a857c.
[11] Wenbo Zhang, Xiao Li, Yating Yang, Rui Dong. Pre-Training on Mixed Data for Low-Resource Neural Machine Translation. Information[J]. 2021, 12(133): https://doaj.org/article/bd0b76b4e99647c5b8e1967ef61e4236.
[12] Zhenyu Yang, Lei Wang, Bo Ma, Yating Yang, Rui Dong, Zhen Wang. RTJTN: Relational Triplet Joint Tagging Network for Joint Entity and Relation Extraction. Computational Intelligence and Neuroscience[J]. 2021, 2021: [13] 李晓. Constructing Uyghur Named Entity Recognition System using Neural Machine Translation Tag Projection. China National Conference on Computational Linguistics. 2020, [14] Yu Li, Xiao Li, Yating Yang, Rui Dong. A Diverse Data Augmentation Strategy for Low-Resource Neural Machine Translation. INFORMATION[J]. 2020, 11(5): [15] 穆妮热·穆合塔尔, 李晓, 杨雅婷. 维吾尔语复杂形态对汉维机器翻译的影响研究. 计算机工程[J]. 2020, 46(2): 309-314, http://lib.cqvip.com/Qikan/Article/Detail?id=7100855445.
[16] Pan, Yirong, Li, Xiao, Yang, Yating, Dong, Rui. Multi-Source Neural Model for Machine Translation of Agglutinative Language. FUTURE INTERNET[J]. 2020, 12(6): https://doaj.org/article/0d5194f4b4744a778908f71a06f61d69.
[17] 李晓. Multi-Task Neural Model for Agglutinative Language Translation. Multi-Task Neural Model for Agglutinative Language Translation. 2020, [18] 张琳琳, 杨雅婷, 陈沾衡, 潘一荣, 李毓. 基于深度学习的相似语言短文本的语种识别方法. 计算机应用与软件. 2020, 37(2): 124-129+176, http://lib.cqvip.com/Qikan/Article/Detail?id=7100842236.
[19] 董瑞, 杨雅婷, 蒋同海. 融合多种语言学特征的维吾尔语神经网络命名实体识别. 计算机应用与软件. 2020, 37(5): 183-188, http://lib.cqvip.com/Qikan/Article/Detail?id=7101610690.
[20] Zhang, Xinlu, Li, Xiao, Yang, Yating, Dong, Rui. Improving Low-Resource Neural Machine Translation With Teacher-Free Knowledge Distillation. IEEE ACCESS[J]. 2020, 8: 206638-206645, https://doaj.org/article/235779ca011d4329b08486a59975cbee.
[21] Zhang, Wenbo, Li, Xiao, Yang, Yating, Dong, Rui, Luo, Gongxu. Keeping Models Consistent between Pretraining and Translation for Low-Resource Neural Machine Translation. FUTURE INTERNET[J]. 2020, 12(12): https://doaj.org/article/0607104390094c4986dc88c43f4aa338.
[22] Zhang, Yishuo, Li, Gang, Muskat, Birgit, Law, Rob, Yang, Yating. Group pooling for deep tourism demand forecasting. ANNALS OF TOURISM RESEARCH[J]. 2020, 82: http://dx.doi.org/10.1016/j.annals.2020.102899.
[23] 朱相荣, 王磊, 杨雅婷, 董瑞, 张俊. 基于非自回归方法的维汉神经机器翻译. 计算机应用[J]. 2020, 40(7): 1891-1895, http://lib.cqvip.com/Qikan/Article/Detail?id=7102370892.
[24] 杨雅婷. 面向汉维机器翻译的BERT嵌入研究. 计算机工程. 2020, [25] 袁扬, 李晓, 杨雅婷. 基于LDA主题模型的维吾尔语无监督词义消歧. 厦门大学学报:自然科学版[J]. 2020, 59(2): 198-205, http://lib.cqvip.com/Qikan/Article/Detail?id=7101160582.
[26] 潘一荣, 李晓, 杨雅婷, 董瑞. 面向汉维机器翻译的双语关联度优化模型. 计算机应用研究[J]. 2020, 37(3): 726-730, http://lib.cqvip.com/Qikan/Article/Detail?id=7101662481.
[27] 张新路, 李晓, 杨雅婷, 王磊, 董瑞. 面向维汉神经机器翻译的双向重排序模型分析. 北京大学学报(自然科学版)[J]. 2020, 56(1): 31-38, http://lib.cqvip.com/Qikan/Article/Detail?id=7100944476.
[28] GongXu Luo, YaTing Yang, Rui Dong, YanHong Chen, WenBo Zhang. A Joint Back-Translation and Transfer Learning Method for Low-Resource Neural Machine Translation. MATHEMATICAL PROBLEMS IN ENGINEERING[J]. 2020, 2020: https://doaj.org/article/3ee33e9edcd04597aa86ce4dd19ea6e7.
[29] 潘一荣, 李晓, 杨雅婷, 董瑞. 面向维汉机器翻译的层次化多特征融合模型. 厦门大学学报(自然科学版)[J]. 2020, 59(2): 206-212, http://lib.cqvip.com/Qikan/Article/Detail?id=7101160583.
[30] Muhetaer Munire, Xiao Li, Yating Yang. Construction of the Uyghur Noun Morphological Re-Inflection Model Based on Hybrid Strategy. Applied Sciences[J]. 2019, 9(4): http://ir.xjipc.cas.cn/handle/365002/5731.
[31] Bo Ma, Yating Yang, Guangyi Zhang, Fan Zhao, Yi Wang. A Multi-View Spatial-Temporal Network for Vehicle Refueling Demand Inference. KSEM2019null. 2019, [32] Rui Dong, Yating Yang, Tonghai Jiang. Spelling Correction of Non-Word Errors in Uyghur–Chinese Machine Translation. Information[J]. 2019, 10(6): https://doaj.org/article/18e5defb4e2148e5a4b573ff65382b4a.
[33] 杨山, 杨雅婷, 温正阳, 米成刚. 基于语义空间的抽取式单文档摘要方法. 厦门大学学报(自然科学版)[J]. 2019, 58(02期): 237-242, http://lib.cqvip.com/Qikan/Article/Detail?id=7001488791.
[34] Yang Yating. Research of Uyghur-Chinese Machine Translation System Combination Based on Semantic Information. Proceedings of International Conference on Natural Language Processing and Chinese Computing. 2019, [35] Anwar, Azmat, Li, Xiao, Yang, Yating, Wang, Yajuan. Constructing Uyghur Commonsense Knowledge Base by Knowledge Projection. APPLIED SCIENCES-BASEL[J]. 2019, 9(16): http://apps.webofknowledge.com/CitedFullRecord.do?product=UA&colName=WOS&SID=5CCFccWmJJRAuMzNPjj&search_mode=CitedFullRecord&isickref=WOS:000484444100112.
[36] ShaoLin Zhu, Xiao Li, YaTing Yang, Lei Wang, ChengGang Mi. A Novel Deep Learning Method for Obtaining Bilingual Corpus from Multilingual Website. Mathematical Problems in Engineering[J]. 2019, 2019(1): http://gooa.las.ac.cn/external/index?type=-1&pid=1464976.
[37] 吐尔洪·吾司曼, 杨雅婷, 王磊, 周喜, 程力. 基于汉维映射关系构建维吾尔语依存树库. 中文信息学报[J]. 2019, 103-110, http://lib.cqvip.com/Qikan/Article/Detail?id=77698383504849574849484954.
[38] Xie, Hongtao, Fang, Shancheng, Zha, ZhengJun, Yang, Yating, Li, Yan, Zhang, Yongdong. Convolutional Attention Networks for Scene Text Recognition. ACM TRANSACTIONS ON MULTIMEDIA COMPUTING COMMUNICATIONS AND APPLICATIONS[J]. 2019, 15(1): http://ir.xjipc.cas.cn/handle/365002/5690.
[39] 杨世勤, 王磊, 杨雅婷, 米成刚. 基于短语汉维机器翻译解码的研究及实现. 计算机工程与设计[J]. 2019, 1183-1189, http://lib.cqvip.com/Qikan/Article/Detail?id=83748374504849574852485253.
[40] 王亚娟, 李晓, 杨雅婷, 米成刚. 基于释义信息的维汉机器翻译系统融合研究. 计算机工程[J]. 2019, 45(04期): 288-295+301, http://lib.cqvip.com/Qikan/Article/Detail?id=7001718501.
[41] Munire, Muhetaer, Li, Xiao, Yang, Yating. Construction of the Uyghur Noun Morphological Re-Inflection Model Based on Hybrid Strategy. APPLIED SCIENCES-BASEL[J]. 2019, 9(4): http://ir.xjipc.cas.cn/handle/365002/5731.
[42] 张文博, 米成刚, 杨雅婷. 基于词对向量的中文新闻话题检测方法. 厦门大学学报(自然科学版)[J]. 2019, 58(02期): 231-236, http://lib.cqvip.com/Qikan/Article/Detail?id=7001488790.
[43] Abdukerim, Ghalip, Tursun, Eziz, Yang, Yating, Li, Xiao. UYGHUR MORPHOLOGICAL ANALYSIS USING JOINT CONDITIONAL RANDOM FIELDS: BASED ON SMALL SCALED CORPUS. DISCRETE AND CONTINUOUS DYNAMICAL SYSTEMS-SERIES S[J]. 2019, 12(4-5): 823-836, http://ir.xjipc.cas.cn/handle/365002/5723.
[44] 吐尔洪·吾司曼, 杨雅婷, 艾孜孜·吐尔逊, 程力. 字符级的维吾尔语形态协同分析方法. 北京大学学报(自然科学版). 2019, 55(1): 47-54, http://lib.cqvip.com/Qikan/Article/Detail?id=7001163906.
[45] Azmat Anwar, Xiao Li, Yating Yang, Yajuan Wang. Constructing Uyghur Commonsense Knowledge Base by Knowledge Projection. Applied Sciences[J]. 2019, 9(16): https://doaj.org/article/d617a2cbb3774eaf96cee1f37a12fab2.
[46] Luo, Gongxu, Yang, Yating, Yuan, Yang, Chen, Zhanheng, Ainiwaer, Aizimaiti. Hierarchical Transfer Learning Architecture for Low-Resource Neural Machine Translation. IEEE ACCESS[J]. 2019, 7: 154157-154166, https://doaj.org/article/7a06e23b9bae4848b62c4fbaadc141cc.
[47] 罗延根, 李晓, 蒋同海, 杨雅婷, 周喜, 王磊. 基于词向量的维吾尔语词项归一化方法. 计算机工程[J]. 2018, 44(2): 220-225, http://lib.cqvip.com/Qikan/Article/Detail?id=674469251.
[48] Bo Ma, Yating Yang, Tonghai Jiang, Xi Zhou, Lei Wang. Graph-based Reranking Approach for DBpedia Entity Search. CIKM2018 EYRE Workshopnull. 2018, [49] Yang Shan, Yang Yating, Mi Chenggang, Pan Yirong, Wang Lei, Ma Bo. Extractive Summarization of Documents by Combining Semantic Content and Non-structured Features. 2018 INTERNATIONAL CONFERENCE ON ASIAN LANGUAGE PROCESSING (IALP)null. 2018, 279-284, [50] 杨世勤. 基于短语汉维机器翻译解码的研究及实现. 2018, http://ir.xjipc.cas.cn/handle/365002/5453.
[51] Yang Yating. Toward Better Loanword Identification in Uyghur Using Cross-lingual Word Embeddings. COLING2018. 2018, [52] Yang Yating. A Neural Network Based Model for Loanword Identification in Uyghur. LREC2018. 2018, [53] Zhu ShaoLin, Li Xiao, Yang YaTing, Wang Lei, Mi ChengGang, Huang X, Jiang J, Zhao D, Feng Y, Hong Y. Learning Bilingual Lexicon for Low-Resource Language Pairs. NATURAL LANGUAGE PROCESSING AND CHINESE COMPUTING, NLPCC 2017null. 2018, 10619: 760-770, [54] Yang Yating. Research on temporal expression recognition: a case study of uyghur. An International Journal of Research and Surveys. 2018, [55] 周喜, 艾孜尔古丽, 杨雅婷, 穆妮热穆合塔尔, 李晓. 基于词缀的维吾尔谚语识别关键技术研究. 智能系统学报. 2018, 13(3): 452-457, http://lib.cqvip.com/Qikan/Article/Detail?id=7000660251.
[56] 孔金英, 李晓, 王磊, 杨雅婷, 罗延根. 调序规则表的深度过滤研究. 计算机科学与探索. 2017, 11(5): 785-793, http://lib.cqvip.com/Qikan/Article/Detail?id=7000193155.
[57] Yang Yating. A Post-reordering model BasedMaximum Entropy in Statistic Machine Translation. IJHIT. 2017, [58] 李晓. A Content-Based Neural Reordering Model for Statistical Machine Translation. Communications in Computer and Information Science. 2017, [59] Yang Yating. Domain Adaption Based on LDA and Word Embedding in SMT. IALP2017. 2017, [60] 朱少林, 杨雅婷, 米成刚, 李晓, 王磊. 基于双语句对覆盖度的维汉机器翻译语料选取技术. 中国科学技术大学学报[J]. 2017, 47(4): 283-289, http://ir.xjipc.cas.cn/handle/365002/4805.
[61] Murat Alim, Osman Turghun, Li Xiao, Yang Yating, Zhou Xi, Wang Lei. Using Semantic Knowledge in the Uyghur-Chinese Person Name Transliteration. Journal of Information Processing Systems[J]. 2017, 13(4): 716-730, http://ir.xjipc.cas.cn/handle/365002/5085.
[62] Kong, Jinying, Yang, Yating, Wang, Lei, Zhou, Xi, Jiang, Tonghai, Li, Xiao. Filtering Reordering Table Using a Novel Recursive Autoencoder Model for Statistical Machine Translation. MATHEMATICAL PROBLEMS IN ENGINEERING[J]. 2017, 2017: https://doaj.org/article/7b43ea5dc8394cdebe322eeffc64ad4c.
[63] Yang, Yating, Li, Xiao, Jiang, Tonghai, Kong, Jinying, Ma, Bo, Zhou, Xi, Wang, Lei. Improving Adversarial Neural Machine Translation with Prior Knowledge. GLOBALSIPnull. 2017, 1373-1377, [64] 阿力木木拉提, 艾孜尔古丽, 杨雅婷, 李晓. 基于多策略的维吾尔文网页识别方法. 中文信息学报. 2017, 31(1): 133-139, http://lib.cqvip.com/Qikan/Article/Detail?id=671634393.
[65] Zhu ShaoLin, Li Xiao, Yang YaTing, Wang Lei, Mi ChengGang, Sun M, Wang X, Chang B, Xiong D. Harvest Uyghur-Chinese Aligned-Sentences Bitexts from Multilingual Sites Based on Word Embedding. CHINESE COMPUTATIONAL LINGUISTICS AND NATURAL LANGUAGE PROCESSING BASED ON NATURALLY ANNOTATED BIG DATA, CCL 2017null. 2017, 10565: 449-460, [66] Yang Yating. Log-linear Models for Uyghur Segmentation in Spoken Language Translation. RANLP 2017. 2017, [67] Bo Ma, Tonghai Jiang, Yating Yang, Xi Zhou, Lei Wang. Joint Learning of Contextal and Global Features for Named Entity Disambiguation. IALP2017null. 2017, [68] Zhou Xi, Li Xiao, Kong Jinying, Yang Yating, Wang Lei. Research for Uyghur-Chinese neural machine translation. Lecture Notes in Computer Science[J]. 2016, 10102(12): 141-152, http://ir.xjipc.cas.cn/handle/365002/5784.
[69] Tursun, Eziz, Ganguly, Debasis, Osman, Turghun, Yang, YaTing, Abdukerim, Ghalip, Zhou, JunLin, Liu, Qun. A Semisupervised Tag-Transition-Based Markovian Model for Uyghur Morphology Analysis. ACM TRANSACTIONS ON ASIAN AND LOW-RESOURCE LANGUAGE INFORMATION PROCESSING[J]. 2016, 16(2): http://www.irgrid.ac.cn/handle/1471x/1171578.
[70] 杨雅婷. 基于深度学习的维汉口语机器翻译研究. CWMT2016. 2016, [71] Yang Yating. A post-reordering model based Maximum Entropy in Statistic Machine Translation. International Journal of Hybrid Information Technology. 2016, [72] 李晓, 蒋同海, 周喜, 王磊, 杨雅婷. 维汉机器翻译关键技术研究概述. 网络新媒体技术. 2016, 19-25, http://lib.cqvip.com/Qikan/Article/Detail?id=667246215.
[73] 孔金英, 温政阳, 杨雅婷, 王磊, 李晓. 面向维汉机器翻译的语料筛选技术研究. 计算机应用研究. 2016, 33(12): 3654-3657, http://lib.cqvip.com/Qikan/Article/Detail?id=670644114.
[74] Bo Ma, Yating Yang, Xi Zhou, Lei Wang. Graph-based short text Entity Linking: A data integration perspective. IALP2016null. 2016, [75] 李晓. A Phrase Table Filtering Model for Uyghur-Chinese MT Based on Binary Classification.. Journal of Software.. 2015, [76] Yang Yating. Co-occurrence Degree Based Word Alignment in Statistical Machine Translation.. Open Automation and Control Systems Journal. 2015, [77] 张磊, 杨雅婷, 米成刚, 李晓. 维吾尔语数词类命名实体的识别与翻译. 计算机应用与软件. 2015, 32(8): 64-67, http://lib.cqvip.com/Qikan/Article/Detail?id=665815760.
[78] 杨雅婷. 维汉机器翻译中可变权重的编辑距离语言模型语料领域适应. CWMT2015. 2015, [79] Osman Turghun Source Lecture Notes in Co, Wang Lei, Jiang Tonghai, Zhou Xi, Mi Chenggang, Dong Rui, Yang Yating, Li Xiao. Optimized uyghur segmentation for statistical machine translation. Lecture Notes in Computer Science[J]. 2015, 9103(6): 395-398, http://ir.xjipc.cas.cn/handle/365002/4914.
[80] Bo Ma, Yating Yang, Fan Zhao, Rui Dong, Xi Zhou. Semantic Similarity Computation Based on Multi-Features Fusion. International Journal of Hybrid Information Technology[J]. 2015, [81] Yang, Yating, Mi, Chenggang, Ma, Bo, Dong, Rui, Wang, Lei, Li, Xiao, Shi, X, Chen, Y. Character Tagging-Based Word Segmentation for Uyghur. CWMTnull. 2014, 493: 61-69, [82] 李响, 南江, 杨雅婷, 周喜, 米成刚. 泛化语言模型在汉维机器翻译中的应用. 计算机应用研究. 2014, 31(10): 2994-2997, http://lib.cqvip.com/Qikan/Article/Detail?id=662180245.
[83] Li Xiao, Yang Yating, Mi Chenggang, Zhou Xi, Osman Turghun. Co-occurrence degree based word alignment: A case study on Uyghur-Chinese. Lecture Notes in Computer Science[J]. 2014, 8801(1): 259-268, http://ir.xjipc.cas.cn/handle/365002/4915.
[84] 艾孜孜吐尔逊, 周俊林, 杨雅婷, 吐尔洪吾司曼, 李晓. 维-汉统计机器翻译中维吾尔语预处理研究. 计算机工程与设计. 2014, 35(11): 4034-4039, http://lib.cqvip.com/Qikan/Article/Detail?id=662854827.
[85] 李晓, 蒋同海, 周喜, 王磊, 杨雅婷. 面向复杂形态语言机器翻译的多模型融合词性标注研究. 网络新媒体技术[J]. 2014, 3(1): 60-64, http://www.irgrid.ac.cn/handle/1471x/902429.
[86] Li Xiao, Dalielihan Kamali, Mi Chenggang, Yang Yating, Wang Lei. Detection of loan words in uyghur texts. Communications in Computer and Information Science[J]. 2014, 496(12): 103-112, http://ir.xjipc.cas.cn/handle/365002/4912.
[87] 米成刚, 杨雅婷, 周喜, 李晓, 杨明忠. 基于字符串相似度的维吾尔语中汉语借词识别. 中文信息学报. 2013, 27(5): 173-178, http://lib.cqvip.com/Qikan/Article/Detail?id=47684373.
[88] YangYating, Ma Bo, TangXinyu, TurghunOsman. Speech recognition research on uyghur accent spoken language. IALPnull. 2013, 163-166, [89] 陈科海, 周喜, 杨雅婷, 米成刚. 基于粘着性模糊规则的维汉机器翻译最大熵调序研究. 计算机应用研究. 2013, 30(9): 2587-2590,2605, http://lib.cqvip.com/Qikan/Article/Detail?id=46906495.
[90] 米成刚, 王磊, 杨雅婷, 陈科海. 维汉机器翻译未登录词识别研究. 计算机应用研究. 2013, 30(4): 1112-1115, http://lib.cqvip.com/Qikan/Article/Detail?id=45288475.
[91] 杨雅婷. 维吾尔语方言口语语音识别中声学建模及多发音字典自适应研究. 2012, http://www.irgrid.ac.cn/handle/1471x/1059806.
[92] Ma Bo, Yang Yating, Zhou Xi, Zhou Junlin. Semantically enhanced uyghur information retrieval model. Journal of Software[J]. 2012, 7(6): 1315-1320, [93] Yang Yating. Based on Ontology Moses-based Chinese-Uyghur statistical machine translation systems. FP_YC-ICT Conference. 2012, [94] 杨雅婷, 马博, 王磊, 吐尔洪吾司曼, 李晓. 多发音字典在维吾尔语方言语音识别中的应用. 清华大学学报(自然科学版)[J]. 2011, 51(9): 1303-1306, [95] Yang Yating, Ma Bo, Wang Lei, Osman Turghun, Li Xiao. Multi-pronunciation dictionary based uyghur accent modeling for speech recognition. Qinghua Daxue Xuebao/Journal of Tsinghua University[J]. 2011, 51(9): 1303-1306, http://www.irgrid.ac.cn/handle/1471x/524340.
[96] 李晓. Multi-pronunciation dictionary based accent modeling for continuous speech recognition[J].. Journal of Tsinghua University(Science and Technology). 2011, [97] 杨雅婷, 马博, 王磊, 吐尔洪吾司曼, 李晓. 维吾尔语语音识别中发音变异现象. 清华大学学报(自然科学版)[J]. 2011, 51(9): 1230-1233, [98] 杨雅婷, 董兴华, 王磊, 吐尔洪吾司曼, 李晓. 电话信道维吾尔语口语语料库设计与研究. 计算机工程与应用. 2011, 47(23): 150-153, http://lib.cqvip.com/Qikan/Article/Detail?id=38879337.
[99] Ma Bo, Yang Yating, Dong Xinghua, Zhou Junlin. Design and Implementation of Patent Semantics Search Engine Based on Ontology. 2011 INTERNATIONAL CONFERENCE ON FUTURE COMPUTER SCIENCE AND APPLICATION (FCSA 2011), VOL 2[J]. 2011, 176-180, http://apps.webofknowledge.com/CitedFullRecord.do?product=UA&colName=WOS&SID=5CCFccWmJJRAuMzNPjj&search_mode=CitedFullRecord&isickref=WOS:000393845200043.
[100] 李晓. Pronunciation variations of Uyghur in the automatic speech recognition system[J].. Journal of Tsinghua University(Science and Technology). 2011, [101] Yang Yating. Research on the Uyghur Spoken Language Speech Corpus of Telephone Channel. Computer Engineering and Applications. 2011, [102] Yang Yating, Ma Bo, Wang Lei, Osman Turghun, Li Xiao. Uyghur pronunciation variations in automatic speech recognition systems. Qinghua Daxue Xuebao/Journal of Tsinghua University[J]. 2011, 51(9): 1230-1233,1238, http://www.irgrid.ac.cn/handle/1471x/524339.
[103] 马博, 杨雅婷, 周喜, 胡斌华. 改进的关联分类算法在信息化评估中的应用. 计算机工程[J]. 2011, 37(7): 7-9, [104] Yang Yating. Research on Evaluation Model and Method of Regional Informatization. Computer Engineering. 2011, [105] 杨雅婷, 马博, 王磊, 吐尔洪·吾司曼, 李晓. 基于声频特征的维吾尔语语音端点检测方法. 第五届全国青年计算语言学研讨会(YWCL 2010)null. 2010, http://www.irgrid.ac.cn/handle/1471x/618507.
[106] 杨雅婷, 马博, 苏国平, 蒋同海, 李晓. 区域信息化水平评价方法研究. 计算机工程[J]. 2010, 36(13): 272-275, [107] 董兴华, 杨雅婷, 陈丽娟, 周喜, 吐尔洪·吾司曼. 基于统计的词素切分算法. 第五届全国青年计算语言学研讨会(YWCL 2010)null. 2010, http://www.irgrid.ac.cn/handle/1471x/618505.
[108] 马博, 杨雅婷, 周俊林. 基于本体的维吾尔文语义检索模型研究. 2010年全国模式识别学术会议(CCPR2010)null. 2010, http://ir.xjipc.cas.cn/handle/365002/2356.
[109] Yang Yating, Ma Bo, Turghun Osman, Li Xiao. Speech endpoint detection algorithm for uyghur based on acoustic frequency feature. International Conference on Signal Processing Proceedings, ICSPnull. 2010, 553-556, http://ir.xjipc.cas.cn/handle/365002/2325.
[110] Ma Bo, Yang Yating, Zhou Xi, Zhou Junlin. An ontology-based semantic retrieval model for uyghur search engine. Proceedings - 2010 IEEE 2nd Symposium on Web Society, SWS 2010null. 2010, 191-196, [111] 杨雅婷, 马博, 王磊, 吐尔洪·吾司曼, 李晓. 维吾尔语口语语音语料库的设计与研究. 第五届全国青年计算语言学研讨会(YWCL 2010)null. 2010, 

科研活动

   
科研项目
( 1 ) 维汉机器翻译中复杂语言形态模型的研究, 主持, 部委级, 2012-11--2016-10
( 2 ) 维汉机器翻译中资源缺乏语言的快速知识获取研究, 主持, 省级, 2013-07--2016-06
( 3 ) 新疆少数民族信息处理, 参与, 部委级, 2012-01--2017-02
( 4 ) 面向网络信息采集的维汉机器翻译系统开发与应用, 参与, 部委级, 2013-01--2016-06
( 5 ) 维汉机器翻译关键技术研究及示范应用, 参与, 省级, 2014-01--2017-12
( 6 ) 面向维汉机器翻译的维吾尔语命名实体识别研究, 参与, 部委级, 2014-01--2017-07
( 7 ) 基于多特征融合的复杂形态语言建模研究, 主持, 省级, 2015-01--2017-12
( 8 ) 基于黏着语形态特征的维汉机器翻译最大熵调序研究, 主持, 省级, 2015-01--2017-12
( 9 ) 维汉机器翻译平台, 主持, 省级, 2016-10--2020-12
( 10 ) 中国科学院青年促进会项目, 主持, 部委级, 2017-01--2020-12
( 11 ) 融合复杂形态特征的多语言神经机器翻译研究, 主持, 国家级, 2018-01--2020-12
( 12 ) 中科院西部之光项目, 主持, 部委级, 2017-08--2020-07
( 13 ) 维汉机器翻译关键技术研究, 主持, 国家级, 2019-01--2021-12
( 14 ) 维汉、哈汉机器翻译关键技术研究, 主持, 国家级, 2018-01--2021-12
参与会议
(1)Domain Adaption Based on LDA and Word Embedding in SMT   亚洲自然语言处理学术会议   2017-11-28
(2)Improving adversarial neural machine translation with prior knowledge   2017-10-18
(3)Learning Bilingual Lexicon for Low resource Language Pairs   NLPCC2017   2017-10-16
(4)Content-Based Neural Reordering Model for Statistical Machine Translation   全国机器翻译研讨会   潘一荣,李晓,杨雅婷   2017-09-26
(5)Research for Uyghur-Chinese Neural Machine Translation   2016-12-06
(6)维汉机器翻译关键技术研究概述   中国声学学会青年分会年会   2015-10-16
(7)Character Tagging-Based Word Segmentation   2015-10-09
(8)维汉机器翻译中可变权重的编辑距离语言模型语料领域适应   CWMT2015   2015-08-14
(9)Optimized Uyghur Segmentation for Statistical Machine Translation   2015-05-22
(10)Character Tagging-Based Word Segmentation For Uyghur   CWMT2014   2014-10-17
(11)面向维汉机器翻译的复杂语言形态分析研究   第十一届自然语言处理青年学者研讨会   杨雅婷   2014-05-16
(12)CWMT2013中国科学院新疆理化技术研究所评测报告   第九届全国机器翻译研讨会   杨雅婷,米成刚, 董瑞,吐尔洪.吾司曼,艾孜孜.吐尔逊,王磊,周喜   2013-10-31
(13)基于字符串相似度的维吾尔语中汉语借词识别   第十二届全国计算语言学学术会议   米成刚,杨雅婷,周喜,李晓,杨明忠   2013-10-10
(14)Discriminative Learning with Natural Annotations: CWS and NER as Case Studies   Wenbin Jiang,Meng Sun,Yajuan Lü, Yating Yang, Qun Liu   2013-08-04

指导学生

已指导学生

杨山  硕士研究生  085211-计算机技术  

张琳琳  硕士研究生  081203-计算机应用技术  

现指导学生

骆功旭  硕士研究生  081203-计算机应用技术  

冯笑  硕士研究生  085211-计算机技术  

陈玺  硕士研究生  085211-计算机技术  

罗涵天  硕士研究生  085211-计算机技术