基本信息
杨雅婷  女  硕导  中国科学院新疆理化技术研究所
电子邮件: yangyt@ms.xjb.ac.cn
通信地址: 新疆乌鲁木齐市新市区北京南路40-1号
邮政编码: 830011

研究领域

多语言自然语言处理,跨语言机器翻译、多模态内容理解、人工智能

招生信息

招收硕士研究生

招收博士研究生

招生专业
081203-计算机应用技术
085211-计算机技术
招生方向
计算机应用技术,自然语言处理,多语言智能,人工智能
计算机技术
人工智能

教育背景

2007-09--2012-07   中国科学院   获得工学博士学位
2003-09--2007-06   长安大学   获得工学学士学位
学历

博士研究生

学位

工学博士学位

工作经历

杨雅婷,研究员,博士研究生导师,中国科学院新疆理化技术研究所纪委委员,多语种信息技术研究室副主任,新疆民族语音语言信息处理重点实验室副主任中国科学院青促会优秀会员。自2007 年起从事多语言智能信息处理技术研究,主要研究方向为多语言智能多模态内容理解等。

面向国家与“一带一路”高质量发展的重大需求,作为研究所“十四五”主攻方向二重大科研任务五“多语言智能信息处理”的技术攻关负责人,带领了一支长期从事多语言智能信息处理的科研团队,从“数据-建模-应用”三个层面出发,在人工智能领域,完成了多语言智能从数据“处理”向内容“理解”模式的进阶主持或负责国家及省部级项目22入选多项人才计划,包括:“天山英才”青年科技拔尖人才(2022年)、中国科学院青促会优秀会员(2021年)、国家自然科学基金本地青年人才培养专项(2020年)、“天山创新团队”计划(2020年)等。建立了千万规模级的多语言自然语言处理语料资源库,入选中科院特色科学数据库带领团队参加领域内全国性机器翻译评测,连续三届获单项第一名的成绩科研成果获得新疆科技进步一等奖,在新疆、北京、上海、广州、杭州、厦门等地落地应用,与7个国家11个高校或科研院所开展国际交流与合作;自主知识产权成果取得国产化适配认证6项,获得数字中国创新大赛全国总决赛二等奖


工作简历
2019-11~现在, 中国科学院新疆理化技术研究所, 研究员
2013-10~2017-02,中国科学院声学研究所, 博士后
2012-07~2019-10,中国科学院新疆理化技术研究所, 副研究员
社会兼职
2022-09-01-今,中国科学院领域专家组专家,
2021-08-03-2023-08-31,CCF乌鲁木齐城市分部, 秘书长
2017-02-14-今,中国计算机学会中文息处理专委会青工委, 副主席
2016-04-30-今,新疆自治区专家顾问团网络信息组秘书,
2013-04-14-今,中国中文信息学会青工委, 委员
2012-07-30-2020-12-30,新疆自治区专家顾问团信息与交通组,

教授课程

多语种信息处理技术

专利与奖励

2019年新疆维吾尔自治区科技进步一等奖(2/12)

奖励信息
(1) “优秀党务工作者”荣誉, , 研究所(学校), 2022
(2) 2022数字中国创新大赛, 二等奖, 国家级, 2022
(3) “先进工作者”荣誉, , 研究所(学校), 2021
(4) “优秀共产党员”荣誉, 研究所(学校), 2020
(5) 新疆维吾尔自治区科技进步奖, 一等奖, 省级, 2019
(6) 优秀党务工作者, 研究所(学校), 2015
(7) 中国科学院院长奖, , 院级, 2012
专利成果
[1] 杨雅婷, 张文博, 董瑞, 马博, 王磊, 周喜. 面向新闻的热点话题检测方法、装置及设备. CN: ZL202110271853.9, 2021-07-23.

[2] 杨雅婷, 艾孜麦提·艾尼瓦尔, 董瑞, 马博, 王磊, 周喜. 基于汉语关键词的***语关键词生成方法、装置、电子设备及存储介质. CN: CN202110271879.3, 2021-07-23.

[3] 马博, 蒋同海, 周喜, 杨雅婷, 王磊, 马玉鹏, 赵凡, 王轶. 面向连续时空加油数据的异常检测方法. CN: ZL201910509163.5, 2019-09-13.

[4] 蒋同海, 李晓, 马博, 王磊, 周喜, 赵凡, 杨雅婷. 面向资源缺乏语言的实体链接系统. 中国: ZL201510304943.8, 2015-06-04.

[5] 马博, 李晓, 蒋同海, 周喜, 王磊, 杨雅婷, 赵凡. 多特征融合的文本相似性度量系统. 中国: ZL201510072955.2, 2015-02-11.

[6] 一种基于胶囊网络的多语言情感分类方法、装置、设备 及存储介质,. 2023-12-12.

[7] 基于词向量替换数据增强的机器翻译模型训练方法、装 置、电子设备及存储介质. 2023-11-17.

[8] 基于注意力机制多特征融合的虚假信息检测方法、装置、电子设备及 存储介质. 2023-12-15.

[9] 公共医疗卫生命名实体识别与实体链接方法、装置、电子设备及存储 介质. 2023-04-25.

出版信息

   
发表论文
[1] 杨振宇, 王磊, 马博, 杨雅婷, 董瑞. 一种针对维汉的跨语言远程监督方法. 计算机工程[J]. 2023, 271-278, [2] 冯笑, 杨雅婷, 董瑞, 马博. 基于集成修剪的维汉神经机器翻译系统. 制造业自动化[J]. 2023, 69-73+110, [3] 李鸿鹏, 马博, 杨雅婷, 王磊, 王震, 李晓. 基于槽位语义增强提示学习的篇章级事件抽取方法. 计算机工程[J]. 2023, [4] Aibibula Atawula, Xi Zhou, Yating Yang, Bo Ma, Fengyi Yang. A Slot-shared Span Prediction-based Neural Network for Multi-Domain Dialogue State Tracking. ICASSP 2023null. 2023, [5] Fengyi Yang, Xi Zhou, Yating Yang, Bo Ma, Rui Dong, Aibibula Atawula. A Domain-Transfer Meta Task Design Paradigm for Few-shot Slot Tagging. AAAI-23null. 2023, [6] 郭世伟, 马博, 马玉鹏, 杨雅婷. 基于预训练模型和图卷积网络的中文短文本实体链接. 中文信息学报[J]. 2022, [7] 地力夏提·阿布都热依木, 马博, 杨雅婷, 王磊. 基于注意力机制多特征融合的虚假信息检测. 厦门大学学报(自然科学版)[J]. 2022, [8] 罗涵天, 杨雅婷, 马博, 董瑞, 李晓. 加入梯度均衡机制的端到端方面级情感分析. 计算机工程与设计[J]. 2022, [9] 冯笑, 杨雅婷, 董瑞, 艾孜买提·艾瓦尼尔, 马博. 基于回译和集成学习的维汉神经机器翻译方法. 兰州理工大学学报[J]. 2022, [10] 罗涵天, 杨雅婷, 董瑞, 马博. 基于时间注意力胶囊网络的维吾尔语情感分类模型. 中文信息学报[J]. 2022, [11] 张朋捷, 王磊, 马博, 杨雅婷, 董瑞, 艾孜买提·艾瓦尼尔. 基于预训练语言模型的维吾尔语事件抽取研究. 计算机工程与设计[J]. 2022, [12] Zhen Wang, Yating Yang, Xi Zhou, Bo Ma, Lei Wang, Rui Dong, Azmat Anwar. An Answer Space Clustered Prompting Method without Answer Engineering. ACL2022null. 2022, [13] Yajuan Wang, Xiao Li, Yating Yang, Azmat Anwar, Rui Dong. Hybrid System Combination Framework for Uyghur–Chinese Machine Translation. INFORMATION[J]. 2021, 12(98): https://doaj.org/article/da10c6f3d72944b5b21435fe4a4a857c.
[14] Wenbo Zhang, Xiao Li, Yating Yang, Rui Dong. Pre-Training on Mixed Data for Low-Resource Neural Machine Translation. INFORMATION[J]. 2021, 12(133): https://doaj.org/article/bd0b76b4e99647c5b8e1967ef61e4236.
[15] Zhenyu Yang, Lei Wang, Bo Ma, Yating Yang, Rui Dong, Zhen Wang. RTJTN: Relational Triplet Joint Tagging Network for Joint Entity and Relation Extraction. COMPUTATIONAL INTELLIGENCE AND NEUROSCIENCE[J]. 2021, 2021: [16] 李灿, 杨雅婷, 马玉鹏, 董瑞. 基于语种相似性挖掘的神经机器翻译语料库扩充方法. 计算机应用[J]. 2021, 41(11): 3145-3150, http://lib.cqvip.com/Qikan/Article/Detail?id=7106105113.
[17] 李晓. Constructing Uyghur Named Entity Recognition System using Neural Machine Translation Tag Projection. China National Conference on Computational Linguistics. 2020, [18] Yu Li, Xiao Li, Yating Yang, Rui Dong. A Diverse Data Augmentation Strategy for Low-Resource Neural Machine Translation. INFORMATION[J]. 2020, 11(5): [19] 穆妮热穆合塔尔, 李晓, 杨雅婷. 维吾尔语复杂形态对汉维机器翻译的影响研究. 计算机工程[J]. 2020, 46(2): 309-314, https://kns.cnki.net/KCMS/detail/detail.aspx?dbcode=CJFQ&dbname=CJFDLAST2020&filename=JSJC202002046&v=MTIzOTJUM3FUcldNMUZyQ1VSN3FlWitkcEZpbm5WcjNCTHo3QmJiRzRITkhNclk5QllvUjhlWDFMdXhZUzdEaDE=.
[20] Pan, Yirong, Li, Xiao, Yang, Yating, Dong, Rui. Multi-Source Neural Model for Machine Translation of Agglutinative Language. FUTURE INTERNET[J]. 2020, 12(6): https://doaj.org/article/0d5194f4b4744a778908f71a06f61d69.
[21] 李晓. Multi-Task Neural Model for Agglutinative Language Translation. Multi-Task Neural Model for Agglutinative Language Translation. 2020, [22] 张琳琳, 杨雅婷, 陈沾衡, 潘一荣, 李毓. 基于深度学习的相似语言短文本的语种识别方法. 计算机应用与软件[J]. 2020, 37(2): 124-129+176, https://kns.cnki.net/KCMS/detail/detail.aspx?dbcode=CJFQ&dbname=CJFDLAST2020&filename=JYRJ202002020&v=MTA1NTJGaW5sVmJ2SUx6VFpaTEc0SE5ITXJZOUhaSVI4ZVgxTHV4WVM3RGgxVDNxVHJXTTFGckNVUjdxZVorUnY=.
[23] 董瑞, 杨雅婷, 蒋同海. 融合多种语言学特征的维吾尔语神经网络命名实体识别. 计算机应用与软件[J]. 2020, 37(5): 183-188, https://kns.cnki.net/KCMS/detail/detail.aspx?dbcode=CJFQ&dbname=CJFDLAST2020&filename=JYRJ202005033&v=MzIxODV4WVM3RGgxVDNxVHJXTTFGckNVUjdxZVp1ZHVGeW5oVXJ2T0x6VFpaTEc0SE5ITXFvOUdaNFI4ZVgxTHU=.
[24] Zhang, Wenbo, Li, Xiao, Yang, Yating, Dong, Rui, Luo, Gongxu. Keeping Models Consistent between Pretraining and Translation for Low-Resource Neural Machine Translation. FUTURE INTERNET[J]. 2020, 12(12): https://doaj.org/article/0607104390094c4986dc88c43f4aa338.
[25] Zhang, Xinlu, Li, Xiao, Yang, Yating, Dong, Rui. Improving Low-Resource Neural Machine Translation With Teacher-Free Knowledge Distillation. IEEE ACCESS[J]. 2020, 8(11): 206638-206645, https://doaj.org/article/235779ca011d4329b08486a59975cbee.
[26] 朱相荣, 王磊, 杨雅婷, 董瑞, 张俊. 基于非自回归方法的维汉神经机器翻译. 计算机应用[J]. 2020, 40(7): 1891-1895, https://kns.cnki.net/KCMS/detail/detail.aspx?dbcode=CJFQ&dbname=CJFDLAST2020&filename=JSJY202007006&v=MjYzODRSN3FlWitkbUZDdmdWNzNLTHo3QmQ3RzRITkhNcUk5RllvUjhlWDFMdXhZUzdEaDFUM3FUcldNMUZyQ1U=.
[27] Zhang, Yishuo, Li, Gang, Muskat, Birgit, Law, Rob, Yang, Yating. Group pooling for deep tourism demand forecasting. ANNALS OF TOURISM RESEARCH[J]. 2020, 82(5): http://dx.doi.org/10.1016/j.annals.2020.102899.
[28] 杨雅婷. 面向汉维机器翻译的BERT嵌入研究. 计算机工程. 2020, [29] 袁扬, 李晓, 杨雅婷. 基于LDA主题模型的维吾尔语无监督词义消歧. 厦门大学学报:自然科学版[J]. 2020, 59(2): 198-205, http://lib.cqvip.com/Qikan/Article/Detail?id=7101160582.
[30] 潘一荣, 李晓, 杨雅婷, 董瑞. 面向汉维机器翻译的双语关联度优化模型. 计算机应用研究[J]. 2020, 37(3): 726-730, https://kns.cnki.net/KCMS/detail/detail.aspx?dbcode=CJFQ&dbname=CJFDLAST2020&filename=JSYJ202003019&v=MjQ4MzZVYi9QTHo3U1pMRzRITkhNckk5RWJZUjhlWDFMdXhZUzdEaDFUM3FUcldNMUZyQ1VSN3FlWitSdkZpcmc=.
[31] 张新路, 李晓, 杨雅婷, 王磊, 董瑞. 面向维汉神经机器翻译的双向重排序模型分析. 北京大学学报:自然科学版[J]. 2020, 56(1): 31-38, https://kns.cnki.net/KCMS/detail/detail.aspx?dbcode=CJFQ&dbname=CJFDLAST2020&filename=BJDZ202001005&v=MTg5MDlOSE1ybzlGWVlSOGVYMUx1eFlTN0RoMVQzcVRyV00xRnJDVVI3cWVaK2RxRkNya1dyM1BKeWZQZExHNEg=.
[32] GongXu Luo, YaTing Yang, Rui Dong, YanHong Chen, WenBo Zhang. A Joint Back-Translation and Transfer Learning Method for Low-Resource Neural Machine Translation. MATHEMATICAL PROBLEMS IN ENGINEERING[J]. 2020, 2020(5): https://doaj.org/article/3ee33e9edcd04597aa86ce4dd19ea6e7.
[33] 潘一荣, 李晓, 杨雅婷, 董瑞. 面向维汉机器翻译的层次化多特征融合模型. 厦门大学学报:自然科学版[J]. 2020, 59(2): 206-212, https://kns.cnki.net/KCMS/detail/detail.aspx?dbcode=CJFQ&dbname=CJFDLAST2020&filename=XDZK202002010&v=MjgzOTNZOUVaSVI4ZVgxTHV4WVM3RGgxVDNxVHJXTTFGckNVUjdxZVorZHBGaWpoVTdyTVBTblJaYkc0SE5ITXI=.
[34] Bo Ma, Yating Yang, Guangyi Zhang, Fan Zhao, Yi Wang. A Multi-View Spatial-Temporal Network for Vehicle Refueling Demand Inference. KSEM2019null. 2019, [35] Muhetaer Munire, Xiao Li, Yating Yang. Construction of the Uyghur Noun Morphological Re-Inflection Model Based on Hybrid Strategy. APPLIED SCIENCES[J]. 2019, 9(4): http://ir.xjipc.cas.cn/handle/365002/5731.
[36] Dong, Rui,,, Yang, Yating,, Jiang, Tonghai. Spelling correction of non-word errors in Uyghur-Chinese machine translation. INFORMATION[J]. 2019, 10(6): 1-9, https://doaj.org/article/18e5defb4e2148e5a4b573ff65382b4a.
[37] 杨山, 杨雅婷, 温正阳, 米成刚. 基于语义空间的抽取式单文档摘要方法. 厦门大学学报:自然科学版[J]. 2019, 58(2): 237-242, https://kns.cnki.net/KCMS/detail/detail.aspx?dbcode=CJFD&dbname=CJFDLAST2019&filename=XDZK201902015&v=MjA3OTRxVHJXTTFGckNVUjd1ZlkrZHJGeUhuVXJ2QVBTblJaYkc0SDlqTXJZOUVZWVI4ZVgxTHV4WVM3RGgxVDM=.
[38] Yang Yating. Research of Uyghur-Chinese Machine Translation System Combination Based on Semantic Information. Proceedings of International Conference on Natural Language Processing and Chinese Computing. 2019, [39] Anwar, Azmat, Li, Xiao, Yang, Yating, Wang, Yajuan. Constructing Uyghur Commonsense Knowledge Base by Knowledge Projection. APPLIEDSCIENCESBASEL[J]. 2019, 9(16): http://apps.webofknowledge.com/CitedFullRecord.do?product=UA&colName=WOS&SID=5CCFccWmJJRAuMzNPjj&search_mode=CitedFullRecord&isickref=WOS:000484444100112.
[40] ShaoLin Zhu, Xiao Li, YaTing Yang, Lei Wang, ChengGang Mi. A Novel Deep Learning Method for Obtaining Bilingual Corpus from Multilingual Website. MATHEMATICAL PROBLEMS IN ENGINEERING[J]. 2019, 2019(1): http://gooa.las.ac.cn/external/index?type=-1&pid=1464976.
[41] 吐尔洪吾司曼, 杨雅婷, 王磊, 周喜, 程力. 基于汉维映射关系构建维吾尔语依存树库. 中文信息学报[J]. 2019, 103-110, https://kns.cnki.net/KCMS/detail/detail.aspx?dbcode=CJFD&dbname=CJFDLAST2019&filename=MESS201901016&v=MTI4ODU3dWZZK2RyRnlEa1ZMekpLQ2pZZmJHNEg5ak1ybzlFWW9SOGVYMUx1eFlTN0RoMVQzcVRyV00xRnJDVVI=.
[42] 杨世勤, 王磊, 杨雅婷, 米成刚. 基于短语汉维机器翻译解码的研究及实现. 计算机工程与设计[J]. 2019, 1183-1189, http://lib.cqvip.com/Qikan/Article/Detail?id=83748374504849574852485253.
[43] Xie, Hongtao, Fang, Shancheng, Zha, ZhengJun, Yang, Yating, Li, Yan, Zhang, Yongdong. Convolutional Attention Networks for Scene Text Recognition. ACM TRANSACTIONS ON MULTIMEDIA COMPUTING COMMUNICATIONS AND APPLICATIONS[J]. 2019, 15(1): http://ir.xjipc.cas.cn/handle/365002/5690.
[44] 王亚娟, 李晓, 杨雅婷, 米成刚. 基于释义信息的维汉机器翻译系统融合研究. 计算机工程[J]. 2019, 45(4): 288-295+301, https://kns.cnki.net/KCMS/detail/detail.aspx?dbcode=CJFD&dbname=CJFDLAST2019&filename=JSJC201904047&v=MTc2MzBkckZ5RGxXNy9NTHo3QmJiRzRIOWpNcTQ5Qlk0UjhlWDFMdXhZUzdEaDFUM3FUcldNMUZyQ1VSN3VmWSs=.
[45] 张文博, 米成刚, 杨雅婷. 基于词对向量的中文新闻话题检测方法. 厦门大学学报:自然科学版[J]. 2019, 58(2): 231-236, https://kns.cnki.net/KCMS/detail/detail.aspx?dbcode=CJFD&dbname=CJFDLAST2019&filename=XDZK201902014&v=Mjk1NDV4WVM3RGgxVDNxVHJXTTFGckNVUjd1ZlkrZHJGeUhuVnIvT1BTblJaYkc0SDlqTXJZOUVZSVI4ZVgxTHU=.
[46] Munire, Muhetaer, Li, Xiao, Yang, Yating. Construction of the Uyghur Noun Morphological Re-Inflection Model Based on Hybrid Strategy. APPLIED SCIENCES-BASEL[J]. 2019, 9(4): http://ir.xjipc.cas.cn/handle/365002/5731.
[47] Abdukerim, Ghalip, Tursun, Eziz, Yang, Yating, Li, Xiao. UYGHUR MORPHOLOGICAL ANALYSIS USING JOINT CONDITIONAL RANDOM FIELDS: BASED ON SMALL SCALED CORPUS. DISCRETE AND CONTINUOUS DYNAMICAL SYSTEMS-SERIES S[J]. 2019, 12(4-5): 823-836, http://ir.xjipc.cas.cn/handle/365002/5723.
[48] 吐尔洪吾司曼, 杨雅婷, 艾孜孜吐尔逊, 程力. 字符级的维吾尔语形态协同分析方法. 北京大学学报:自然科学版[J]. 2019, 55(1): 47-54, https://kns.cnki.net/KCMS/detail/detail.aspx?dbcode=CJFQ&dbname=CJFDLAST2019&filename=BJDZ201901007&v=MTEwNDF5ZlBkTEc0SDlqTXJvOUZZNFI4ZVgxTHV4WVM3RGgxVDNxVHJXTTFGckNVUjdxZVorUnZGaXJsVjd2QUo=.
[49] Azmat Anwar, Xiao Li, Yating Yang, Yajuan Wang. Constructing Uyghur Commonsense Knowledge Base by Knowledge Projection. APPLIED SCIENCES[J]. 2019, 9(16): https://doaj.org/article/d617a2cbb3774eaf96cee1f37a12fab2.
[50] Luo, Gongxu, Yang, Yating, Yuan, Yang, Chen, Zhanheng, Ainiwaer, Aizimaiti. Hierarchical Transfer Learning Architecture for Low-Resource Neural Machine Translation. IEEE ACCESS[J]. 2019, 7: 154157-154166, https://doaj.org/article/7a06e23b9bae4848b62c4fbaadc141cc.
[51] 罗延根, 李晓, 蒋同海, 杨雅婷, 周喜, 王磊. 基于词向量的维吾尔语词项归一化方法. 计算机工程[J]. 2018, 44(2): 220-225, http://lib.cqvip.com/Qikan/Article/Detail?id=674469251.
[52] Bo Ma, Yating Yang, Tonghai Jiang, Xi Zhou, Lei Wang. Graph-based Reranking Approach for DBpedia Entity Search. CIKM2018 EYRE Workshopnull. 2018, [53] Yang Shan, Yang Yating, Mi Chenggang, Pan Yirong, Wang Lei, Ma Bo. Extractive Summarization of Documents by Combining Semantic Content and Non-structured Features. 2018 INTERNATIONAL CONFERENCE ON ASIAN LANGUAGE PROCESSING (IALP)null. 2018, 279-284, [54] Yang Yating. Toward Better Loanword Identification in Uyghur Using Cross-lingual Word Embeddings. COLING2018. 2018, [55] Yang Yating. A Neural Network Based Model for Loanword Identification in Uyghur. LREC2018. 2018, [56] Yang Yating. Research on temporal expression recognition: a case study of uyghur. An International Journal of Research and Surveys. 2018, [57] Zhu ShaoLin, Li Xiao, Yang YaTing, Wang Lei, Mi ChengGang, Huang X, Jiang J, Zhao D, Feng Y, Hong Y. Learning Bilingual Lexicon for Low-Resource Language Pairs. LECTURE NOTES IN COMPUTER SCIENCE[J]. 2018, 10619(11): 760-770,  http://dx.doi.org/10.1007/978-3-319-73618-1_66.
[58] 周喜, 艾孜尔古丽, 杨雅婷, 穆妮热穆合塔尔, 李晓. 基于词缀的维吾尔谚语识别关键技术研究. 智能系统学报[J]. 2018, 13(3): 452-457, http://lib.cqvip.com/Qikan/Article/Detail?id=7000660251.
[59] Yang Yating. A Post-reordering model BasedMaximum Entropy in Statistic Machine Translation. IJHIT. 2017, [60] 孔金英, 李晓, 王磊, 杨雅婷, 罗延根. 调序规则表的深度过滤研究. 计算机科学与探索[J]. 2017, 11(5): 785-793, http://lib.cqvip.com/Qikan/Article/Detail?id=7000193155.
[61] 李晓. A Content-Based Neural Reordering Model for Statistical Machine Translation. Communications in Computer and Information Science. 2017, [62] Yang Yating. Domain Adaption Based on LDA and Word Embedding in SMT. IALP2017. 2017, [63] 朱少林, 杨雅婷, 米成刚, 李晓, 王磊. 基于双语句对覆盖度的维汉机器翻译语料选取技术. 中国科学技术大学学报[J]. 2017, 47(4): 283-289, http://ir.xjipc.cas.cn/handle/365002/4805.
[64] Murat Alim, Osman Turghun, Li Xiao, Yang Yating, Zhou Xi, Wang Lei. Using Semantic Knowledge in the Uyghur-Chinese Person Name Transliteration. JOURNAL OF INFORMATION PROCESSING SYSTEMS[J]. 2017, 13(4): 716-730, http://ir.xjipc.cas.cn/handle/365002/5085.
[65] Kong, Jinying, Yang, Yating, Wang, Lei, Zhou, Xi, Jiang, Tonghai, Li, Xiao. Filtering Reordering Table Using a Novel Recursive Autoencoder Model for Statistical Machine Translation. MATHEMATICAL PROBLEMS IN ENGINEERING[J]. 2017, 2017: https://doaj.org/article/7b43ea5dc8394cdebe322eeffc64ad4c.
[66] Yang, Yating, Li, Xiao, Jiang, Tonghai, Kong, Jinying, Ma, Bo, Zhou, Xi, Wang, Lei. Improving Adversarial Neural Machine Translation with Prior Knowledge. GLOBALSIPnull. 2017, 1373-1377, [67] Zhu ShaoLin, Li Xiao, Yang YaTing, Wang Lei, Mi ChengGang, Sun M, Wang X, Chang B, Xiong D. Harvest Uyghur-Chinese Aligned-Sentences Bitexts from Multilingual Sites Based on Word Embedding. LECTURE NOTES IN COMPUTER SCIENCE[J]. 2017, 10565(10): 449-460,  http://dx.doi.org/10.1007/978-3-319-69005-6_37.
[68] 阿力木木拉提, 艾孜尔古丽, 杨雅婷, 李晓. 基于多策略的维吾尔文网页识别方法. 中文信息学报[J]. 2017, 31(1): 133-139, http://lib.cqvip.com/Qikan/Article/Detail?id=671634393.
[69] Yang Yating. Log-linear Models for Uyghur Segmentation in Spoken Language Translation. RANLP 2017. 2017, [70] Bo Ma, Tonghai Jiang, Yating Yang, Xi Zhou, Lei Wang. Joint Learning of Contextal and Global Features for Named Entity Disambiguation. IALP2017null. 2017, [71] Zhou Xi, Li Xiao, Kong Jinying, Yang Yating, Wang Lei. Research for Uyghur-Chinese neural machine translation. LECTURE NOTES IN COMPUTER SCIENCE[J]. 2016, 10102(12): 141-152, http://ir.xjipc.cas.cn/handle/365002/5784.
[72] Tursun, Eziz, Ganguly, Debasis, Osman, Turghun, Yang, YaTing, Abdukerim, Ghalip, Zhou, JunLin, Liu, Qun. A Semisupervised Tag-Transition-Based Markovian Model for Uyghur Morphology Analysis. ACM TRANSACTIONS ON ASIAN AND LOW-RESOURCE LANGUAGE INFORMATION PROCESSING[J]. 2016, 16(2): http://www.irgrid.ac.cn/handle/1471x/1171578.
[73] 杨雅婷. 基于深度学习的维汉口语机器翻译研究. CWMT2016. 2016, [74] Yang Yating. A post-reordering model based Maximum Entropy in Statistic Machine Translation. International Journal of Hybrid Information Technology. 2016, [75] 李晓, 蒋同海, 周喜, 王磊, 杨雅婷. 维汉机器翻译关键技术研究概述. 网络新媒体技术[J]. 2016, 19-25, http://lib.cqvip.com/Qikan/Article/Detail?id=667246215.
[76] 孔金英, 温政阳, 杨雅婷, 王磊, 李晓. 面向维汉机器翻译的语料筛选技术研究. 计算机应用研究[J]. 2016, 33(12): 3654-3657, http://lib.cqvip.com/Qikan/Article/Detail?id=670644114.
[77] Bo Ma, Yating Yang, Xi Zhou, Lei Wang. Graph-based short text Entity Linking: A data integration perspective. IALP2016null. 2016, [78] 李晓. A Phrase Table Filtering Model for Uyghur-Chinese MT Based on Binary Classification.. Journal of Software.. 2015, [79] Yang Yating. Co-occurrence Degree Based Word Alignment in Statistical Machine Translation.. Open Automation and Control Systems Journal. 2015, [80] 张磊, 杨雅婷, 米成刚, 李晓. 维吾尔语数词类命名实体的识别与翻译. 计算机应用与软件[J]. 2015, 32(8): 64-67, http://lib.cqvip.com/Qikan/Article/Detail?id=665815760.
[81] 杨雅婷. 维汉机器翻译中可变权重的编辑距离语言模型语料领域适应. CWMT2015. 2015, [82] Bo Ma, Yating Yang, Fan Zhao, Rui Dong, Xi Zhou. Semantic Similarity Computation Based on Multi-Features Fusion. International Journal of Hybrid Information Technology[J]. 2015, [83] Osman Turghun Source Lecture Notes in Co, Wang Lei, Jiang Tonghai, Zhou Xi, Mi Chenggang, Dong Rui, Yang Yating, Li Xiao. Optimized uyghur segmentation for statistical machine translation. LECTURE NOTES IN COMPUTER SCIENCE[J]. 2015, 9103(6): 395-398, http://ir.xjipc.cas.cn/handle/365002/4914.
[84] Yang, Yating, Mi, Chenggang, Ma, Bo, Dong, Rui, Wang, Lei, Li, Xiao, Shi, X, Chen, Y. Character Tagging-Based Word Segmentation for Uyghur. CWMTnull. 2014, 493: 61-69, [85] 李响, 南江, 杨雅婷, 周喜, 米成刚. 泛化语言模型在汉维机器翻译中的应用. 计算机应用研究[J]. 2014, 31(10): 2994-2997, http://lib.cqvip.com/Qikan/Article/Detail?id=662180245.
[86] Li Xiao, Yang Yating, Mi Chenggang, Zhou Xi, Osman Turghun. Co-occurrence degree based word alignment: A case study on Uyghur-Chinese. LECTURE NOTES IN COMPUTER SCIENCE[J]. 2014, 8801(1): 259-268, http://ir.xjipc.cas.cn/handle/365002/4915.
[87] 艾孜孜吐尔逊, 周俊林, 杨雅婷, 吐尔洪吾司曼, 李晓. 维-汉统计机器翻译中维吾尔语预处理研究. 计算机工程与设计[J]. 2014, 35(11): 4034-4039, http://lib.cqvip.com/Qikan/Article/Detail?id=662854827.
[88] 李晓, 蒋同海, 周喜, 王磊, 杨雅婷. 面向复杂形态语言机器翻译的多模型融合词性标注研究. 网络新媒体技术[J]. 2014, 3(1): 60-64, http://www.irgrid.ac.cn/handle/1471x/902429.
[89] Li Xiao, Dalielihan Kamali, Mi Chenggang, Yang Yating, Wang Lei. Detection of loan words in uyghur texts. COMMUNICATIONS IN COMPUTER AND INFORMATION SCIENCE[J]. 2014, 496(12): 103-112, http://ir.xjipc.cas.cn/handle/365002/4912.
[90] YangYating, Ma Bo, TangXinyu, TurghunOsman. Speech recognition research on uyghur accent spoken language. IALPnull. 2013, 163-166, [91] 米成刚, 杨雅婷, 周喜, 李晓, 杨明忠. 基于字符串相似度的维吾尔语中汉语借词识别. 中文信息学报[J]. 2013, 27(5): 173-178, http://lib.cqvip.com/Qikan/Article/Detail?id=47684373.
[92] 陈科海, 周喜, 杨雅婷, 米成刚. 基于粘着性模糊规则的维汉机器翻译最大熵调序研究. 计算机应用研究[J]. 2013, 30(9): 2587-2590,2605, http://lib.cqvip.com/Qikan/Article/Detail?id=46906495.
[93] 米成刚, 王磊, 杨雅婷, 陈科海. 维汉机器翻译未登录词识别研究. 计算机应用研究[J]. 2013, 30(4): 1112-1115, http://lib.cqvip.com/Qikan/Article/Detail?id=45288475.
[94] Ma Bo, Yang Yating, Zhou Xi, Zhou Junlin. Semantically enhanced uyghur information retrieval model. JOURNAL OF SOFTWARE[J]. 2012, 7(6): 1315-1320, [95] Yang Yating. Based on Ontology Moses-based Chinese-Uyghur statistical machine translation systems. FP_YC-ICT Conference. 2012, [96] 杨雅婷, 马博, 王磊, 吐尔洪吾司曼, 李晓. 多发音字典在维吾尔语方言语音识别中的应用. 清华大学学报(自然科学版)[J]. 2011, 51(9): 1303-1306, [97] Yang Yating, Ma Bo, Wang Lei, Osman Turghun, Li Xiao. Multi-pronunciation dictionary based uyghur accent modeling for speech recognition. QINGHUA DAXUE XUEBAO/JOURNAL OF TSINGHUA UNIVERSITY[J]. 2011, 51(9): 1303-1306, http://www.irgrid.ac.cn/handle/1471x/524340.
[98] 李晓. Multi-pronunciation dictionary based accent modeling for continuous speech recognition[J].. Journal of Tsinghua University(Science and Technology). 2011, [99] 杨雅婷, 马博, 王磊, 吐尔洪吾司曼, 李晓. 维吾尔语语音识别中发音变异现象. 清华大学学报(自然科学版)[J]. 2011, 51(9): 1230-1233, [100] 杨雅婷, 董兴华, 王磊, 吐尔洪吾司曼, 李晓. 电话信道维吾尔语口语语料库设计与研究. 计算机工程与应用[J]. 2011, 47(23): 150-153, http://lib.cqvip.com/Qikan/Article/Detail?id=38879337.
[101] Ma Bo, Yang Yating, Dong Xinghua, Zhou Junlin. Design and Implementation of Patent Semantics Search Engine Based on Ontology. 2011INTERNATIONALCONFERENCEONFUTURECOMPUTERSCIENCEANDAPPLICATIONFCSA2011VOL2[J]. 2011, 176-180, http://apps.webofknowledge.com/CitedFullRecord.do?product=UA&colName=WOS&SID=5CCFccWmJJRAuMzNPjj&search_mode=CitedFullRecord&isickref=WOS:000393845200043.
[102] 李晓. Pronunciation variations of Uyghur in the automatic speech recognition system[J].. Journal of Tsinghua University(Science and Technology). 2011, [103] Yang Yating. Research on the Uyghur Spoken Language Speech Corpus of Telephone Channel. Computer Engineering and Applications. 2011, [104] Yang Yating, Ma Bo, Wang Lei, Osman Turghun, Li Xiao. Uyghur pronunciation variations in automatic speech recognition systems. QINGHUA DAXUE XUEBAO/JOURNAL OF TSINGHUA UNIVERSITY[J]. 2011, 51(9): 1230-1233,1238, http://www.irgrid.ac.cn/handle/1471x/524339.
[105] 马博, 杨雅婷, 周喜, 胡斌华. 改进的关联分类算法在信息化评估中的应用. 计算机工程[J]. 2011, 37(7): 7-9, [106] Yang Yating. Research on Evaluation Model and Method of Regional Informatization. Computer Engineering. 2011, [107] 杨雅婷, 马博, 王磊, 吐尔洪·吾司曼, 李晓. 基于声频特征的维吾尔语语音端点检测方法. 第五届全国青年计算语言学研讨会(YWCL 2010)null. 2010, http://www.irgrid.ac.cn/handle/1471x/618507.
[108] 杨雅婷, 马博, 苏国平, 蒋同海, 李晓. 区域信息化水平评价方法研究. 计算机工程[J]. 2010, 36(13): 272-275, [109] 董兴华, 杨雅婷, 陈丽娟, 周喜, 吐尔洪·吾司曼. 基于统计的词素切分算法. 第五届全国青年计算语言学研讨会(YWCL 2010)null. 2010, http://www.irgrid.ac.cn/handle/1471x/618505.
[110] 马博, 杨雅婷, 周俊林. 基于本体的维吾尔文语义检索模型研究. 2010年全国模式识别学术会议(CCPR2010)null. 2010, http://ir.xjipc.cas.cn/handle/365002/2356.
[111] Yang Yating, Ma Bo, Turghun Osman, Li Xiao. Speech endpoint detection algorithm for uyghur based on acoustic frequency feature. INTERNATIONAL CONFERENCE ON SIGNAL PROCESSING PROCEEDINGS, ICSPnull. 2010, 553-556, http://ir.xjipc.cas.cn/handle/365002/2325.
[112] Ma Bo, Yang Yating, Zhou Xi, Zhou Junlin. An ontology-based semantic retrieval model for uyghur search engine. PROCEEDINGS - 2010 IEEE 2ND SYMPOSIUM ON WEB SOCIETY, SWS 2010null. 2010, 191-196, [113] 杨雅婷, 马博, 王磊, 吐尔洪·吾司曼, 李晓. 维吾尔语口语语音语料库的设计与研究. 第五届全国青年计算语言学研讨会(YWCL 2010)null. 2010, 

科研活动

   
科研项目
( 1 ) 维汉机器翻译中复杂语言形态模型的研究, 主持, 部委级, 2012-11--2016-10
( 2 ) 维汉机器翻译中资源缺乏语言的快速知识获取研究, 主持, 省级, 2013-07--2016-06
( 3 ) 新疆少数民族信息处理, 参与, 部委级, 2012-01--2017-02
( 4 ) 面向网络信息采集的维汉机器翻译系统开发与应用, 参与, 部委级, 2013-01--2016-06
( 5 ) 维汉机器翻译关键技术研究及示范应用, 参与, 省级, 2014-01--2017-12
( 6 ) 面向维汉机器翻译的维吾尔语命名实体识别研究, 参与, 部委级, 2014-01--2017-07
( 7 ) 基于多特征融合的复杂形态语言建模研究, 主持, 省级, 2015-01--2017-12
( 8 ) 基于黏着语形态特征的维汉机器翻译最大熵调序研究, 主持, 省级, 2015-01--2017-12
( 9 ) 维汉机器翻译平台, 主持, 省级, 2016-10--2020-12
( 10 ) 中国科学院青年促进会项目, 主持, 部委级, 2017-01--2020-12
( 11 ) 融合复杂形态特征的多语言神经机器翻译研究, 主持, 国家级, 2018-01--2020-12
( 12 ) 中科院西部之光项目, 主持, 部委级, 2017-08--2020-07
( 13 ) 维汉机器翻译关键技术研究, 主持, 国家级, 2019-01--2021-12
( 14 ) 维汉、哈汉机器翻译关键技术研究, 主持, 国家级, 2018-01--2021-12
参与会议
(1)Domain Adaption Based on LDA and Word Embedding in SMT   亚洲自然语言处理学术会议   2017-11-28
(2)Improving adversarial neural machine translation with prior knowledge   2017-10-18
(3)Learning Bilingual Lexicon for Low resource Language Pairs   NLPCC2017   2017-10-16
(4)Content-Based Neural Reordering Model for Statistical Machine Translation   全国机器翻译研讨会   潘一荣,李晓,杨雅婷   2017-09-26
(5)Research for Uyghur-Chinese Neural Machine Translation   2016-12-06
(6)维汉机器翻译关键技术研究概述   中国声学学会青年分会年会   2015-10-16
(7)Character Tagging-Based Word Segmentation   2015-10-09
(8)维汉机器翻译中可变权重的编辑距离语言模型语料领域适应   CWMT2015   2015-08-14
(9)Optimized Uyghur Segmentation for Statistical Machine Translation   2015-05-22
(10)Character Tagging-Based Word Segmentation For Uyghur   CWMT2014   2014-10-17
(11)面向维汉机器翻译的复杂语言形态分析研究   第十一届自然语言处理青年学者研讨会   杨雅婷   2014-05-16
(12)CWMT2013中国科学院新疆理化技术研究所评测报告   第九届全国机器翻译研讨会   杨雅婷,米成刚, 董瑞,吐尔洪.吾司曼,艾孜孜.吐尔逊,王磊,周喜   2013-10-31
(13)基于字符串相似度的维吾尔语中汉语借词识别   第十二届全国计算语言学学术会议   米成刚,杨雅婷,周喜,李晓,杨明忠   2013-10-10
(14)Discriminative Learning with Natural Annotations: CWS and NER as Case Studies   Wenbin Jiang,Meng Sun,Yajuan Lü, Yating Yang, Qun Liu   2013-08-04

指导学生

已指导学生

杨山  硕士研究生  085211-计算机技术  

张琳琳  硕士研究生  081203-计算机应用技术  

现指导学生

骆功旭  硕士研究生  081203-计算机应用技术  

冯笑  硕士研究生  085211-计算机技术  

陈玺  硕士研究生  085211-计算机技术  

罗涵天  硕士研究生  085211-计算机技术