基本信息
王向东  男  硕导  中国科学院计算技术研究所
电子邮件: xdwang@ict.ac.cn
通信地址: 北京市海淀区科学院南路6号
邮政编码:

研究领域

人机交互,机器学习,语音交互,音频处理,可穿戴计算,残疾人信息无障碍技术

招生信息

   
招生专业
081203-计算机应用技术
招生方向
人机交互,机器学习,音频处理,语音交互
计算医疗与健康
残疾人信息无障碍

教育背景

2002-09--2007-07   中国科学院计算技术研究所   硕博连读研究生、博士
1998-09--2002-07   内蒙古大学计算机学院   本科、学士

工作经历

   
工作简历
2014-03~2014-06,新加坡国立大学, 访问学者
2013-10~现在, 中国科学院计算技术研究所, 高级工程师
2007-07~2013-09,中国科学院计算技术研究所, 助理研究员

专利与奖励

   
奖励信息
(1) 无障碍普适计算系统关键技术及应用, 一等奖, 部委级, 2017
(2) 远程信息无障碍交互关键技术及应用, 二等奖, 省级, 2015
专利成果
[1] 王向东, 贾端, 马玉卓, 钱跃良, 刘宏. 一种自适应的语音识别的方法和设备. CN: CN106297800B, 2021-07-23.
[2] 王向东, 崔晓娟, 钱跃良, 刘宏. 一种中国盲文错误自动检测方法、系统及存储介质. CN: CN110276069B, 2021-04-02.
[3] 刘宏, 王向东, 钱跃良. 一种盲文方辅助标注方法及系统. CN: CN107886808B, 2021-03-09.
[4] 刘宏, 黎仁强, 王向东, 钱跃良. 一种高精度盲文识别方法及系统. CN: CN108052955B, 2021-03-05.
[5] 王成, 龙舟, 钱跃良, 王向东, 袁静, 李锦涛. 基于音频的拖地声检测方法. CN: CN107170466B, 2020-12-29.
[6] 刘宏, 钱跃良, 王向东. 一种盲文点检测方法及系统. CN: CN107958261B, 2020-12-04.
[7] 刘宏, 黎仁强, 王向东, 钱跃良. 一种盲文方自适应定位方法及系统. CN: CN108062548B, 2020-11-03.
[8] 王向东, 蔡佳, 钱跃良, 刘宏. 一种基于深度神经网络的汉盲自动转换方法和系统. CN: CN109241540B, 2020-09-15.
[9] 王向东, 蔡佳, 钱跃良, 刘宏. 一种汉盲对照双语语料库的构建方法和系统. CN: CN109344389B, 2020-08-18.
[10] 王成, 龙舟, 钱跃良, 王向东. 基于双声道的脚步检测方法. CN: CN106653058B, 2020-03-17.
[11] 王成, 王向东, 钱跃良. 一种跌倒检测及报警方法. CN: CN106529418B, 2020-01-21.
[12] 刘宏, 黎仁强, 王向东, 钱跃良. 一种基于深度学习的盲文图像自动识别方法和系统. CN: CN110298236A, 2019-10-01.
[13] 王成, 龙舟, 钱跃良, 王向东, 袁静. 融合加速度和音频信息的脚步检测方法. CN: CN106531186B, 2019-07-12.
[14] 王向东, 蔡佳, 钱跃良, 刘宏. 一种融合非确定性反馈的语音识别错误修正方法及系统. CN: CN105206267B, 2019-04-02.
[15] 王成, 王向东, 钱跃良, 龙舟, 袁静. 一种建立步态数据集的方法及步态分析方法. CN: CN106175778B, 2019-02-01.
[16] 刘宏, 黎仁强, 王向东, 钱跃良. 一种盲文图像自动倾斜校正方法及系统. 中国: CN108052936A, 2018.05.18.
[17] 钱跃良, 王向东, 刘宏. 障碍物检测装置及方法. 中国: CN104574365B, 2018-09-07.
[18] 王向东, 杨阳, 钱跃良, 刘宏, 张金超, 姜文斌. 一种用于盲人读取汉字的方法及系统. 中国: CN105404621B, 2018-07-10.
[19] 刘宏, 钱跃良, 王向东. 盲文点交互式标注方法及系统. 中国: CN108062886A, 2018-05-22.
[20] 王向东, 杨阳, 钱跃良, 刘宏. 一种融合用户反馈的汉语语音识别方法及系统. 中国: CN104538032B, 2018-02-06.
[21] 钱跃良, 王向东. 一种聋人提示系统、方法及智能手机. 中国: CN106713633A, 2017-05-24.
[22] 钱跃良, 王向东. 聋哑人与正常人的辅助对话系统、方法及智能手机. 中国: CN106686223A, 2017-05-17.
[23] 王成, 王向东, 钱跃良. 用于触控式设备的盲文输入装置. 中国: CN206097069U, 2017-04-12.
[24] 王成, 王向东, 钱跃良, 龙舟, 袁静. 一种步态参数的采集方法及设备. 中国: CN106166071A, 2016-11-30.
[25] 钱跃良, 刘宏, 王喆, 王向东. 盲人避障提示装置及方法. 中国: CN104287946A, 2015-01-21.
[26] 王云芝, 张博宁, 王向东, 钱跃良, 罗海勇. 一种能智能化响应用电需求的充电系统及方法. 中国: CN103812126A, 2014-05-21.
[27] 王向东, 杨阳, 钱跃良. 用于融合多个语音识别系统的识别结果的方法及系统. 中国: CN103474069A, 2013-12-25.
[28] 钱跃良, 王向东, 张博宁, 赵希君, 李伟. 一种具有盲文点字输入功能的盲人电子记事本. 中国: CN203134200U, 2013-08-14.
[29] 张博宁, 钱跃良, 陈益强, 王向东. 一种支持多点触摸手势的人机交互戒指. 中国: CN103105945A, 2013-05-15.
[30] 刘宏, 钱跃良, 王向东. 基于定位遥控器的智能电视人机交互方法、装置和系统. 中国: CN103051964A, 2013-04-17.
[31] 刘宏, 钱跃良, 王向东. 智能电视人机交互方法、装置和系统. 中国: CN103051934A, 2013-04-17.
[32] 刘宏, 钱跃良, 王向东. 基于遥控器的智能电视人机交互方法、装置和系统. 中国: CN103051942A, 2013-04-17.
[33] 王向东, 张虹, 钱跃良. 电视频道自动跳转的系统与方法. 中国: CN103024556A, 2013-04-03.
[34] 王向东, 钱跃良, 张虹, 李新辉. 提供与视频播放内容相关信息的系统和方法. 中国: CN103024464A, 2013-04-03.
[35] 钱跃良, 王向东, 张博宁, 赵希君. 一种基于微型按钮开关的盲文输入装置及方法. 中国: CN102880291A, 2013-01-16.
[36] 张博宁, 钱跃良, 陈益强, 王向东. 一种人机交互戒指. 中国: CN102866789A, 2013-01-09.
[37] 罗海勇, 张雨晨, 朱珍民, 王向东. 一种面向需求侧响应基于预测的三相负载调度方法及装置. 中国: CN102751724A, 2012.10.24.
[38] 钱跃良, 王向东, 刘宏. 一种智能电视的交互方法与系统. 中国: CN102547466A, 2012-07-04.
[39] 钱跃良, 赵希君, 王向东. 一种用于电子产品的电量语音提示装置. 中国: CN202159129U, 2012-03-07.
[40] 钱跃良, 赵希君, 王向东, 张博宁, 王超. 一种盲文点字转换装置. 中国: CN202150089U, 2012-02-22.
[41] 李新辉, 王向东, 钱跃良, 林守勋. 汉语语音识别中重复出现词识别错误的自动修正方法. 中国: CN102324233A, 2012-01-18.
[42] 张博宁, 钱跃良, 王向东. 一种人机交互设备. 中国: CN102184011A, 2011.09.14.
[43] 邓铸辉, 陈启华, 王向东, 钱跃良, 林守勋. 一种语音浏览方法及浏览器. 中国: CN102163213A, 2011.08.24.
[44] 邓铸辉, 陈启华, 王向东, 钱跃良, 林守勋. 一种网页分割方法. 中国: CN102073710A, 2011.05.25.
[45] 李新辉, 王向东, 高扬, 钱跃良, 林守勋. 从音视频中检测广告的方法及系统. 中国: CN101576955B, 2011-10-05.
[46] 王超, 赵颖, 王向东, 钱跃良, 林守勋. 一种用于盲人读取汉字的系统和方法. 中国: CN102184172A, 2011-09-14.
[47] 王超, 王向东, 钱跃良, 林守勋. 一种盲文输入方法和系统. 中国: CN102156693A, 2011-08-17.
[48] 钱跃良, 张博宁, 褚诚缘, 谢萦, 王向东. 一种路灯杆的数字化管理与智能交互装置、方法及其系统. 中国: CN102158986A, 2011-08-17.
[49] 李新辉, 王向东, 钱跃良, 林守勋. 一种交互式语音识别系统和方法. 中国: CN101923854A, 2010-12-22.
[50] 钱跃良, 张博宁, 王向东, 刘 宏, 陈益强. LED路灯的智能控制装置及智能控制方法. 中国: CN101541123, 2009-09-23.
[51] 钱跃良, 王向东, 谢书华, 谢 萦. 一种盲文计算机点字输入系统和装置以及方法. 中国: CN100478855, 2009-04-15.
[52] 钱跃良, 张博宁, 王向东, 谢书华. 一种盲文计算机点字输入系统及方法. 中国: CN101339467, 2009-01-07.
[53] 高 杨, 王向东, 钱越良, 刘 群. 一种重复性视频音频节目片段的检测方法和系统. 中国: CN101159834, 2008.04.09.
[54] 王向东, 栾焕博, 林守勋, 钱跃良, 刘 宏, 张勇东. 一种电话连续语音识别系统性能的评测方法及其系统. 中国: CN100426376, 2008-10-15.
[55] 赵 丹, 王向东, 钱跃良, 刘 群, 林守勋. 一种音频匹配方法及系统. 中国: CN101221760, 2008-07-16.
[56] 赵 丹, 王向东, 钱跃良, 刘 群, 林守勋. 一种广告检测识别方法及系统. 中国: CN101221622, 2008-07-16.

出版信息

   
发表论文
[1] Jianguo Mao, Jingwen Zhu, Xiangdong Wang, Hong Liu, Yueliang Qian. Speech Synthesis of Chinese Braille with Limited Training Data. 2021 IEEE International Conference on Multimedia and Expo (ICME 2021)[J]. 2021, [2] Lin, Liwei, Wang, Xiangdong, Liu, Hong, Qian, Yueliang. GUIDED LEARNING FOR WEAKLY-LABELED SEMI-SUPERVISED SOUND EVENT DETECTION. 2020 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING[J]. 2020, 626-630, [3] Huang, Yuxin, Lin, Liwei, Ma, Shuo, Wang, Xiangdong, Liu, Hong, Qian, Yueliang, Liu, Min, Ouch, Kazushige. Guided multi-branch learning systems for sound event detection with sound separation. 2020, http://arxiv.org/abs/2007.10638.
[4] Lin, Liwei, Wang, Xiangdong, Liu, Hong, Qian, Yueliang. Specialized Decision Surface and Disentangled Feature for Weakly-Supervised Polyphonic Sound Event Detection. IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING[J]. 2020, 28: 1466-1478, http://dx.doi.org/10.1109/TASLP.2020.2989575.
[5] Huang, Yuxin, Wang, Xiangdong, Lin, Liwei, Liu, Hong, Qian, Yueliang. MULTI-BRANCH LEARNING FOR WEAKLY-LABELED SOUND EVENT DETECTION. 2020 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING[J]. 2020, 641-645, [6] 蔡佳, 王向东, 唐李真, 崔晓娟, 刘宏, 钱跃良. 基于汉盲对照语料库和深度学习的汉盲自动转换. 中文信息学报[J]. 2019, 33(4): 60-67, http://lib.cqvip.com/Qikan/Article/Detail?id=7002147298.
[7] Ni, Haomiao, Liu, Hong, Wang, Kuansong, Wang, Xiangdong, Zhou, Xunjian, Qian, Yueliang, Suk, HI, Liu, M, Yan, P, Lian, C. WSI-Net: Branch-Based and Hierarchy-Aware Network for Segmentation and Classification of Breast Histopathological Whole-Slide Images. MACHINE LEARNING IN MEDICAL IMAGING (MLMI 2019)null. 2019, 11861: 36-44, [8] Guo, Zichao, Liu, Hong, Ni, Haomiao, Wang, Xiangdong, Su, Mingming, Guo, Wei, Wang, Kuansong, Jiang, Taijiao, Qian, Yueliang. A Fast and Refined Cancer Regions Segmentation Framework in Whole-slide Breast Pathological Images. SCIENTIFIC REPORTS[J]. 2019, 9(1): http://dx.doi.org/10.1038/s41598-018-37492-9.
[9] Lin Liwei, Wang Xiangdong, Liu Hong, Qian Yueliang. Guided Learning Convolution System for DCASE 2019 Task 4. 2019, http://arxiv.org/abs/1909.06178.
[10] Wang, Xiangdong, Zhong, Jinghua, Cai, Jia, Liu, Hong, Qian, Yueliang, Assoc Comp Machinery. CBConv: Service for Automatic Conversion of Chinese Characters into Braille with High Accuracy. ASSETS'19: THE 21ST INTERNATIONAL ACM SIGACCESS CONFERENCE ON COMPUTERS AND ACCESSIBILITYnull. 2019, 566-568, http://dx.doi.org/10.1145/3308561.3354639.
[11] Li Renqiang, Liu Hong, Wang Xiangdong, Qian Yueliang. DSBI: Double-Sided Braille Image Dataset and Algorithm Evaluation for Braille Dots Detection. 2019, http://arxiv.org/abs/1811.10893.
[12] Liu, Hong, Wu, Wenshan, Wang, Xiangdong, Qian, Yueliang. RGB-D joint modelling with scene geometric information for indoor semantic segmentation. MULTIMEDIA TOOLS AND APPLICATIONS[J]. 2018, 77(17): 22475-22488, https://www.webofscience.com/wos/woscc/full-record/WOS:000441364500039.
[13] Ruan, Yong, Qian, Yueliang, Wang, Xiangdong. Mobile Phone-Based Audio Announcement Detection and Recognition for People with Hearing Impairment. ADVANCES IN MULTIMEDIA[J]. 2018, 2018: http://dx.doi.org/10.1155/2018/8786308.
[14] 孔佑琪, 刘明勇, 王成, 周立春, 王向东. 融合声音与运动传感器的步态分析技术的敏感性及信度研究. 中国卒中杂志. 2018, 13(12): 1262-1265, http://lib.cqvip.com/Qikan/Article/Detail?id=7001276003.
[15] Wang Cheng, Wang Xiangdong, Long Zhou, Tian Tian, Gao Mingming, Yun Xiaoping, Qian Yueliang, Li Jintao. Estimation of Spatial-Temporal Gait Parameters based on the Fusion of Inertial and Film-Pressure Signals. PROCEEDINGS 2018 IEEE INTERNATIONAL CONFERENCE ON BIOINFORMATICS AND BIOMEDICINE (BIBM)[J]. 2018, 1232-1239, [16] Wang Xiangdong, Yang Yang, Zhang Jinchao, Jiang Wenbin, Liu Hong, Qian Yueliang. Chinese to Braille translation based on Braille word segmentation using statistical model. Journal of Shanghai Jiaotong University (Science)[J]. 2017, [17] Wang, Xiangdong, Yang, Ying, Liu, Hong, Qian, Yueliang. Improving speech transcription by exploiting user feedback and word repetition. MULTIMEDIA TOOLS AND APPLICATIONS[J]. 2017, 76(19): 20359-20376, https://www.webofscience.com/wos/woscc/full-record/WOS:000409180500058.
[18] Wang, Cheng, Wang, Xiangdong, Long, Zhou, Yuan, Jing, Qian, Yueling, Li, Jintao, IEEE. Multimodal Gait Analysis based on Wearable Inertial and Microphone Sensors. 2017 IEEE SMARTWORLD, UBIQUITOUS INTELLIGENCE & COMPUTING, ADVANCED & TRUSTED COMPUTED, SCALABLE COMPUTING & COMMUNICATIONS, CLOUD & BIG DATA COMPUTING, INTERNET OF PEOPLE AND SMART CITY INNOVATION (SMARTWORLD/SCALCOM/UIC/ATC/CBDCOM/IOP/SCI)null. 2017, http://apps.webofknowledge.com/CitedFullRecord.do?product=UA&colName=WOS&SID=5CCFccWmJJRAuMzNPjj&search_mode=CitedFullRecord&isickref=WOS:000464418300089.
[19] Jia, Duan, Wang, Xiangdong, Ma, Yuzhuo, Yang, Yang, Liu, Hong, Qian, Yueliang, Wang, Y, Sun, Y. Language Model Adaptation Based on Correction Information for Interactive Speech Transcription. PROCEEDINGS OF THE 2016 INTERNATIONAL CONFERENCE ON PROGRESS IN INFORMATICS AND COMPUTING (PIC), VOL 1null. 2016, 258-263, [20] Wang, Cheng, Wang, Xiangdong, Long, Zhou, Yuan, Jing, Qian, Yueliang, Li, Jintao. Estimation of Temporal Gait Parameters Using a Wearable Microphone-Sensor-Based System. SENSORS[J]. 2016, 16(12): https://doaj.org/article/15c87c48691c469fb4582254f9026fbf.
[21] Wang Xiangdong, Yang Yang, Liu Hong, Qian Yueliang. Chinese-Braille Translation Based on Braille Corpus. International Journal of Advanced Pervasive and Ubiquitous Computing (IJAPUC)[J]. 2016, [22] Guo, Zichao, Liu, Hong, Qian, Yueliang, Wang, Xiangdong. A NOVEL OBSTACLE DETECTION METHOD BASED ON DISTORTION OF LASER PATTERN. 2016 IEEE INTERNATIONAL CONFERENCE ON MULTIMEDIA & EXPO (ICME)[J]. 2016, [23] Ji, Wen, Chen, BoWei, Wang, Xiangdong, Luo, Haiyong, Kim, Mucheol, Chen, Yiqiang. Cross-Layer Opportunistic Scheduling for Device-to-Device Video Multicast Services. ACM TRANSACTIONS ON EMBEDDED COMPUTING SYSTEMS[J]. 2016, 15(2): https://www.webofscience.com/wos/woscc/full-record/WOS:000381427500018.
[24] Shao Song, Liu Hong, Wang Xiangdong, Qian Yueliang, Jawahar CV, Shan S. Local Associated Features for Pedestrian Detection. COMPUTER VISION - ACCV 2014 WORKSHOPS, PT Inull. 2015, 9008: 513-526, [25] Liu, Hong, Xu, Tao, Wang, Xiangdong, Qian, Yueliang. A Novel Multi-Feature Descriptor for Human Detection Using Cascaded Classifiers in Static Images. JOURNAL OF SIGNAL PROCESSING SYSTEMS FOR SIGNAL IMAGE AND VIDEO TECHNOLOGY[J]. 2015, 81(3): 377-388, https://www.webofscience.com/wos/woscc/full-record/WOS:000362575300005.
[26] 邵松, 刘宏, 王向东, 钱跃良. 基于迁移学习的行人检测研究进展. 计算机工程与应用[J]. 2014, 156-163, http://lib.cqvip.com/Qikan/Article/Detail?id=663467715.
[27] 刘宏, 王喆, 王向东, 赵国英, 钱跃良. 面向盲人避障的场景自适应分割及障碍物检测. 计算机辅助设计与图形学学报[J]. 2013, 25(12): 1818-1825, http://lib.cqvip.com/Qikan/Article/Detail?id=47939542.