王向东-中国科学院大学-UCAS

王向东男硕导中国科学院计算技术研究所
电子邮件： xdwang@ict.ac.cn
通信地址：北京市海淀区科学院南路6号
邮政编码：

研究领域

人机交互，机器学习，语音交互，音频处理，可穿戴计算，残疾人信息无障碍技术

招生信息

招生专业

081203-计算机应用技术

招生方向

人机交互，机器学习，音频处理，语音交互
计算医疗与健康
残疾人信息无障碍

教育背景

2002-09--2007-07 中国科学院计算技术研究所硕博连读研究生、博士
1998-09--2002-07 内蒙古大学计算机学院本科、学士

工作经历

工作简历

2014-03~2014-06,新加坡国立大学, 访问学者
2013-10~现在, 中国科学院计算技术研究所, 高级工程师
2007-07~2013-09,中国科学院计算技术研究所, 助理研究员

专利与奖励

奖励信息

（1）无障碍普适计算系统关键技术及应用, 一等奖, 部委级, 2017
（2）远程信息无障碍交互关键技术及应用, 二等奖, 省级, 2015

专利成果

[1] 刘宏, 雷欣, 王向东, 钱跃良. 一种基于深度学习的手写盲文识别方法及系统. 202210653603.6, 2022-06-09.
[2] 刘宏, 焦梦磊, 王向东, 钱跃良. 一种基于多模态融合的肿瘤分类方法及系统. 202210594803.9, 2022-05-27.
[3] 王向东, 姚鑫, 刘宏, 钱跃良. 一种通用盲文到汉字的转换方法及系统. 202210569910.6, 2022-05-24.
[4] 王向东, 王子和, 姚鑫, 刘宏, 钱跃良. 一种汉字到通用盲文的转换方法及系统. 202111566326.7, 2021-12-20.
[5] 王向东, 姚鑫, 王子和, 刘宏, 钱跃良. 一种汉字-通用盲文对照语料库的构建方法及系统. 202111566342.6, 2021-12-20.
[6] 刘宏, 焦梦磊, 王向东, 钱跃良. 一种基于影像数据和深度学习的肿瘤良恶性识别方法和系统. CN: CN113743463A, 2021-12-03.
[7] 谢萦, 钱跃良, 王向东. 一种方言语音数据切分及标注方法、系统. 202111066861.6, 2021-09-13.
[8] 张博宁, 钱跃良, 王向东. 一种人机交互设备. CN: CN113377207A, 2021-09-10.
[9] 王向东, 朱靖雯, 毛建国, 刘宏, 钱跃良. 一种汉语盲文语音合成方法及系统. 202110749716.1, 2021-07-02.
[10] 刘宏, 王向东, 钱跃良. 一种盲文方辅助标注方法及系统. CN: CN107886808B, 2021-03-09.
[11] 刘宏, 黎仁强, 王向东, 钱跃良. 一种基于深度学习的盲文图像自动识别方法和系统. CN: CN110298236A, 2019-10-01.
[12] 王向东, 崔晓娟, 钱跃良, 刘宏. 一种中国盲文错误自动检测方法、系统及存储介质. CN: CN110276069A, 2019-09-24.
[13] 王向东, 蔡佳, 钱跃良, 刘宏. 一种汉盲对照双语语料库的构建方法和系统. CN: CN109344389A, 2019-02-15.
[14] 王向东, 蔡佳, 钱跃良, 刘宏. 一种基于深度神经网络的汉盲自动转换方法和系统. CN: CN109241540A, 2019-01-18.
[15] 刘宏, 黎仁强, 王向东, 钱跃良. 一种盲文方自适应定位方法及系统. CN: CN108062548A, 2018-05-22.
[16] 刘宏, 钱跃良, 王向东. 盲文点交互式标注方法及系统. CN: CN108062886A, 2018-05-22.
[17] 刘宏, 黎仁强, 王向东, 钱跃良. 一种高精度盲文识别方法及系统. CN: CN108052955A, 2018-05-18.
[18] 刘宏, 黎仁强, 王向东, 钱跃良. 一种盲文图像自动倾斜校正方法及系统. CN: CN108052936A, 2018-05-18.
[19] 刘宏, 钱跃良, 王向东. 一种盲文点检测方法及系统. CN: CN107958261A, 2018-04-24.
[20] 刘宏, 王向东, 钱跃良. 一种盲文点辅助标注方法及系统. CN: CN107886808A, 2018-04-06.
[21] 王成, 龙舟, 钱跃良, 王向东, 袁静, 李锦涛. 基于音频的拖地声检测方法. CN: CN107170466A, 2017-09-15.
[22] 钱跃良, 王向东. 一种聋人提示系统、方法及智能手机. CN: CN106713633A, 2017-05-24.
[23] 钱跃良, 王向东. 聋哑人与正常人的辅助对话系统、方法及智能手机. CN: CN106686223A, 2017-05-17.
[24] 王成, 龙舟, 钱跃良, 王向东. 基于双声道的脚步检测方法. CN: CN106653058A, 2017-05-10.
[25] 王成, 王向东, 钱跃良. 用于触控式设备的盲文输入装置. CN: CN206097069U, 2017-04-12.
[26] 王成, 龙舟, 钱跃良, 王向东, 袁静. 融合加速度和音频信息的脚步检测方法. CN: CN106531186A, 2017-03-22.
[27] 王成, 王向东, 钱跃良. 一种跌倒检测及报警方法. CN: CN106529418A, 2017-03-22.
[28] 王向东, 贾端, 马玉卓, 钱跃良, 刘宏. 一种自适应的语音识别的方法和设备. CN: CN106297800A, 2017-01-04.
[29] 王成, 王向东, 钱跃良, 龙舟, 袁静. 一种建立步态数据集的方法及步态分析方法. CN: CN106175778A, 2016-12-07.
[30] 王成, 王向东, 钱跃良, 龙舟, 袁静. 一种步态参数的采集方法及设备. CN: CN106166071A, 2016-11-30.
[31] 王向东, 杨阳, 钱跃良, 刘宏, 张金超, 姜文斌. 一种用于盲人读取汉字的方法及系统. CN: CN105404621A, 2016-03-16.
[32] 王向东, 蔡佳, 钱跃良, 刘宏. 一种融合非确定性反馈的语音识别错误修正方法及系统. CN: CN105206267A, 2015-12-30.
[33] 钱跃良, 王向东, 刘宏. 障碍物检测装置及方法. CN: CN104574365A, 2015-04-29.
[34] 王向东, 杨阳, 钱跃良, 刘宏. 一种融合用户反馈的汉语语音识别方法及系统. CN: CN104538032A, 2015-04-22.
[35] 钱跃良, 刘宏, 王喆, 王向东. 盲人避障提示装置及方法. CN: CN104287946A, 2015-01-21.
[36] 王云芝, 张博宁, 王向东, 钱跃良, 罗海勇. 一种能智能化响应用电需求的充电系统及方法. CN: CN103812126A, 2014-05-21.
[37] 王向东, 杨阳, 钱跃良. 用于融合多个语音识别系统的识别结果的方法及系统. CN: CN103474069A, 2013-12-25.
[38] 钱跃良, 王向东, 张博宁, 赵希君, 李伟. 一种具有盲文点字输入功能的盲人电子记事本. CN: CN203134200U, 2013-08-14.
[39] 张博宁, 钱跃良, 陈益强, 王向东. 一种支持多点触摸手势的人机交互戒指. CN: CN103105945A, 2013-05-15.
[40] 刘宏, 钱跃良, 王向东. 基于定位遥控器的智能电视人机交互方法、装置和系统. CN: CN103051964A, 2013-04-17.
[41] 刘宏, 钱跃良, 王向东. 智能电视人机交互方法、装置和系统. CN: CN103051934A, 2013-04-17.
[42] 刘宏, 钱跃良, 王向东. 基于遥控器的智能电视人机交互方法、装置和系统. CN: CN103051942A, 2013-04-17.
[43] 王向东, 张虹, 钱跃良. 电视频道自动跳转的系统与方法. CN: CN103024556A, 2013-04-03.
[44] 王向东, 钱跃良, 张虹, 李新辉. 提供与视频播放内容相关信息的系统和方法. CN: CN103024464A, 2013-04-03.
[45] 张博宁, 钱跃良, 王向东. 一种人机交互设备. CN: CN102184011B, 2013-03-27.
[46] 钱跃良, 王向东, 张博宁, 赵希君. 一种基于微型按钮开关的盲文输入装置及方法. CN: CN102880291A, 2013-01-16.
[47] 张博宁, 钱跃良, 陈益强, 王向东. 一种人机交互戒指. CN: CN102866789A, 2013-01-09.
[48] 罗海勇, 张雨晨, 朱珍民, 王向东. 一种面向需求侧响应基于预测的三相负载调度方法及装置. CN: CN102751724A, 2012-10-24.
[49] 钱跃良, 王向东, 刘宏. 一种智能电视的交互方法与系统. CN: CN102547466A, 2012-07-04.
[50] 钱跃良, 赵希君, 王向东. 一种用于电子产品的电量语音提示装置. CN: CN202159129U, 2012-03-07.
[51] 钱跃良, 赵希君, 王向东, 张博宁, 王超. 一种盲文点字转换装置. CN: CN202150089U, 2012-02-22.
[52] 李新辉, 王向东, 钱跃良, 林守勋. 汉语语音识别中重复出现词识别错误的自动修正方法. CN: CN102324233A, 2012-01-18.
[53] 高杨, 王向东, 钱越良, 刘群. 一种重复性视频音频节目片段的检测方法和系统. CN: CN101159834B, 2012-01-11.
[54] 王超, 赵颖, 王向东, 钱跃良, 林守勋. 一种用于盲人读取汉字的系统和方法. CN: CN102184172A, 2011-09-14.
[55] 张博宁, 钱跃良, 王向东. 一种人机交互设备. CN: CN102184011A, 2011-09-14.
[56] 邓铸辉, 陈启华, 王向东, 钱跃良, 林守勋. 一种语音浏览方法及浏览器. CN: CN102163213A, 2011-08-24.
[57] 王超, 王向东, 钱跃良, 林守勋. 一种盲文输入方法和系统. CN: CN102156693A, 2011-08-17.
[58] 钱跃良, 张博宁, 褚诚缘, 谢萦, 王向东. 一种路灯杆的数字化管理与智能交互装置、方法及其系统. CN: CN102158986A, 2011-08-17.
[59] 邓铸辉, 陈启华, 王向东, 钱跃良, 林守勋. 一种网页分割方法. CN: CN102073710A, 2011-05-25.
[60] 李新辉, 王向东, 钱跃良, 林守勋. 一种交互式语音识别系统和方法. CN: CN101923854A, 2010-12-22.
[61] 李新辉, 王向东, 高扬, 钱跃良, 林守勋. 从音视频中检测广告的方法及系统. CN: CN101576955A, 2009-11-11.
[62] 钱跃良, 张博宁, 王向东, 刘宏, 陈益强. LED路灯的智能控制装置及智能控制方法. CN: CN101541123A, 2009-09-23.
[63] 钱跃良, 张博宁, 王向东, 谢书华. 一种盲文计算机点字输入系统及方法. CN: CN101339467A, 2009-01-07.
[64] 赵丹, 王向东, 钱跃良, 刘群, 林守勋. 一种音频匹配方法及系统. CN: CN101221760A, 2008-07-16.
[65] 赵丹, 王向东, 钱跃良, 刘群, 林守勋. 一种广告检测识别方法及系统. CN: CN101221622A, 2008-07-16.
[66] 钱跃良, 王向东, 谢书华, 谢萦. 一种盲文计算机点字输入系统和装置以及方法. CN: CN101135940A, 2008-03-05.
[67] 王向东, 栾焕博, 林守勋, 钱跃良, 刘宏, 张勇东. 一种电话连续语音识别系统性能的评测方法及其系统. CN: CN1811915A, 2006-08-02.

出版信息

发表论文

[1] Jianguo Mao, Wenbin Jiang, Hong Liu, Xiangdong Wang, Yajuan Lyu. Inferential Knowledge-Enhanced Integrated Reasoning for Video Question Answering. AAAI 2023null. 2023, [2] Hong Liu, Menglei Jiao, Yuan Yuan, Hanqiang Ouyang, Jianfang Liu, Yuan Li, Chunjie Wang, Ning Lang, Liang Jiang, Yueliang Qian, Huishu Yuan, Xiangdong Wang. Benign and Malignant Prediction of Spinal Tumors based on Deep Learning and Weighted Fusion Framework on MRI. Insights into imaging[J]. 2022, 13(7): [3] Jianguo Mao, Wenbin Jiang, Xiangdong Wang, Hong Liu, Yu Xia, Yajuan Lyu, Qiaoqiao She. Explainable Question Answering based on Semantic Graph by Global Differentiable Learning and Dynamic Adaptive Reasoning. EMNLP 2022null. 2022, [4] Meng-Lei Jiao, Hong Liu, Jian-Fang Liu, Han-Qiang Ou-Yang, Xiang-Dong Wang, Liang Jiang, Hui-Shu Yuan, Yue-Liang Qian. MAL: Multi-modal attention learning for tumor diagnosis via bipartite graph and multiple branches. International Conference on Medical Image Computing and Computer Assisted Interventionnull. 2022, [5] Hong Liu, Wendong Xu, Zihao Shang, Xiangdong Wang, Kuansong Wang, Yueliang Qian. Breast Cancer Molecular Subtypes Prediction on H&E Pathological Images Based on Discriminative Patch Selecting and Multi-Instance Learning. Frontiers in Oncology[J]. 2022, [6] Jianguo Mao, Jiyuan Zhang, Zengfeng Zeng, Weihua Peng, Wenbin Jiang, Xiangdong Wang, Hong Liu, Yajuan Lyu. Hierarchical Representation-based Dynamic Reasoning Network for Biomedical Question Answering. COLING 2022null. 2022, [7] Li, Yiming, Guo, Zhifang, Ye, Zhirong, Wang, Xiangdong, Liu, Hong, Qian, Yueliang, Tao, Rui, Yan, Long, Ouchi, Kazushige. A Hybrid System of Sound Event Detection Transformer and Frame-wise Model for DCASE 2022 Task 4. DCASE workshop 2022null. 2022, http://arxiv.org/abs/2210.09529.
[8] Tao, Rui, Yan, Long, Ouchi, Kazushige, Wang, Xiangdong. Couple Learning for semi-supervised sound event detection. INTERSPEECH 2022null. 2022, [9] Jianguo Mao, Wenbin Jiang, Xiangdong Wang, Zhifan Feng, Yajuan Lyu, Hong Liu, Yong Zhu. Dynamic Multistep Reasoning based on Video Scene Graph for Video Question Answering. NAACL 2022null. 2022, [10] Jianguo Mao, Jingwen Zhu, Xiangdong Wang, Hong Liu, Yueliang Qian. Speech Synthesis of Chinese Braille with Limited Training Data. 2021IEEEINTERNATIONALCONFERENCEONMULTIMEDIAANDEXPOICME2021null. 2021, [11] Lin, Liwei, Wang, Xiangdong, Liu, Hong, Qian, Yueliang. GUIDED LEARNING FOR WEAKLY-LABELED SEMI-SUPERVISED SOUND EVENT DETECTION. 2020 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSINGnull. 2020, 626-630, [12] Huang, Yuxin, Lin, Liwei, Ma, Shuo, Wang, Xiangdong, Liu, Hong, Qian, Yueliang, Liu, Min, Ouch, Kazushige. Guided multi-branch learning systems for sound event detection with sound separation. Workshop on Detection and Classification of Acoustic Scenes and Events 2020null. 2020, http://arxiv.org/abs/2007.10638.
[13] Lin, Liwei, Wang, Xiangdong, Liu, Hong, Qian, Yueliang. Specialized Decision Surface and Disentangled Feature for Weakly-Supervised Polyphonic Sound Event Detection. IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING[J]. 2020, 28: 1466-1478, http://dx.doi.org/10.1109/TASLP.2020.2989575.
[14] Huang, Yuxin, Wang, Xiangdong, Lin, Liwei, Liu, Hong, Qian, Yueliang. MULTI-BRANCH LEARNING FOR WEAKLY-LABELED SOUND EVENT DETECTION. 2020 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSINGnull. 2020, 641-645, [15] 蔡佳, 王向东, 唐李真, 崔晓娟, 刘宏, 钱跃良. 基于汉盲对照语料库和深度学习的汉盲自动转换. 中文信息学报[J]. 2019, 33(4): 60-67, http://lib.cqvip.com/Qikan/Article/Detail?id=7002147298.
[16] Ni, Haomiao, Liu, Hong, Wang, Kuansong, Wang, Xiangdong, Zhou, Xunjian, Qian, Yueliang, Suk, HI, Liu, M, Yan, P, Lian, C. WSI-Net: Branch-Based and Hierarchy-Aware Network for Segmentation and Classification of Breast Histopathological Whole-Slide Images. MACHINE LEARNING IN MEDICAL IMAGING (MLMI 2019)null. 2019, 11861: 36-44, [17] Guo, Zichao, Liu, Hong, Ni, Haomiao, Wang, Xiangdong, Su, Mingming, Guo, Wei, Wang, Kuansong, Jiang, Taijiao, Qian, Yueliang. A Fast and Refined Cancer Regions Segmentation Framework in Whole-slide Breast Pathological Images. SCIENTIFIC REPORTS[J]. 2019, 9(1): http://dx.doi.org/10.1038/s41598-018-37492-9.
[18] Liwei Lin, Xiangdong Wang, Hong Liu, Yueliang Qian. Guided Learning Convolution System for DCASE 2019 Task 4. Workshop on Detection and Classification of Acoustic Scenes and Eventsnull. 2019, http://arxiv.org/abs/1909.06178.
[19] Wang, Xiangdong, Zhong, Jinghua, Cai, Jia, Liu, Hong, Qian, Yueliang, Assoc Comp Machinery. CBConv: Service for Automatic Conversion of Chinese Characters into Braille with High Accuracy. ASSETS'19: THE 21ST INTERNATIONAL ACM SIGACCESS CONFERENCE ON COMPUTERS AND ACCESSIBILITYnull. 2019, 566-568, http://dx.doi.org/10.1145/3308561.3354639.
[20] Li Renqiang, Liu Hong, Wang Xiangdong, Qian Yueliang. DSBI: Double-Sided Braille Image Dataset and Algorithm Evaluation for Braille Dots Detection. 2019, http://arxiv.org/abs/1811.10893.
[21] Liu, Hong, Wu, Wenshan, Wang, Xiangdong, Qian, Yueliang. RGB-D joint modelling with scene geometric information for indoor semantic segmentation. MULTIMEDIA TOOLS AND APPLICATIONS[J]. 2018, 77(17): 22475-22488, https://www.webofscience.com/wos/woscc/full-record/WOS:000441364500039.
[22] Ruan, Yong, Qian, Yueliang, Wang, Xiangdong. Mobile Phone-Based Audio Announcement Detection and Recognition for People with Hearing Impairment. ADVANCES IN MULTIMEDIA[J]. 2018, 2018: http://dx.doi.org/10.1155/2018/8786308.
[23] 孔佑琪, 刘明勇, 王成, 周立春, 王向东. 融合声音与运动传感器的步态分析技术的敏感性及信度研究. 中国卒中杂志[J]. 2018, 13(12): 1262-1265, http://lib.cqvip.com/Qikan/Article/Detail?id=7001276003.
[24] Wang Cheng, Wang Xiangdong, Long Zhou, Tian Tian, Gao Mingming, Yun Xiaoping, Qian Yueliang, Li Jintao. Estimation of Spatial-Temporal Gait Parameters based on the Fusion of Inertial and Film-Pressure Signals. PROCEEDINGS 2018 IEEE INTERNATIONAL CONFERENCE ON BIOINFORMATICS AND BIOMEDICINE (BIBM)[J]. 2018, 1232-1239, [25] Wang Xiangdong, Yang Yang, Zhang Jinchao, Jiang Wenbin, Liu Hong, Qian Yueliang. Chinese to Braille translation based on Braille word segmentation using statistical model. JOURNAL OF SHANGHAI JIAOTONG UNIVERSITY (SCIENCE)[J]. 2017, [26] Wang, Xiangdong, Yang, Ying, Liu, Hong, Qian, Yueliang. Improving speech transcription by exploiting user feedback and word repetition. MULTIMEDIA TOOLS AND APPLICATIONS[J]. 2017, 76(19): 20359-20376, https://www.webofscience.com/wos/woscc/full-record/WOS:000409180500058.
[27] Wang, Cheng, Wang, Xiangdong, Long, Zhou, Yuan, Jing, Qian, Yueling, Li, Jintao, IEEE. Multimodal Gait Analysis based on Wearable Inertial and Microphone Sensors. 2017 IEEE SMARTWORLD, UBIQUITOUS INTELLIGENCE & COMPUTING, ADVANCED & TRUSTED COMPUTED, SCALABLE COMPUTING & COMMUNICATIONS, CLOUD & BIG DATA COMPUTING, INTERNET OF PEOPLE AND SMART CITY INNOVATION (SMARTWORLD/SCALCOM/UIC/ATC/CBDCOM/IOP/SCI)null. 2017, http://apps.webofknowledge.com/CitedFullRecord.do?product=UA&colName=WOS&SID=5CCFccWmJJRAuMzNPjj&search_mode=CitedFullRecord&isickref=WOS:000464418300089.
[28] Jia, Duan, Wang, Xiangdong, Ma, Yuzhuo, Yang, Yang, Liu, Hong, Qian, Yueliang, Wang, Y, Sun, Y. Language Model Adaptation Based on Correction Information for Interactive Speech Transcription. PROCEEDINGS OF THE 2016 INTERNATIONAL CONFERENCE ON PROGRESS IN INFORMATICS AND COMPUTING (PIC), VOL 1null. 2016, 258-263, [29] Wang, Cheng, Wang, Xiangdong, Long, Zhou, Yuan, Jing, Qian, Yueliang, Li, Jintao. Estimation of Temporal Gait Parameters Using a Wearable Microphone-Sensor-Based System. SENSORS[J]. 2016, 16(12): https://doaj.org/article/15c87c48691c469fb4582254f9026fbf.
[30] Wang Xiangdong, Yang Yang, Liu Hong, Qian Yueliang. Chinese-Braille Translation Based on Braille Corpus. INTERNATIONAL JOURNAL OF ADVANCED PERVASIVE AND UBIQUITOUS COMPUTING (IJAPUC)[J]. 2016, [31] Guo, Zichao, Liu, Hong, Qian, Yueliang, Wang, Xiangdong. A NOVEL OBSTACLE DETECTION METHOD BASED ON DISTORTION OF LASER PATTERN. 2016 IEEE INTERNATIONAL CONFERENCE ON MULTIMEDIA & EXPO (ICME)[J]. 2016, [32] Ji, Wen, Chen, BoWei, Wang, Xiangdong, Luo, Haiyong, Kim, Mucheol, Chen, Yiqiang. Cross-Layer Opportunistic Scheduling for Device-to-Device Video Multicast Services. ACM TRANSACTIONS ON EMBEDDED COMPUTING SYSTEMS[J]. 2016, 15(2): https://www.webofscience.com/wos/woscc/full-record/WOS:000381427500018.
[33] Shao Song, Liu Hong, Wang Xiangdong, Qian Yueliang, Jawahar CV, Shan S. Local Associated Features for Pedestrian Detection. COMPUTER VISION - ACCV 2014 WORKSHOPS, PT Inull. 2015, 9008: 513-526, [34] Liu, Hong, Xu, Tao, Wang, Xiangdong, Qian, Yueliang. A Novel Multi-Feature Descriptor for Human Detection Using Cascaded Classifiers in Static Images. JOURNAL OF SIGNAL PROCESSING SYSTEMS FOR SIGNAL IMAGE AND VIDEO TECHNOLOGY[J]. 2015, 81(3): 377-388, https://www.webofscience.com/wos/woscc/full-record/WOS:000362575300005.
[35] 邵松, 刘宏, 王向东, 钱跃良. 基于迁移学习的行人检测研究进展. 计算机工程与应用[J]. 2014, 156-163, http://lib.cqvip.com/Qikan/Article/Detail?id=663467715.
[36] 刘宏, 王喆, 王向东, 赵国英, 钱跃良. 面向盲人避障的场景自适应分割及障碍物检测. 计算机辅助设计与图形学学报[J]. 2013, 25(12): 1818-1825, http://lib.cqvip.com/Qikan/Article/Detail?id=47939542.