基本信息

杨小汕   男   副研究员   硕导

中国科学院自动化研究所
邮箱: xiaoshan.yang@nlpr.ia.ac.cn
地址: 北京市海淀区中关村东路95号
邮编: 100190

研究领域

多媒体内容分析、计算机视觉、模式识别

招生信息


招生专业:

081104-模式识别与智能系统

081203-计算机应用技术


招生方向:

图像与视频处理

多媒体内容分析


教育背景

2012-09--2016-07   中科院自动化研究所   博士
2009-09--2012-03   北京理工大学   硕士
2005-09--2009-07   北方工业大学   本科

工作经历


工作简历:

2018-11 ~ 至今,  中科院自动化研究所,  副研究员

2016-07 ~ 2018-10,  中科院自动化研究所,  助理研究员


学术兼职:

中国计算机学会多媒体专业委员会委员

中国图象图形学学会多媒体专业委员会委员

ACM Multimedia 2018/2019/2020 PC Member

MM Asia 2019 Area Chair, ICPR 2020 Area Chair

IEEE TMM/ACM TIST/ACM TOMM/PR等国际期刊审稿人

奖励与专利


奖励:

(1) 腾讯犀牛鸟卓创奖, 其他, 2018

(2) 中国科学院优秀博士学位论文, 院级, 2017

(3) 中国多媒体大会(ChinaMM)最佳论文奖, 其他, 2017

(4) 中科院院长优秀奖, 院级, 2016


专利:

( 1 ) 描述文本生成方法及装置, 发明, 2018, 第 1 作者, 专利号: 201810082485.1

( 2 ) 基于知识图谱预测视频精彩级别的方 法、装置及存储介质, 发明, 2019, 第 1 作者, 专利号: 201911055049.6

( 3 ) 基于视觉属性的社会事件识别方法, 发明, 2017, 第 2 作者, 专利号: CN201410370304.7

( 4 ) 学习跨平台多模态媒体数据共同特征表示的方法及装置, 发明, 2017, 第 2 作者, 专利号: CN201410366722.9

发表论文


(1) Discriminative Multimodal Embedding for Event Classification, Neurocomputing, 2020, 第 2 作者
(2) Find Objects and Focus on Highlights: Mining Object Semantics for Video Highlight Detection via Graph Neural Networks, AAAI Conference on Artificial Intelligence (AAAI), 2020, 第 3 作者
(3) Biomedia ACM MM Grand Challenge 2019: Using Data Enhancement to Solve Sample Unbalance, ACM Multimedia Conference (MM), 2019, 第 4 作者
(4) Exploring Feature Representation and Training Strategies in Temporal Action Localization, IEEE International Conference on Image Processing (ICIP)), 2019, 第 2 作者
(5) Image Captioning by Asking Questions, ACM Transactions on Multimedia Computing, Communications, and Applications (TOMM), 2019, 第 1 作者
(6) A Unified Framework for Multimodal Domain Adaptation, ACM Multimedia Conference (MM), 2018, 第 2 作者
(7) Three-Dimensional Attention-Based Deep Ranking Model for Video Highlight Detection, IEEE Transactions on Multimedia (TMM), 2018, 第 4 作者
(8) Text2Video: An End-to-end Learning Framework for Expressing Text With Videos, IEEE Transactions on Multimedia (TMM), 2018, 第 1 作者
(9) Deep-Structured Event Modeling for User-Generated Photos, IEEE Transactions on Multimedia (TMM), 2018, 第 1 作者
(10) P2T: Part-to-Target Tracking via Deep Regression Learning, IEEE Transactions on Image Processing (TIP), 2018, 第 3 作者
(11) Deep Relative Tracking, IEEE Transactions on Image Processing (TIP), 2017, 第 3 作者
(12) Abnormal Event Discovery in User Generated Photos, ACM Multimedia Conference (MM), 2016, 第 1 作者
(13) Semantic Feature Mining for Video Event Understanding, ACM Transactions on Multimedia Computing, Communications, and Applications (TOMM), 2016, 第 1 作者
(14) Deep Relative Attributes, IEEE Transactions on Multimedia (TMM), 2016, 第 1 作者
(15) Boosted Multifeature Learning for Cross-Domain Transfer, ACM Transactions on Multimedia Computing, Communications, and Applications (TOMM), 2015, 第 1 作者
(16) Automatic Visual Concept Learning for Social Event Understanding, IEEE Transactions on Multimedia (TMM), 2015, 第 1 作者
(17) Cross-Domain Feature Learning in Multimedia, IEEE Transactions on Multimedia (TMM), 2015, 第 1 作者
(18) Intrinsic Image Decomposition Using Optimization and User Scribbles, IEEE Transactions on Cybernetics (TCYB), 2013, 第 2 作者
(19) Intrinsic Images Using Optimization, IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2011, 第 2 作者

科研项目

( 1 ) 知识驱动的视频文本描述生成, 主持, 国家级, 2018-01--2020-12
( 2 ) 知识辅助的对抗式视频内容生成, 主持, 市地级, 2018-01--2020-12
( 3 ) 知识驱动的视频内容理解, 主持, 院级, 2017-10--2019-06
( 4 ) 数据和知识联合驱动的视频精彩内容剪辑, 主持, 院级, 2018-08--2019-12
( 5 ) 视频精细化标签AI能力定制, 主持, 院级, 2018-08--2019-12
( 6 ) 课题---数据反馈和知识融合的跨媒体因果推断, 参与, 国家级, 2020-01--2022-12
( 7 ) 基于实时行为数据的个性化健康管理, 参与, 国家级, 2018-01--2022-12
( 8 ) 大数据多模态交互协同关键技术, 参与, 国家级, 2018-01--2021-12