基本信息
俞晓明  男  硕导  中国科学院计算技术研究所
电子邮件: yuxiaoming@ict.ac.cn
通信地址: 北京海淀科学院南路6号
邮政编码: 100190

招生信息

   
招生专业
081202-计算机软件与理论
招生方向
大规模内容处理,Web搜索,文本挖掘

专利与奖励

   
奖励信息
(1) 钱伟长中文信息处理科学技术奖, 一等奖, 专项, 2014
专利成果
( 1 ) 一种基于相似话题的流行度预测方法及系统, 2021, 第 8 作者, 专利号: CN113780569A

( 2 ) 一种针对事件的话题表示生成方法及系统, 2021, 第 3 作者, 专利号: CN110795943B

( 3 ) 基于单平台的网络事件流行度预测方法与系统, 2021, 第 7 作者, 专利号: CN113190734A

( 4 ) 基于多平台的网络事件流行度预测方法与系统, 2021, 第 7 作者, 专利号: CN113190733A

( 5 ) 新冠肺炎疫情数据的实时采集方法, 2021, 第 8 作者, 专利号: CN112667872A

( 6 ) word文档关键信息抽取方法, 2021, 第 8 作者, 专利号: CN112668316A

( 7 ) 互联网金融项目信息抽取方法和系统, 2021, 第 4 作者, 专利号: CN108959204B

( 8 ) 一种任意尺度的话题脉络实时生成方法及系统, 2021, 第 5 作者, 专利号: CN112307278A

( 9 ) 一种网站列表页面的分类方法、系统及存储介质, 2021, 第 7 作者, 专利号: CN112287274A

( 10 ) 一种网站列表页面的分类方法、系统及存储介质, 2021, 第 6 作者, 专利号: CN112287274A

( 11 ) 一种特定学术领域人物的发现与跟踪方法及系统, 2020, 第 1 作者, 专利号: CN111488424A

( 12 ) 一种基于中间人的互联网数据采集方法及系统, 2020, 第 5 作者, 专利号: CN110781367A

( 13 ) 基于动力学模型的网络突发事件检测方法及系统, 2020, 第 4 作者, 专利号: CN110704717A

( 14 ) 基于事件因果关系抽取的网络苗头事件检测方法及系统, 2020, 第 5 作者, 专利号: CN110705597A

( 15 ) 一种基于Kubernetes的脚本解释型服务代理方法和系统, 2019, 第 3 作者, 专利号: CN110557428A

( 16 ) 一种基于Kubernetes的通用服务转换方法及系统, 2019, 第 3 作者, 专利号: CN110442421A

( 17 ) 一种基于Kubernetes的JS解析方法及系统, 2019, 第 3 作者, 专利号: CN110427264A

( 18 ) 一种融合用户画像的网络舆情热点推荐方法及系统, 2019, 第 6 作者, 专利号: CN110188265A

( 19 ) 大规模网络数据的多信息来源采集方法和系统, 2019, 第 4 作者, 专利号: CN109840298A

( 20 ) 用于大规模网络数据采集的分布式动态调度方法和系统, 2019, 第 2 作者, 专利号: CN109814992A

( 21 ) 一种基于脚本的网页采集服务方法和系统, 2019, 第 3 作者, 专利号: CN109815387A

( 22 ) 大规模网络数据的感知与获取方法和系统, 2019, 第 3 作者, 专利号: CN109815382A

( 23 ) 用于大规模网络数据采集的监控与统计分析方法和系统, 2019, 第 4 作者, 专利号: CN109819019A

( 24 ) 用于大规模网络数据采集的信源管理与配置方法和系统, 2019, 第 5 作者, 专利号: CN109753596A

( 25 ) 一种基于附加分支处理服务的采集方法和系统, 2019, 第 9 作者, 专利号: CN109388768A

( 26 ) 一种基于域名推荐的网站发现方法和系统, 2019, 第 9 作者, 专利号: CN109241483A

( 27 ) 基于语法树和文本块密度的网页信息抽取方法及系统, 2018, 第 5 作者, 专利号: CN108897749A

( 28 ) 分布式RSS数据采集方法和系统, 2018, 第 5 作者, 专利号: CN108769115A

( 29 ) 一种基于时间串的论坛页面信息自动抽取方法及系统, 2015, 第 5 作者, 专利号: CN104268148A

出版信息

   
发表论文
(1) 一种事件粒度的抽取式话题简短表示生成方法, An extractive topic brief representation generation method to event, 山东大学学报:理学版, 2021, 第 3 作者
(2) 基于视觉的网页重要变化检测方法, Vision Based Important Change Detection Method for Web Pages, 模式识别与人工智能, 2020, 第 2 作者
(3) 支持动态更新的微博话题用户影响力度量方法, Method Supporting Dynamic Updates for Identifying Topical User Influence in Weibo, 山西大学学报:自然科学版, 2020, 第 4 作者
(4) 基于多维度特征的主题标签流行度预测, Topic tag popularity prediction based on multi-dimensional features, 山东大学学报:理学版, 2020, 第 6 作者
(5) 一种基于时间序列预测的重采策略, A Re-crawling Strategy Based on Time Series Prediction, 中文信息学报, 2019, 第 3 作者
(6) 基于视觉特征的网页信息抽取方法研究, Research on Web Page Information Extraction Based on Visual Features, 中文信息学报, 2019, 第 4 作者
(7) 多源文本下结合实体的事件发现方法ESP, ESP:a Event Detection Algorithm for Multi-source Text, 山西大学学报:自然科学版, 2019, 第 4 作者
(8) 基于词聚类的跨媒体突发事件检测方法, A New Method to Detect Busty Events with Different Media Data Based on Word Clustering, 广西师范大学学报:自然科学版, 2019, 第 5 作者
(9) 多文档短摘要生成技术研究, Research on Short Summary Generation of Multi-Document, 广西师范大学学报:自然科学版, 2019, 第 3 作者
(10) 融合词性和注意力的卷积神经网络对象级情感分类方法, CNN with Part-of-Speech and Attention Mechanism for Targeted Sentiment Classification, 模式识别与人工智能, 2018, 第 2 作者
(11) Exploiting Contextual Information via Dynamic Memory Network for Event Detection, EMNLP 2018, 2018, 第 3 作者
(12) 任意网页的主题信息抽取研究, A General Theme Information Extraction for Webpages, 中文信息学报, 2017, 第 4 作者
(13) 针对开源论坛网页的信息抽取研究, Information Extraction Research Aimed at Open SourceWeb Pages, 计算机科学与探索, 2017, 第 3 作者
(14) FPC:大规模网页的快速增量聚类, FPC:Fast Incremental Clustering for Large Scale Web Pages, 中文信息学报, 2016, 第 6 作者
(15) 查询会话中带时间因子的隐式负反馈研究, Exploration of Implicit Negative Feedback with Time Factorin Search Session, 中文信息学报, 2016, 第 2 作者
(16) 基于事件的新闻客户端热门评论预测框架, A news App popular comment prediction framework based on event detection, 山东大学学报. 理学版, 2016, 第 6 作者
(17) 基于查询性能预测的鲁棒检索排序研究, Robust Ranking via Query Performance Prediction, 中文信息学报, 2016, 第 2 作者
(18) 一种短正文网页的正文自动化抽取方法, A Content Extraction Method for Short Web Pages, 中文信息学报, 2016, 第 6 作者
(19) 一种基于网页块特征的多级网页聚类方法, A multi-level page clustering method based on page segmentation, 山东大学学报. 理学版, 2015, 第 6 作者
(20) 基于Web的查询翻译中OOV译文挖掘优化, Web-based OOV Translation Mining Optimization for Query Translation, 山西大学学报. 自然科学版, 2015, 第 2 作者
(21) 中文微博客的垃圾用户检测, Research on Detecting Spammer in Micro-blogs, 中文信息学报, 2014, 第 2 作者
(22) 信息检索中的带权邻近度度量研究, Exploration of Weighted Proximity Measure in Information Retrieval, 计算机研究与发展, 2014, 第 2 作者
(23) 基于逐点互信息的查询结构分析, Query Structure Analysis Based on PMI, 中文信息学报, 2012, 第 3 作者
(24) 如何应对2K放映到4K放映的转变(续), 现代电影技术, 2011, 第 3 作者
(25) 如何应对2K放映到4K放映的转变, 现代电影技术, 2011, 第 3 作者
(26) 大规模短文本的不完全聚类, Incomplete Clustering for Large Scale Short Texts, 中文信息学报, 2011, 第 2 作者
(27) 基于假设流量的Deltoid算法阈值设定, Threshold Setting for Deltoid Algorithm Based on Hypothetic Traffic, 计算机工程, 2008, 第 1 作者
(28) Density analysis of Winnowing on non-uniform distributions, ADVANCES IN DATA AND WEB MANAGEMENT, PROCEEDINGS, 2007, 通讯作者
(29) TCP/IP协议处理中的缓冲区优化及实现, Buffer Optimization in Processing of Protocols Above TCP/IP, 计算机工程, 2006, 第 1 作者