博士生导师,中国计算机学IEEE高级会员,担任中国计算机学会大数据专家委员会秘书长、中国中文信息学会信息检索专委会主任、中国工业与应用数学学会大数据与人工智能专委会副主任,以及若干国际重要学术会议的共同主席(ACM WSDM2015、ACM CIKM2019、ACM SIGIR2020等)。国家杰出青年科学基金、国务院特殊津获得者,中组部万人计划科技领军人才。
主要研究方向为网络数据科学、大数据分析技术、信息检索与挖掘、分布式大数据系统以及信息安全等。近年来,先后主持并完成了二十余项国家重大基础科研项目,包括国家自然科学基金、国家重点基础研究发展计划(“973”计划)、国家重大专项以及中国科学院知识创新工程等科研任务。担任“网络大数据计算的基础理论及应用研究”、“在线社会网络分析与挖掘”、“新一代大数据智能分析软件栈”、“大规模网络空间信息内容安全检测与预警”等重大课题负责人。
作为数据科学方向带头人,在网络数据科学基础理论、大数据分析算法及引擎系统、互联网智能服务等方向取得了系列有持续影响力的特色成果。在本领域重要国际学术期刊和会议上发表论文300余篇,Google Scholar引用超过16000次,获得授权专利60余件。研制完成的大规模分布式机器学习系统(EasyML)、文本与自然语言处理工具集(MatchZoo)、语言处理工具集(MatchZoo)、图数据计算引擎(SQLGraph)等在国际开源社区影响广泛,在查询理解、信息检索和排序学习方面的研究成果5次获得本领域重要学术会议(ACM SIGIR、ACM CIKM、PKDD等)优秀论文奖。自然语言处理、社会计算、知识图谱、信息检索和排序学习等关键技术在国际权威评测中多次排名第一。
研究成果形成的大数据分析关键技术在国家级网络空间的互联网数据深度分析与服务领域得到了规模化应用,应用到了30多个重要业务部门。系统性成果孵化形成企业,在大数据分析及其垂直领域应用方面服务国家政府部门和互联网企业,形成了良好的经济社会效益。形成的海量Web数据深度分析与服务的部分关键技术应用到了一批IT企业的生产系统中,推动了大数据分析技术的进步。成果获得国家科技进步二等奖3次、省部级奖励6次。
|