2014年12月10日上午10:10—12:00,赵东岩教授在南校区C308进行了“自然语言处理技术与大数据分析”讲座。
大数据复杂、多样,其有价值的信息需要深度挖掘和语义理解,因此,利用自然语言处理和知识工程方法来分析大数据是十分重要的。根据研究与实践经验,在大数据分析任务中,分析方法、研发框架与数据积累均十分重要。赵东岩教授报告中举例说明大数据分析中典型的自然语言处理方法,利用基于语义的数据挖掘和信息抽取来分析异质大数据(如文本、图像、多媒体)的语义概念、实体知识及其语义关联,并构建大规模多媒体语义知识库,提升大数据分析与理解的性能。
|
赵东岩教授在演讲中 |
附: 赵东岩,北京大学计算机科学技术研究所研究员,博士生导师。主要研究方向为文本挖掘、语义信息处理、数字出版技术。近年来承担国家级项目13项、省部级科研项目8项,主持的项目获得国家科技进步二等奖和北京市科学技术一等奖。目前的研究工作聚焦于互联网异质文本数据的语义理解、中文语义知识库构建以及大规模多媒体语义知识库的语义搜索与智能服务,发表了包括ACL、AAAI、WWW、EMNLP、VLDB以及TKDE、VLDB Journal等国际一流会议与期刊在内学术论文60余篇。个人获第十届中国青年科技奖和北京市第七届“科技之光”技术创新特别奖等荣誉。计算机学会CCF高级会员,CCF中文信息技术专委会秘书长,CCF 大数据专家委员会委员、网络与数据通信专委会委员。