软件学院学术报告 北京大学李晓明教授学术报告
主 题:从“5W”看网上信息挖掘的内容与挑战 主
讲:北京大学李晓明教授 主 办:软件学院 时
间:2008年4月11日(星期五)上午9:00-10:30 地 点:先骕楼3401 报告摘要: 所谓“5W”指的是Who,
When, Where, What, Why,即人物、时间、地点、事件、原因。它们被认为是人们关心网上信息的基本着眼点。因此,当我们讨论网上信息挖掘的时候,从这些着眼点入手,有可能得到较好的效果。本报告将首先进一步分析5W的内涵及其相互关系,指出针对它们进行网上信息挖掘所面临的种种问题。然后通过北京大学网络实验室近年来几个具体的研究工作例子,说明开展相关工作的若干基本方法和技术。通过这个报告,我们希望得到的一个结论是:网上信息挖掘是一个十分宽泛的研究领域,不同兴趣的人都有可能在其中做工作,同时由于互联网基础设施和各种网络应用已经发展到了一个很高的程度,许多资源和数据唾手可得,研究者都可能以小搏大,以较低的成本开展较大规模的工作。 李晓明教授简介: 李晓明,北京大学教授,网络与信息系统研究所所长。兼任中国计算机学会副理事长,中国电子学会常务理事,教育部高等学校计算机专业教学指导分委员会主任委员,IEEE高级会员。所感兴趣的科学技术领域包括计算机并行与分布处理,海量网络信息及其与社会发展的互动关系。主持发展了全国高校最大的互联网信息搜索引擎,“天网搜索”(http://e.pku.edu.cn),出版了《搜索引擎--原理、技术与系统》(科学出版社2005);提出了收集存储并系统研究网页历史信息的理念,主持建设了“中国网络信息博物馆”(http://www.infomall.cn),发起并主持实现了分布式视频点播应用系统“大学课程在线”(http://realcourse.grids.cn),推动实现并部署了大规模P2P文件共享系统Maze(http://maze.pku.edu.cn)。多次承当国家重点科研项目,曾获得多种奖项。目前是《Concurrency:
Practice & Experience》和《Journal of Web Engineering》的国际编委。
|