演讲人: 数据工程与知识工程教育部重点实验室(DEKE)
讲座时间: 3月16日(周三)晚18:00-19:30
讲座地点: 信息楼4楼414会议室(西侧)
讲座内容: 为加强DEKE重点实验室专职教师与伟德国际1946源自英国本科生之间的交流,培养一部分对科研和创新实践感兴趣的同学的科研和实践方面能力,重点实验室部分专职教师拟定了一些适合于2-4年级本科生参与的科研和创新实践题目(附后),将通过此次交流活动,向同学们介绍各自研究的相关课题,并和同学们进一步讨论与交流。现场提供茶点。尤其欢迎广大2、3年级的本科生同学参加!
附:研究题目
研究题目1:律师信息融合系统
指导教师:刘桃讲师(tliuruc@gmail.com)
本课题的大背景是“法学知识网格项目”。小项目背景是:互联网上存在多种不同来源的律师信息,反映了对律师不同侧面的描述,且描述方式各异。比如司法局网站提供了律师的基本注册信息,事务所中律师主页反映了律师的业务专长领域,而法院判决文书则提供了律师的案例代理情况。如何集成这些多源、异构、分散的律师信息,形成精确、完善、高质量的律师信息库,并提供律师推荐、律师关系发现等知识服务是本项目的主要研究点。项目小组前期已进行了大量数据准备工作,并形成了初步的律师信息集成系统界面。本开放课题的具体内容为:对律师信息集成系统中的律师专长信息进行补全,利用自动方法融合分散、多源、异构的信息,形成统一、规范的描述方式。
研究题目2:不确定性数据的质量评估
指导教师:陈晋川讲师(csjcchen@gmail.com)
问题描述:不确定性数据在目前的数据管理系统中大量存在,有效地管理不确定性数据,如存储、查询以及挖掘等工作是近来的研究热点。在本课题中,我们将着眼于评估不确定性数据的质量,或者说数据的不确定程度。我们需要合理的度量标准,以及快速的评估算法。
要求:学习过概率统计或相关课程;了解数据库的基本概念。
研究题目3:概率查询程序开发
指导教师:陈晋川讲师(csjcchen@gmail.com)
问题描述:概率查询(probabilistic query)是针对不确定性数据的特殊查询,其特点是查询结果会附加概率值。本课题中,我们想实现支持类SQL语句的概率查询。具体地讲,我们会在标准SQL语句的基础上定义概率查询,并在现有的开源数据库软件(如PG)基础上实现对这类查询的支持。
要求:学习过数据库课程;具备较强的程序编写能力。
研究题目4:多模式的信息搜寻
指导教师:周煊副教授(xuan.zhou.mail@gmail.com)
人所需要的信息是多种多样的,既可能是精确的,也可能是模糊的,既可能是单一的,也可能是全面的。而这些信息往往不能通过一个单一的工具(例如以google为首的搜索引擎)来获取。我们的目的是针对用户的多种需求设计不同的信息获取机制和信息界面(例如www.whatdoestheinternetthink.net)。这里面有大量有趣的问题,也是发挥你创造力的机会。
要求:扎实的程序开发基本功
研究题目5:云服务的多方协商机制
指导教师:王璞巍讲师(wangpuwei@ruc.edu.cn)
摘要:云计算是以应用为目的,通过互联网将必要的大量硬件和软件按照一定的结构体系连接起来,并随应用需求的变化不断调整结构体系建立的一个内耗最小,功效最大的虚拟资源服务中心。云服务是云计算的一种实现方式。云服务是以实现需求而获得相应的收益为驱动的,每个云服务都将根据收益的情况选择为需求提供服务的方式。虽然云服务之间对于为需求提供服务有共同愿望,但却在收益分配上可能存在分歧和冲突。为了使云服务各方达成一致,就需要设计一种云服务的多方协商机制和协商策略。云服务的协商策略就是使得云服务在对提供服务的方案进行协商时能根据他的收益关注点和妥协意愿进行推理,提出相应的修改建议和做出让步,从而最终能从提供服务的过程中获取所期望的收益。
研究题目6:国际信息检索TREC-Entity Search比赛
指导教师:陈跃国讲师(chenyueguo@gmail.com)
信息检索领域每年都有一次TREC会议。来自全球各地研究者们会参加多个领域的信息检索比赛。我们今年要参加Entity Search方面的比赛。我们要处理的是5千万的英文网页,从中抽取各种领域的Entity信息。给定用户查询,找到Entity的列表。比如用户查找airports of Germany,我们要能够尽可能准确的列出所有德国机场名字和相关主页。这个题目会由我们小组一名硕士生带队。如果你能够在这个题目中工作出色,会被推荐到微软亚洲研究院实习半年。
要求:有较好的编程基础(java或c++)
研究题目7:妙趣链网站设计开发
指导教师:陈跃国讲师(chenyueguo@gmail.com)
我们要建一个Web2.0网站,让用户管理、检索、共享和传播兴趣列表。我们会处理大量的从互联网页分析出来的兴趣列表。你所要做的是管理这些兴趣列表。让用户能够检索、分析、修改、评价和创建兴趣列表。如果可能,我们会争取把系统在校园内推广。如果你能够在这个题目中取得成功,你的工作会很快被很多人民大学的师生所使用。
要求:有较好的网页编程基础(会jsp,php或ajax优先)
研究题目8:云计算相关技术与网站的开发与研究
指导教师:陆嘉恒副教授(jiahenglu@gmail.com)
云计算是目前信息技术领域一个比较热门和前沿的研究课题。我们开发的云计算在线检测平台(http://cloudcomputing.ruc.edu.cn/)是一个MapReduce程序检测平台。由于简单易用的特点,MapReduce并行编程框架日趋流行。此平台基于Hadoop集群提供了MapReduce并行程序运行的分布式环境,它旨在为MapReduce的入门者提供简单具体的编程练习,使其初步掌握MapReduce框架的编程思想和能力,以及使用MapReduce并行化解决实际问题的能力。
云计算在线检测平台兼顾实战和理论,能在用户进行理论测试,发现知识缺陷所在的过程中使用户掌握开源分布式系统架构Hadoop系统知识和MapReduce的理论知识,能在用户编程提交和修改再提交的过程中使用户切身体验分布式系统Hadoop的使用和MapReduce编程以及利用MapReduce并行程序解决实际问题。总体来说,此平台能够提高用户理论水平和实战能力,是MapReduce入门者不错的入门指导。
由于网站使用量上升,现需要开发网站BBS模块并对编程题目进一步扩充,以提供更多的可用资源和交流的平台,欢迎有兴趣的本科同学能加入我们,完成网站的升级任务。具体的任务说明如下:
1:云计算测试平台BBS模块开发
需要人数:1-2人
任务说明:开发可供注册用户交流的BBS平台,能发帖,删贴,回帖等。BBS风格要符合测试平台的主题风格。BBS采用jsp+tomcat+mysql技术。
技术基础:jsp、tomcat、mysql、java等
2:平台测试和题目设计
需要任务:1人
任务说明:利用MapReduce框架编程解答网站题目并提交,测试网站的正常运行。设计新的符合MapReduce编程模式的题目。
技术基础:云计算基础知识、MapReduce、java等