该课程是关于信息检索和数据挖掘技术的入门级研究。学生将学习如何查找相关信息,并从中提取有意义的模式。课程涵盖了信息检索和数据挖掘的基本理论和数学模型,但重点放在文本文档索引、相关性排名、Web用法挖掘、文本分析以及其绩效评估的实际算法上。
了解信息检索的常见算法和技术,例如文档索引和检索,以及查询处理等。
掌握IR系统和数据挖掘技术的定量评估方法。
熟悉流行的概率检索方法和排名原则。
了解实际检索和数据挖掘系统中存在的技术和算法,例如Web搜索引擎和推荐系统,包括最近流行的深度学习主题。
掌握可用于从数据中进行预测的基本算法。
能够独立工作于大型项目,并有效地规划和协调项目活动。
能够撰写高质量的报告以记录项目结果,并展示良好的研究和评估技能。
能够调查和确定一个或多个具有挑战性的问题的解决方案。
了解并运用信息检索和数据挖掘领域的常见技术和算法。
该课程通常涵盖以下主题:
基本概念介绍,如相关性,关联规则和知识发现。
索引和文本处理技术,如倒置索引和词干提取。
流行的检索模型和排名原则,以及其他常用的技术。
在线和离线评估技术,以及常用的评估指标。
数据挖掘技术和算法,包括频繁模式挖掘和机器学习算法。
新兴领域的研究,如学习排名和深度学习。
为了有资格选择此课程,学生需要满足以下条件:
在计划和年度的学习年份中注册该课程。
具备一定的概率和统计数据的基础知识。
熟练掌握Java或Python编程,至少在过去的一个编程项目中有所证明。
如需了解有关UCL-信息检索和数据挖掘课程辅导以及其他英国课程辅导的详细信息,请随时咨询DR.D留学生辅导机构。