课程概况
大数据算法这门课程旨在通过讲授一些大数据上基本算法设计思想,包括概率算法、I/O有效算法和并行算法,让听课的同学们接触到和传统算法课程不一样的算法设计与分析思路,并且以最新的研究成果为导向,让参与这门课程学习的同学了解大数据算法的前沿知识。通过这门课程的学习,同学可以掌握大数据算法设计的基本思想,并通过本门课程的作业,掌握大数据算法设计与分析的技术。
课程大纲
第一讲 大数据算法概述
大数据算法概述
第一讲作业
第二讲 亚线性算法
亚线性算法概述
亚线性算法概述单元测验
第三讲 亚线性算法例析
亚线性算法例析
第三讲作业
第四讲 外存算法概述
外存算法概述
第四讲作业
第五讲 外存查找结构
外存查找结构
第五讲作业
第六讲外存图数据算法
外存图数据算法
第六讲作业
第七讲 基于MapReduce的并行算法设计
基于MapReduce的并行算法设计
第七讲作业
第八讲 MapReduce算法例析
MapReduce算法例析
第九讲 超越MapReduce的并行大数据处理
超越MapReduce的并行大数据处理
第九讲作业
第十讲 众包算法
众包算法
第十讲作业
预备知识
“算法设计与分析” 和 “概率与统计”
证书或学分
设置“合格”(达到60%成绩)、"优秀"(达到80%成绩)两档课程标准,由任课教师签发课程结业证书,其中成绩“优秀”者将颁发优秀证书。
参考资料
《算法导论(第三版)》(作者:Thomas H.Cormen / Charles E.Leiserson / Ronald L.Rivest / Clifford Stein;译者:殷建平 / 徐云 / 王刚 / 刘晓光 / 苏明 / 邹恒明 / 王宏志 )一书如下的章节:第1-3章,第5章,第9章,第11章,第12章,第18章,第22-25章和第34-35章。
《概率与计算》(作者:Michael Mitzenmacher;译者:史道齐)一书的如下章节:第1-5章