大数据算法

大数据在不论在研究还是工程领域都是热点之一,算法是大数据管理与计算的核心主题。本课程试图简要介绍大数据计算中涉及到的基本算法设计方法。适用于大数据研究与开发人员,也适用于数据科学爱好者。

2945 次查看
哈尔滨工业大学
中国大学MOOC
  • 完成时间大约为 13
  • 高级
  • 中文
注:因开课平台的各种因素变化,以上开课日期仅供参考

课程概况

大数据算法这门课程旨在通过讲授一些大数据上基本算法设计思想,包括概率算法、I/O有效算法和并行算法,让听课的同学们接触到和传统算法课程不一样的算法设计与分析思路,并且以最新的研究成果为导向,让参与这门课程学习的同学了解大数据算法的前沿知识。通过这门课程的学习,同学可以掌握大数据算法设计的基本思想,并通过本门课程的作业,掌握大数据算法设计与分析的技术。

课程大纲

第一讲 大数据算法概述
大数据算法概述
第一讲作业

第二讲 亚线性算法
亚线性算法概述
亚线性算法概述单元测验

第三讲 亚线性算法例析
亚线性算法例析
第三讲作业

第四讲 外存算法概述
外存算法概述
第四讲作业

第五讲 外存查找结构
外存查找结构
第五讲作业

第六讲外存图数据算法
外存图数据算法
第六讲作业

第七讲 基于MapReduce的并行算法设计
基于MapReduce的并行算法设计
第七讲作业

第八讲 MapReduce算法例析
MapReduce算法例析

第九讲 超越MapReduce的并行大数据处理
超越MapReduce的并行大数据处理
第九讲作业

第十讲 众包算法
众包算法
第十讲作业

预备知识

“算法设计与分析” 和 “概率与统计”

证书或学分

设置“合格”(达到60%成绩)、"优秀"(达到80%成绩)两档课程标准,由任课教师签发课程结业证书,其中成绩“优秀”者将颁发优秀证书。

参考资料

《算法导论(第三版)》(作者:Thomas H.Cormen / Charles E.Leiserson / Ronald L.Rivest / Clifford Stein;译者:殷建平 / 徐云 / 王刚 / 刘晓光 / 苏明 / 邹恒明 / 王宏志 )一书如下的章节:第1-3章,第5章,第9章,第11章,第12章,第18章,第22-25章和第34-35章。
《概率与计算》(作者:Michael Mitzenmacher;译者:史道齐)一书的如下章节:第1-5章

千万首歌曲。全无广告干扰。
此外,您还能在所有设备上欣赏您的整个音乐资料库。免费畅听 3 个月,之后每月只需 ¥10.00。
Apple 广告
声明:MOOC中国十分重视知识产权问题,我们发布之课程均源自下列机构,版权均归其所有,本站仅作报道收录并尊重其著作权益。感谢他们对MOOC事业做出的贡献!
  • Coursera
  • edX
  • OpenLearning
  • FutureLearn
  • iversity
  • Udacity
  • NovoEd
  • Canvas
  • Open2Study
  • Google
  • ewant
  • FUN
  • IOC-Athlete-MOOC
  • World-Science-U
  • Codecademy
  • CourseSites
  • opencourseworld
  • ShareCourse
  • gacco
  • MiriadaX
  • JANUX
  • openhpi
  • Stanford-Open-Edx
  • 网易云课堂
  • 中国大学MOOC
  • 学堂在线
  • 顶你学堂
  • 华文慕课
  • 好大学在线CnMooc
  • (部分课程由Coursera、Udemy、Linkshare共同提供)

© 2008-2022 CMOOC.COM 慕课改变你,你改变世界