数据分析应用

Прикладные задачи анализа данных

638 次查看
莫斯科物理科学与技术学院
Coursera
  • 完成时间大约为 26 个小时
  • 中级
  • 俄语
注:本课程由Coursera和Linkshare共同提供,因开课平台的各种因素变化,以上开课日期仅供参考

课程概况

Методы машинного обучения — будь то алгоритмы классификации или регрессии, методы кластеризации или алгоритмы понижения размерности — применяются к подготовленным данным с вычисленными признаками для решения уже сформулированной задачи. Однако специалисты по анализу данных редко оказываются в такой идеальной ситуации. Обычно перед ними ставят задачи, которые нуждаются в уточнении формулировки, выборе метрики качества и протокола тестирования итоговой модели. Данные, с которыми нужно работать, часто представлены в непригодном виде: они зашумлены, содержат ошибки и выбросы, хранятся в неудобном формате и т. д.

В этом курсе мы разберем прикладные задачи из различных областей анализа данных: анализ текста и информационный поиск, коллаборативная фильтрация и рекомендательные системы, бизнес-аналитика, прогнозирование временных рядов. На их примере вы узнаете, как извлекать признаки из разнородных данных, какие при этом возникают проблемы и как их решать. Вы научитесь сводить задачу заказчика к формальной постановке задачи машинного обучения и поймёте, как проверять качество построенной модели на исторических данных и в онлайн-эксперименте. На каждой задаче мы изучим плюсы и минусы пройденных алгоритмов машинного обучения.

Прослушав этот курс, вы познакомитесь с распространенными типами прикладных задач и будете понимать схемы их решения.

Видео курса разработаны на Python 2. Задания и ноутбуки к ним адаптированы к Python 3.

课程大纲

Бизнес-задачи

На этой неделе мы разберём две крупные задачи, часто возникающие в бизнес-аналитике. Первая связана с прогнозированием временных рядов; задачи такого типа часто возникают, когда необходимо оценить значение показателя в будущем, основываясь на истории его изменения в прошлом. Такими показателями могут быть спрос на товар, аудитория рекламного баннера, цена акций и т.д. Вторя задача — это анализ поведения пользователей. Класс задач, связанных с анализом пользовательских данных, неизбежно появляется практически в любой сфере бизнеса, подразумевающей работу с клиентами. Как правило, это такие задачи, как привлечение пользователей, работа с аудиторией, прогнозирование оттока и удержание клиентов.

Анализ медиа

Вторая неделя посвящена вопросам компьютерного зрения. Мы обсудим базовые методы обработки изображений и поговорим про такие задачи, как классификация изображений, распознавание лиц, детекция объектов и семантическая сегментация. Благодаря развитию глубоких нейронных сетей, за последние несколько лет во всех этих задачах достигнут огромный прогресс. Вы узнаете, как на практике пользоваться нейросетевыми библиотеками, и научитесь быстро собирать и размечать большие коллекции изображений.

Анализ текстов

Данная неделя посвящена работе с особым видом данных — текстами. Тексты встречаются во многих задачах, и при этом свести их к стандартной матрице с объектами и признаками не так просто. В этом модуле мы изучим основы работы с текстовыми данными, способы генерации признаков на их основе, поговорим о нейросетевых подходах (в частности, word2vec и рекуррентные сети). Также мы обсудим несколько конкретных прикладных задач анализа текстов, среди которых будут анализ тональности и аннотирование.

Рекомендации и ранжирование

На этой неделе вы познакомитесь с задачами, в которых нужно оценивать "интересность" различных объектов для пользователя - задачей ранжирования, актуальной при построении поиска, и задачей построения рекомендательных систем, возникающей при необходимости посоветовать пользователю некоторый контент (фильмы, музыку, статьи) или товары в интернет-магазине.

千万首歌曲。全无广告干扰。
此外,您还能在所有设备上欣赏您的整个音乐资料库。免费畅听 3 个月,之后每月只需 ¥10.00。
Apple 广告
声明:MOOC中国十分重视知识产权问题,我们发布之课程均源自下列机构,版权均归其所有,本站仅作报道收录并尊重其著作权益。感谢他们对MOOC事业做出的贡献!
  • Coursera
  • edX
  • OpenLearning
  • FutureLearn
  • iversity
  • Udacity
  • NovoEd
  • Canvas
  • Open2Study
  • Google
  • ewant
  • FUN
  • IOC-Athlete-MOOC
  • World-Science-U
  • Codecademy
  • CourseSites
  • opencourseworld
  • ShareCourse
  • gacco
  • MiriadaX
  • JANUX
  • openhpi
  • Stanford-Open-Edx
  • 网易云课堂
  • 中国大学MOOC
  • 学堂在线
  • 顶你学堂
  • 华文慕课
  • 好大学在线CnMooc
  • (部分课程由Coursera、Udemy、Linkshare共同提供)

© 2008-2020 CMOOC.COM 慕课改变你,你改变世界