Анализ данных и машинное обучение: различия между версиями

Материал из Кружковое движение
Перейти к навигации Перейти к поиску
Строка 473: Строка 473:
   
 
==Machine learning==
 
==Machine learning==
  +
  +
<!-- ****************************** -->
  +
<!-- Table Format - do not touch -->
  +
{| class="a" style="width:100%;" border="1" style="width:100%; border-collapse:collapse"|+
  +
<!-- Table name -->
  +
'''Machine learning'''
  +
<!-- Table headers - do not touch -->
  +
! style="background: #EAECF0;"| Название курса||style="background: #EAECF0;"|Источник / Организация||style="background: #EAECF0;"|Источник||style="background: #EAECF0;"|Длина курса
  +
<!-- ****************************** -->
  +
<!-- Course 1 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://stepik.org/course/4852/promo Введение в Datascience и машинное обучение]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
'''Введение'''
  +
* Биг дэйта, дип машин лернинг, основные понятия
  +
* Модель, нет, не супермодель, начнем с дерева
  +
* Фильтрация данных
  +
* Группировка и агрегация, ничего, скоро привыкнем
  +
* Визуализация, seaborn, почти также круто, как ggplot2
  +
'''решающие деревья'''
  +
* Какого музыканта Beatles я загадал или entropy reduction
  +
* Titanic: Machine Learning from Disaster
  +
* Обучение, переобучение, недообучение и кросвалидация
  +
* Последний джедай или метрики качества модели
  +
* Подбор параметров и ROC and Roll
  +
* Практика, Scikit-learn, fit, predict, you are awesome
  +
'''Random forest, нейронные сети'''
  +
* Снова возвращаемся к деревьям
  +
* Random forest
  +
* Зачем знать что-то еще, если есть Random Forest?
  +
* Секретный гость
  +
* И на Марсе будут яблони цвести
  +
* Бонусный урок - нейроэволюция
  +
* Бонусный урок - трюки в Pandas
  +
'''Stepik ML contest'''
  +
* Stepik ML contest
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Stepik]] / [[Институт Биоинформатики]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
9 часов видео, 100 заданий
  +
<!-- ****************************** -->
  +
<!-- Course 2 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/vvedeniye-v-nauku-o-dannykh Введение в науку о данных]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Введение
  +
* Математический инструментарий науки о данных
  +
* Программный инструментарий науки о данных
  +
* Машинное обучение: обучение с учителем
  +
* Машинное обучение: обучение без учителя
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Coursera]] / [[СПБГУ]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
17 часов на выполнение
  +
<!-- ****************************** -->
  +
<!-- Course 3 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/vvedenie-mashinnoe-obuchenie Введение в машинное обучение]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Знакомство с анализом данных и машинным обучением
  +
* Логические методы классификации
  +
* Метрические методы классификации
  +
* Линейные методы классификации
  +
* Метод опорных векторов и логистическая регрессия
  +
* Метрики качества классификации
  +
* Линейная регрессия
  +
* Понижение размерности и метод главных компонент
  +
* Композиции алгоритмов
  +
* Нейронные сети
  +
* Кластеризация и визуализация
  +
* Частичное обучение
  +
* Машинное обучение в прикладных задачах
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Coursera]] / [[Яндекс]] и [[ВШЭ]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
35 часов на выполнение
  +
<!-- ****************************** -->
  +
<!-- Course 4 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/mathematics-and-python Машинное обучение и анализ данных: часть 1. Математика и Python для анализа данных]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Введение
  +
* Библиотеки Python и линейная алгебра
  +
* Оптимизация и матричные разложения
  +
* Случайность
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Coursera]] / [[МФТИ]] и [[Яндекс]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
29 часов на выполнение
  +
<!-- ****************************** -->
  +
<!-- Course 5 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/supervised-learning Машинное обучение и анализ данных: часть 2. Обучение на размеченных данных]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Машинное обучение и линейные модели
  +
* Борьба с переобучением и оценивание качества
  +
* Линейные модели: классификация и практические аспекты
  +
* Решающие деревья и композиции алгоритмов
  +
* Нейронные сети и обзор методов
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Coursera]] / [[МФТИ]] и [[Яндекс]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
43 часа на выполнение
  +
<!-- ****************************** -->
  +
<!-- Course 6 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/unsupervised-learning Машинное обучение и анализ данных: часть 3. Поиск структуры в данных]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Кластеризация
  +
* Понижение размерности и матричные разложения
  +
* Визуализация и поиск аномалий
  +
* Тематическое моделирование
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Coursera]] / [[МФТИ]] и [[Яндекс]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
25 часов на выполнение
  +
<!-- ****************************** -->
  +
<!-- Course 7 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/stats-for-data-analysis Машинное обучение и анализ данных: часть 4. Построение выводов по данным]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Интервалы и гипотезы
  +
* АБ-тестирование
  +
* Закономерности и зависимости
  +
* Неделя задач
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Coursera]] / [[МФТИ]] и [[Яндекс]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
39 часов на выполнение
  +
<!-- ****************************** -->
  +
<!-- Course 8 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/data-analysis-applications Машинное обучение и анализ данных: часть 5. Прикладные задачи анализа данных]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Бизнес-задачи
  +
* Анализ медиа
  +
* Анализ текстов
  +
* Рекомендации и ранжирование
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Coursera]] / [[МФТИ]] и [[Яндекс]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
26 часов на выполнение
  +
<!-- ****************************** -->
  +
<!-- Course 9 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/data-analysis-project Машинное обучение и анализ данных: часть 6. Анализ данных: финальный проект]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
*
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Coursera]] / [[МФТИ]] и [[Яндекс]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
26 часов на выполнение
  +
<!-- ****************************** -->
  +
<!-- Course 10 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://stepik.org/course/401/promo Нейронные сети]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
'''Основы линейной алгебры'''
  +
* Опциональный ликбез по линейной алгебре: векторы, матрицы
  +
* NumPy: основы
  +
* Линейная алгебра в деле
  +
'''Перцептрон и градиентный спуск'''
  +
* Нейроны: настоящие и искусственные
  +
* Перцептрон, больше искусственных нейронов!
  +
* Градиентный спуск
  +
* Однослойные модели
  +
'''Алгоритм обратного распространения ошибки'''
  +
* Многослойный перцептрон
  +
* Алгоритм обратного распространения ошибки
  +
* Целевые функции
  +
'''Мониторинг состояния сети'''
  +
* Мониторинг состояния сети
  +
* Визуализация
  +
'''Проект по нейронной сети для управления автомобилем'''
  +
* Проект
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Stepik]] / [[Институт Биоинформатики]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
6 часов, 100 тестов
  +
<!-- ****************************** -->
  +
<!-- Course 11 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://stepik.org/course/8057/promo Машинное обучение]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Введение в машинное обучение и основные понятия статистики
  +
* Восстановление пропущенных значений
  +
* Поиск выбросов и аномалий
  +
* Кластеризация
  +
* Задача предсказания, линейная регрессия
  +
* Классификация, kNN, кросс-валидация
  +
* Деревья в машинном обучении
  +
* Линейные классификаторы
  +
* Вероятностные алгоритмы. Наивный Байес
  +
* Ансамбли алгоритмов
  +
* Отбор признаков (feature selection) и объектов
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Stepik]] / [[ОмГТУ]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
7 часов видео, 50 тестов
  +
<!-- ****************************** -->
  +
<!-- Table ending - do not touch -->
  +
|}
  +
<!-- ****************************** -->
   
 
==Применения ML==
 
==Применения ML==

Версия 23:38, 23 марта 2020

Статистика

Статистика
Название курса Источник / Организация Источник Длина курса

Stepik / CSC

Старшая школа и студенты

11 часов видео, 200 тестов

Coursera / НГУ

Старшая школа и студенты

9 часов на выполнение

Coursera / НГУ

Старшая школа и студенты

8 часов на выполнение

Coursera / НГУ

Старшая школа и студенты

7 часов на выполнение

Coursera / НГУ

Старшая школа и студенты

5 часов на выполнение

Stepik / Институт Биоинформатики

Старшая школа и студенты

4 часа видео, 100 тестов

Stepik / Институт Биоинформатики

Старшая школа и студенты

6 часов видео, 100 тестов

Stepik / Институт Биоинформатики

Старшая школа и студенты

4 часа видео, 50 тестов

Coursera / СПБГУ

Старшая школа и студенты

36 часов на выполнение

Coursera / СПБГУ

Старшая школа и студенты

34 часов на выполнение

Coursera / СПБГУ

Старшая школа и студенты

22 часов на выполнение

Coursera / СПБГУ

Старшая школа и студенты

17 часов на выполнение

Coursera / СПБГУ

Старшая школа и студенты

17 часов на выполнение

BigData

Big Data
Название курса Источник / Организация Источник Длина курса

Stepik / Институт Биоинформатики

Старшая школа и студенты

2 часа видео, 50 тестов

Stepik / mail.ru

Старшая школа и студенты

12 часов видео, 250 тестов

Machine learning

Machine learning
Название курса Источник / Организация Источник Длина курса

Stepik / Институт Биоинформатики

Старшая школа и студенты

9 часов видео, 100 заданий

Coursera / СПБГУ

Старшая школа и студенты

17 часов на выполнение

Coursera / Яндекс и ВШЭ

Старшая школа и студенты

35 часов на выполнение

Coursera / МФТИ и Яндекс

Старшая школа и студенты

29 часов на выполнение

Coursera / МФТИ и Яндекс

Старшая школа и студенты

43 часа на выполнение

Coursera / МФТИ и Яндекс

Старшая школа и студенты

25 часов на выполнение

Coursera / МФТИ и Яндекс

Старшая школа и студенты

39 часов на выполнение

Coursera / МФТИ и Яндекс

Старшая школа и студенты

26 часов на выполнение

Coursera / МФТИ и Яндекс

Старшая школа и студенты

26 часов на выполнение

Stepik / Институт Биоинформатики

Старшая школа и студенты

6 часов, 100 тестов

Stepik / ОмГТУ

Старшая школа и студенты

7 часов видео, 50 тестов

Применения ML