Анализ данных и машинное обучение: различия между версиями
EM (обсуждение | вклад) |
EM (обсуждение | вклад) |
||
Строка 473: | Строка 473: | ||
==Machine learning== |
==Machine learning== |
||
+ | |||
+ | <!-- ****************************** --> |
||
+ | <!-- Table Format - do not touch --> |
||
+ | {| class="a" style="width:100%;" border="1" style="width:100%; border-collapse:collapse"|+ |
||
+ | <!-- Table name --> |
||
+ | '''Machine learning''' |
||
+ | <!-- Table headers - do not touch --> |
||
+ | ! style="background: #EAECF0;"| Название курса||style="background: #EAECF0;"|Источник / Организация||style="background: #EAECF0;"|Источник||style="background: #EAECF0;"|Длина курса |
||
+ | <!-- ****************************** --> |
||
+ | <!-- Course 1 --> |
||
+ | |- |
||
+ | | |
||
+ | <!-- Course format do not touch --> |
||
+ | {| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;" |
||
+ | | style="border:1px solid white;"|<strong>[https://stepik.org/course/4852/promo Введение в Datascience и машинное обучение]</strong> |
||
+ | |- |
||
+ | <!-- Course content format do not touch --> |
||
+ | | style="border:1px solid white;"| |
||
+ | <!-- Course content --> |
||
+ | '''Введение''' |
||
+ | * Биг дэйта, дип машин лернинг, основные понятия |
||
+ | * Модель, нет, не супермодель, начнем с дерева |
||
+ | * Фильтрация данных |
||
+ | * Группировка и агрегация, ничего, скоро привыкнем |
||
+ | * Визуализация, seaborn, почти также круто, как ggplot2 |
||
+ | '''решающие деревья''' |
||
+ | * Какого музыканта Beatles я загадал или entropy reduction |
||
+ | * Titanic: Machine Learning from Disaster |
||
+ | * Обучение, переобучение, недообучение и кросвалидация |
||
+ | * Последний джедай или метрики качества модели |
||
+ | * Подбор параметров и ROC and Roll |
||
+ | * Практика, Scikit-learn, fit, predict, you are awesome |
||
+ | '''Random forest, нейронные сети''' |
||
+ | * Снова возвращаемся к деревьям |
||
+ | * Random forest |
||
+ | * Зачем знать что-то еще, если есть Random Forest? |
||
+ | * Секретный гость |
||
+ | * И на Марсе будут яблони цвести |
||
+ | * Бонусный урок - нейроэволюция |
||
+ | * Бонусный урок - трюки в Pandas |
||
+ | '''Stepik ML contest''' |
||
+ | * Stepik ML contest |
||
+ | |} |
||
+ | <!-- Formating do not touch --> |
||
+ | |style="text-align:center;"| |
||
+ | [[Stepik]] / [[Институт Биоинформатики]] |
||
+ | |style="text-align:center;"| |
||
+ | [[Материалы для старшей школы и студентов| Старшая школа и студенты]] |
||
+ | |style="text-align:center;"| |
||
+ | 9 часов видео, 100 заданий |
||
+ | <!-- ****************************** --> |
||
+ | <!-- Course 2 --> |
||
+ | |- |
||
+ | | |
||
+ | <!-- Course format do not touch --> |
||
+ | {| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;" |
||
+ | | style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/vvedeniye-v-nauku-o-dannykh Введение в науку о данных]</strong> |
||
+ | |- |
||
+ | <!-- Course content format do not touch --> |
||
+ | | style="border:1px solid white;"| |
||
+ | <!-- Course content --> |
||
+ | * Введение |
||
+ | * Математический инструментарий науки о данных |
||
+ | * Программный инструментарий науки о данных |
||
+ | * Машинное обучение: обучение с учителем |
||
+ | * Машинное обучение: обучение без учителя |
||
+ | |} |
||
+ | <!-- Formating do not touch --> |
||
+ | |style="text-align:center;"| |
||
+ | [[Coursera]] / [[СПБГУ]] |
||
+ | |style="text-align:center;"| |
||
+ | [[Материалы для старшей школы и студентов| Старшая школа и студенты]] |
||
+ | |style="text-align:center;"| |
||
+ | 17 часов на выполнение |
||
+ | <!-- ****************************** --> |
||
+ | <!-- Course 3 --> |
||
+ | |- |
||
+ | | |
||
+ | <!-- Course format do not touch --> |
||
+ | {| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;" |
||
+ | | style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/vvedenie-mashinnoe-obuchenie Введение в машинное обучение]</strong> |
||
+ | |- |
||
+ | <!-- Course content format do not touch --> |
||
+ | | style="border:1px solid white;"| |
||
+ | <!-- Course content --> |
||
+ | * Знакомство с анализом данных и машинным обучением |
||
+ | * Логические методы классификации |
||
+ | * Метрические методы классификации |
||
+ | * Линейные методы классификации |
||
+ | * Метод опорных векторов и логистическая регрессия |
||
+ | * Метрики качества классификации |
||
+ | * Линейная регрессия |
||
+ | * Понижение размерности и метод главных компонент |
||
+ | * Композиции алгоритмов |
||
+ | * Нейронные сети |
||
+ | * Кластеризация и визуализация |
||
+ | * Частичное обучение |
||
+ | * Машинное обучение в прикладных задачах |
||
+ | |} |
||
+ | <!-- Formating do not touch --> |
||
+ | |style="text-align:center;"| |
||
+ | [[Coursera]] / [[Яндекс]] и [[ВШЭ]] |
||
+ | |style="text-align:center;"| |
||
+ | [[Материалы для старшей школы и студентов| Старшая школа и студенты]] |
||
+ | |style="text-align:center;"| |
||
+ | 35 часов на выполнение |
||
+ | <!-- ****************************** --> |
||
+ | <!-- Course 4 --> |
||
+ | |- |
||
+ | | |
||
+ | <!-- Course format do not touch --> |
||
+ | {| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;" |
||
+ | | style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/mathematics-and-python Машинное обучение и анализ данных: часть 1. Математика и Python для анализа данных]</strong> |
||
+ | |- |
||
+ | <!-- Course content format do not touch --> |
||
+ | | style="border:1px solid white;"| |
||
+ | <!-- Course content --> |
||
+ | * Введение |
||
+ | * Библиотеки Python и линейная алгебра |
||
+ | * Оптимизация и матричные разложения |
||
+ | * Случайность |
||
+ | |} |
||
+ | <!-- Formating do not touch --> |
||
+ | |style="text-align:center;"| |
||
+ | [[Coursera]] / [[МФТИ]] и [[Яндекс]] |
||
+ | |style="text-align:center;"| |
||
+ | [[Материалы для старшей школы и студентов| Старшая школа и студенты]] |
||
+ | |style="text-align:center;"| |
||
+ | 29 часов на выполнение |
||
+ | <!-- ****************************** --> |
||
+ | <!-- Course 5 --> |
||
+ | |- |
||
+ | | |
||
+ | <!-- Course format do not touch --> |
||
+ | {| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;" |
||
+ | | style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/supervised-learning Машинное обучение и анализ данных: часть 2. Обучение на размеченных данных]</strong> |
||
+ | |- |
||
+ | <!-- Course content format do not touch --> |
||
+ | | style="border:1px solid white;"| |
||
+ | <!-- Course content --> |
||
+ | * Машинное обучение и линейные модели |
||
+ | * Борьба с переобучением и оценивание качества |
||
+ | * Линейные модели: классификация и практические аспекты |
||
+ | * Решающие деревья и композиции алгоритмов |
||
+ | * Нейронные сети и обзор методов |
||
+ | |} |
||
+ | <!-- Formating do not touch --> |
||
+ | |style="text-align:center;"| |
||
+ | [[Coursera]] / [[МФТИ]] и [[Яндекс]] |
||
+ | |style="text-align:center;"| |
||
+ | [[Материалы для старшей школы и студентов| Старшая школа и студенты]] |
||
+ | |style="text-align:center;"| |
||
+ | 43 часа на выполнение |
||
+ | <!-- ****************************** --> |
||
+ | <!-- Course 6 --> |
||
+ | |- |
||
+ | | |
||
+ | <!-- Course format do not touch --> |
||
+ | {| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;" |
||
+ | | style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/unsupervised-learning Машинное обучение и анализ данных: часть 3. Поиск структуры в данных]</strong> |
||
+ | |- |
||
+ | <!-- Course content format do not touch --> |
||
+ | | style="border:1px solid white;"| |
||
+ | <!-- Course content --> |
||
+ | * Кластеризация |
||
+ | * Понижение размерности и матричные разложения |
||
+ | * Визуализация и поиск аномалий |
||
+ | * Тематическое моделирование |
||
+ | |} |
||
+ | <!-- Formating do not touch --> |
||
+ | |style="text-align:center;"| |
||
+ | [[Coursera]] / [[МФТИ]] и [[Яндекс]] |
||
+ | |style="text-align:center;"| |
||
+ | [[Материалы для старшей школы и студентов| Старшая школа и студенты]] |
||
+ | |style="text-align:center;"| |
||
+ | 25 часов на выполнение |
||
+ | <!-- ****************************** --> |
||
+ | <!-- Course 7 --> |
||
+ | |- |
||
+ | | |
||
+ | <!-- Course format do not touch --> |
||
+ | {| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;" |
||
+ | | style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/stats-for-data-analysis Машинное обучение и анализ данных: часть 4. Построение выводов по данным]</strong> |
||
+ | |- |
||
+ | <!-- Course content format do not touch --> |
||
+ | | style="border:1px solid white;"| |
||
+ | <!-- Course content --> |
||
+ | * Интервалы и гипотезы |
||
+ | * АБ-тестирование |
||
+ | * Закономерности и зависимости |
||
+ | * Неделя задач |
||
+ | |} |
||
+ | <!-- Formating do not touch --> |
||
+ | |style="text-align:center;"| |
||
+ | [[Coursera]] / [[МФТИ]] и [[Яндекс]] |
||
+ | |style="text-align:center;"| |
||
+ | [[Материалы для старшей школы и студентов| Старшая школа и студенты]] |
||
+ | |style="text-align:center;"| |
||
+ | 39 часов на выполнение |
||
+ | <!-- ****************************** --> |
||
+ | <!-- Course 8 --> |
||
+ | |- |
||
+ | | |
||
+ | <!-- Course format do not touch --> |
||
+ | {| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;" |
||
+ | | style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/data-analysis-applications Машинное обучение и анализ данных: часть 5. Прикладные задачи анализа данных]</strong> |
||
+ | |- |
||
+ | <!-- Course content format do not touch --> |
||
+ | | style="border:1px solid white;"| |
||
+ | <!-- Course content --> |
||
+ | * Бизнес-задачи |
||
+ | * Анализ медиа |
||
+ | * Анализ текстов |
||
+ | * Рекомендации и ранжирование |
||
+ | |} |
||
+ | <!-- Formating do not touch --> |
||
+ | |style="text-align:center;"| |
||
+ | [[Coursera]] / [[МФТИ]] и [[Яндекс]] |
||
+ | |style="text-align:center;"| |
||
+ | [[Материалы для старшей школы и студентов| Старшая школа и студенты]] |
||
+ | |style="text-align:center;"| |
||
+ | 26 часов на выполнение |
||
+ | <!-- ****************************** --> |
||
+ | <!-- Course 9 --> |
||
+ | |- |
||
+ | | |
||
+ | <!-- Course format do not touch --> |
||
+ | {| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;" |
||
+ | | style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/data-analysis-project Машинное обучение и анализ данных: часть 6. Анализ данных: финальный проект]</strong> |
||
+ | |- |
||
+ | <!-- Course content format do not touch --> |
||
+ | | style="border:1px solid white;"| |
||
+ | <!-- Course content --> |
||
+ | * |
||
+ | |} |
||
+ | <!-- Formating do not touch --> |
||
+ | |style="text-align:center;"| |
||
+ | [[Coursera]] / [[МФТИ]] и [[Яндекс]] |
||
+ | |style="text-align:center;"| |
||
+ | [[Материалы для старшей школы и студентов| Старшая школа и студенты]] |
||
+ | |style="text-align:center;"| |
||
+ | 26 часов на выполнение |
||
+ | <!-- ****************************** --> |
||
+ | <!-- Course 10 --> |
||
+ | |- |
||
+ | | |
||
+ | <!-- Course format do not touch --> |
||
+ | {| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;" |
||
+ | | style="border:1px solid white;"|<strong>[https://stepik.org/course/401/promo Нейронные сети]</strong> |
||
+ | |- |
||
+ | <!-- Course content format do not touch --> |
||
+ | | style="border:1px solid white;"| |
||
+ | <!-- Course content --> |
||
+ | '''Основы линейной алгебры''' |
||
+ | * Опциональный ликбез по линейной алгебре: векторы, матрицы |
||
+ | * NumPy: основы |
||
+ | * Линейная алгебра в деле |
||
+ | '''Перцептрон и градиентный спуск''' |
||
+ | * Нейроны: настоящие и искусственные |
||
+ | * Перцептрон, больше искусственных нейронов! |
||
+ | * Градиентный спуск |
||
+ | * Однослойные модели |
||
+ | '''Алгоритм обратного распространения ошибки''' |
||
+ | * Многослойный перцептрон |
||
+ | * Алгоритм обратного распространения ошибки |
||
+ | * Целевые функции |
||
+ | '''Мониторинг состояния сети''' |
||
+ | * Мониторинг состояния сети |
||
+ | * Визуализация |
||
+ | '''Проект по нейронной сети для управления автомобилем''' |
||
+ | * Проект |
||
+ | |} |
||
+ | <!-- Formating do not touch --> |
||
+ | |style="text-align:center;"| |
||
+ | [[Stepik]] / [[Институт Биоинформатики]] |
||
+ | |style="text-align:center;"| |
||
+ | [[Материалы для старшей школы и студентов| Старшая школа и студенты]] |
||
+ | |style="text-align:center;"| |
||
+ | 6 часов, 100 тестов |
||
+ | <!-- ****************************** --> |
||
+ | <!-- Course 11 --> |
||
+ | |- |
||
+ | | |
||
+ | <!-- Course format do not touch --> |
||
+ | {| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;" |
||
+ | | style="border:1px solid white;"|<strong>[https://stepik.org/course/8057/promo Машинное обучение]</strong> |
||
+ | |- |
||
+ | <!-- Course content format do not touch --> |
||
+ | | style="border:1px solid white;"| |
||
+ | <!-- Course content --> |
||
+ | * Введение в машинное обучение и основные понятия статистики |
||
+ | * Восстановление пропущенных значений |
||
+ | * Поиск выбросов и аномалий |
||
+ | * Кластеризация |
||
+ | * Задача предсказания, линейная регрессия |
||
+ | * Классификация, kNN, кросс-валидация |
||
+ | * Деревья в машинном обучении |
||
+ | * Линейные классификаторы |
||
+ | * Вероятностные алгоритмы. Наивный Байес |
||
+ | * Ансамбли алгоритмов |
||
+ | * Отбор признаков (feature selection) и объектов |
||
+ | |} |
||
+ | <!-- Formating do not touch --> |
||
+ | |style="text-align:center;"| |
||
+ | [[Stepik]] / [[ОмГТУ]] |
||
+ | |style="text-align:center;"| |
||
+ | [[Материалы для старшей школы и студентов| Старшая школа и студенты]] |
||
+ | |style="text-align:center;"| |
||
+ | 7 часов видео, 50 тестов |
||
+ | <!-- ****************************** --> |
||
+ | <!-- Table ending - do not touch --> |
||
+ | |} |
||
+ | <!-- ****************************** --> |
||
==Применения ML== |
==Применения ML== |
Версия 23:38, 23 марта 2020
Содержание
Статистика
СтатистикаНазвание курса | Источник / Организация | Источник | Длина курса | ||
---|---|---|---|---|---|
|
11 часов видео, 200 тестов | ||||
|
9 часов на выполнение | ||||
|
8 часов на выполнение | ||||
|
7 часов на выполнение | ||||
|
5 часов на выполнение | ||||
|
4 часа видео, 100 тестов | ||||
|
6 часов видео, 100 тестов | ||||
|
4 часа видео, 50 тестов | ||||
|
36 часов на выполнение | ||||
|
34 часов на выполнение | ||||
|
22 часов на выполнение | ||||
|
17 часов на выполнение | ||||
|
17 часов на выполнение |
BigData
Big DataНазвание курса | Источник / Организация | Источник | Длина курса | ||
---|---|---|---|---|---|
|
2 часа видео, 50 тестов | ||||
|
12 часов видео, 250 тестов |
Machine learning
Machine learningНазвание курса | Источник / Организация | Источник | Длина курса | ||
---|---|---|---|---|---|
|
9 часов видео, 100 заданий | ||||
|
17 часов на выполнение | ||||
|
35 часов на выполнение | ||||
|
29 часов на выполнение | ||||
|
43 часа на выполнение | ||||
|
25 часов на выполнение | ||||
|
39 часов на выполнение | ||||
|
26 часов на выполнение | ||||
|
26 часов на выполнение | ||||
|
6 часов, 100 тестов | ||||
|
7 часов видео, 50 тестов |