Анализ данных и машинное обучение: различия между версиями

Материал из Кружковое движение
Перейти к навигации Перейти к поиску
(Новая страница: «==Статистика== ==BigData== ==Machine learning== ==Применения ML==»)
 
 
(не показано 8 промежуточных версий 1 участника)
Строка 1: Строка 1:
 
==Статистика==
 
==Статистика==
  +
  +
<!-- ****************************** -->
  +
<!-- Table Format - do not touch -->
  +
{| class="a" style="width:100%;" border="1" style="width:100%; border-collapse:collapse"|+
  +
<!-- Table name -->
  +
'''Статистика'''
  +
<!-- Table headers - do not touch -->
  +
! style="background: #EAECF0;"| Название курса||style="background: #EAECF0;"|Источник / Организация||style="background: #EAECF0;"|Возраст||style="background: #EAECF0;"|Длина курса
  +
<!-- ****************************** -->
  +
<!-- Course 1 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://stepik.org/course/326/promo Математическая статистика]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
'''Выборка, описательная статистика'''
  +
* Общие рекомендации. Моделирование
  +
* Краткий обзор понятий теории вероятностей
  +
* Выборка. Выборочное пространство
  +
* Описательная статистика
  +
'''Точечные оценки, свойства и методы построения'''
  +
* Точечные оценки и их свойства
  +
* Методы построения точечных оценок
  +
'''Доверительные интервалы, стратифицированные выборки'''
  +
* Стратифицированные выборки
  +
* Доверительные интервалы
  +
'''Статистические гипотезы, параметрические критерии'''
  +
* Лемма Неймана-Пирсона
  +
* Критерии о параметрах нормального распределения
  +
* Критерии о параметрах нормального и биномиального распределений
  +
'''Критерии однородности'''
  +
* Параметрические критерии однородности
  +
* Непараметрические критерии однородности
  +
* Однофакторный дисперсионный анализ
  +
'''Критерии согласия, таблицы сопряжения'''
  +
* Критерии согласия хи-квадрат и Колмогорова
  +
* Критерии нормальности
  +
* Таблицы сопряженности
  +
'''Регрессионный анализ'''
  +
* Множественная линейная регрессия
  +
* Анализ остатков, корреляционный анализ
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Stepik]] / [[CSC]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
11 часов видео, 200 тестов
  +
<!-- ****************************** -->
  +
<!-- Course 2 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/vvedeniye-dannyye Анализ данных: часть 1. Введение в данные]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Основы теории вероятностей
  +
* Основы статистического анализа выборочных данных
  +
* Графический анализ данных
  +
* Формирование выборок и подготовка данных
  +
* Практические задания
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Coursera]] / [[НГУ]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
9 часов на выполнение
  +
<!-- ****************************** -->
  +
<!-- Course 3 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/statisticheskikh-vzaimosvyazey Анализ данных: часть 2. Исследование статистических взаимосвязей]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Введение в статистические критерии
  +
* Критерии согласия
  +
* Поиск взаимосвязей в данных и оценка их статистической значимости
  +
* Линейная регрессия
  +
* Итоговое задание
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Coursera]] / [[НГУ]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
8 часов на выполнение
  +
<!-- ****************************** -->
  +
<!-- Course 4 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/sravneniye-sozdaniye-grupp Анализ данных: часть 3. Сравнение и создание групп]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Одновыборочные и двухвыборочные критерии
  +
* Сравнение нескольких выборок
  +
* Введение в кластерный анализ
  +
* Итерационные методы кластерного анализа
  +
* Итоговое задание
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Coursera]] / [[НГУ]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
7 часов на выполнение
  +
<!-- ****************************** -->
  +
<!-- Course 5 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/trendy-klassifikatsii Анализ данных: часть 4. Тренды и классификации]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Анализ временных рядов
  +
* Прогноз временных рядов
  +
* Факторный анализ
  +
* Классификация
  +
* Итоговое задание
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Coursera]] / [[НГУ]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
5 часов на выполнение
  +
<!-- ****************************** -->
  +
<!-- Course 6 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://stepik.org/course/76/promo Основы статистики.1]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Введение'''
  +
* Генеральная совокупность и выборка
  +
* Нормальное распределение
  +
* Центральная предельная теорема
  +
* Идея статистического вывода, p-уровень значимости
  +
'''Сравнение средних'''
  +
* T-распределение
  +
* Проверка распределения на нормальность, QQ-Plot
  +
* Однофакторный дисперсионный анализ
  +
* ANOVA
  +
'''Корреляция и регрессия'''
  +
* Корреляция
  +
* Регрессия
  +
* Гипотеза о значимости взаимосвязи и коэффициент детерминации
  +
* Регрессионный анализ
  +
* Классификация: логистическая регрессия и кластерный анализ
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Stepik]] / [[Институт Биоинформатики]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
4 часа видео, 100 тестов
  +
<!-- ****************************** -->
  +
<!-- Course 7 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://stepik.org/course/524/promo Основы статистики.2]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Анализ номинативных данных'''
  +
* Распределение Хи-квадрат Пирсона
  +
* Анализ таблиц сопряженности
  +
* Точный критерий Фишера
  +
* Практические задания на R
  +
* Логистическая регрессия и непараметрические методы'''
  +
* Логистическая регрессия: модели без предикторов и с предикторами
  +
* Взаимодействие номинативных предикторов
  +
* Непараметрический анализ
  +
'''Кластерный анализ и метод главных компонент'''
  +
* Кластерный анализ методом k - средних
  +
* Может ли кластерный анализ ""ошибаться""?
  +
* Иерархическая кластеризация
  +
* Введение в метод анализа главных компонент
  +
* Практические задания на R
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Stepik]] / [[Институт Биоинформатики]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
6 часов видео, 100 тестов
  +
<!-- ****************************** -->
  +
<!-- Course 8 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://stepik.org/course/2152/promo Основы статистики.3]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* подробнее о линейной регрессии'''
  +
* Линейная регрессия, линейность взаимосвязи
  +
* Логарифмическая трансформация переменных
  +
* Проблема гетероскедастичности
  +
* Мультиколлинеарность
  +
* Практические задания на R
  +
'''Смешанные регрессионные модели'''
  +
* Нарушение допущения о независимости наблюдений
  +
* Смешанные регрессионные модели. Реализация в R
  +
* Статистическая значимость, обобщённые модели и случайные эффекты
  +
* Практические задания на R
  +
'''Bootstrap'''
  +
* Складной нож (jackknife)
  +
* Bootstrap
  +
* Практические задания на R
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Stepik]] / [[Институт Биоинформатики]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
4 часа видео, 50 тестов
  +
<!-- ****************************** -->
  +
<!-- Course 9 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/znakomstvo-r-bazovaya-statistika Просто о статистике с R: часть 1. Знакомство с R и базовая статистика]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Знакомство с R
  +
* Работа с данными
  +
* Графики с использованием ggplot2
  +
* Описательная статистика
  +
* Тестирование гипотез
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Coursera]] / [[СПБГУ]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
36 часов на выполнение
  +
<!-- ****************************** -->
  +
<!-- Course 10 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/lineynaya-regressiya Просто о статистике с R: часть 2. Линейная регрессия]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Корреляционный анализ. Простая линейная регрессия
  +
* Проверка значимости и валидности линейных моделей
  +
* Краткое введение в мир линейной алгебры
  +
* Множественная линейная регрессия
  +
* Сравнение линейных моделей
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Coursera]] / [[СПБГУ]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
34 часов на выполнение
  +
<!-- ****************************** -->
  +
<!-- Course 11 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/lineyniye-modeli-s-diskretnimi-prediktorami Просто о статистике с R: часть 3. Линейные модели с дискретными предикторами]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Модели с дискретными и непрерывными предикторами
  +
* Модели с разными значениями угла наклона для групп
  +
* Однофакторный дисперсионный анализ
  +
* Многофакторный дисперсионный анализ
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Coursera]] / [[СПБГУ]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
22 часов на выполнение
  +
<!-- ****************************** -->
  +
<!-- Course 12 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/obobshchennye-linejnye-modeli Просто о статистике с R: часть 4. Обобщенные линейные модели]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Знакомство с обобщенными линейными моделями
  +
* Проблема выбора модели
  +
* Обобщенные линейные модели для счетных данных
  +
* Обобщенные линейные модели с бинарным откликом
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Coursera]] / [[СПБГУ]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
17 часов на выполнение
  +
<!-- ****************************** -->
  +
<!-- Course 13 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/smeshannye-lineynye-modeli Просто о статистике с R: часть 5. Смешанные линейные модели]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Знакомство со смешанными линейными моделями
  +
* Моделирование структуры дисперсии в смешанных моделях
  +
* Смешанные линейные модели для счетных данных
  +
* Смешанные линейные модели для бинарных данных
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Coursera]] / [[СПБГУ]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
17 часов на выполнение
  +
<!-- ****************************** -->
  +
<!-- Table ending - do not touch -->
  +
|}
  +
<!-- ****************************** -->
   
 
==BigData==
 
==BigData==
  +
  +
<!-- ****************************** -->
  +
<!-- Table Format - do not touch -->
  +
{| class="a" style="width:100%;" border="1" style="width:100%; border-collapse:collapse"|+
  +
<!-- Table name -->
  +
'''Big Data'''
  +
<!-- Table headers - do not touch -->
  +
! style="background: #EAECF0;"| Название курса||style="background: #EAECF0;"|Источник / Организация||style="background: #EAECF0;"|Возраст||style="background: #EAECF0;"|Длина курса
  +
<!-- ****************************** -->
  +
<!-- Course 1 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://stepik.org/course/1612/promo Управление вычислениями]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
'''контейнеризация и Docker'''
  +
* Знакомство с Docker
  +
* Работа с файлами в контейнерах Docker
  +
* Взаимодействие контейнеров Docker
  +
* Работа с образами Docker
  +
* Технологические основы и роль контейнеризации
  +
'''Workflows и Pipelines'''
  +
* Работа с данными и пайплайны
  +
* Инструменты пайплайнинга и подходы к описанию пайплайнов
  +
* Snakemake: имплицитное описание графа анализа, создание пайплайнов
  +
'''Common workflow language'''
  +
* Знакомство с CWL
  +
* Описание инструментов с использованием CWL
  +
* CWL: полезные компоненты, создание пайплайнов
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Stepik]] / [[Институт Биоинформатики]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
2 часа видео, 50 тестов
  +
<!-- ****************************** -->
  +
<!-- Course 2 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://stepik.org/course/150/promo Hadoop. Система для обработки больших объемов данных]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
'''Введение'''
  +
* Что такое Hadoop?
  +
'''Распределенная файловая система HDFS'''
  +
* Архитектура HDFS
  +
* Shell-команды
  +
* Java API
  +
'''MapReduce'''
  +
* Парадигма MapReduce, фреймворк
  +
* Java API
  +
* Hadoop Streaming
  +
* Алгоритмы на MapReduce
  +
* Реляционные функции
  +
* Расчет TF-IDF
  +
'''алгоритмы на графах в MapReduce'''
  +
* Графы в MapReduce
  +
* Поиск кратчайшего пути в графе
  +
* PageRank
  +
* Проблемы MR-алгоритмов на графах
  +
'''Pig и Hive'''
  +
* Pig, основные операторы PigLatin
  +
* Hive
  +
* Pig vs Hive
  +
'''NoSQL базы данных HBase и Cassandra'''
  +
* Способы хранения данных, NoSQL
  +
* HBase
  +
* Cassandra
  +
'''Spark'''
  +
* Основные понятия Spark, операторы, фреймворк
  +
'''Yarn.MapReduce2.0'''
  +
* Что такое YARN?
  +
* Компоненты YARN
  +
* MapReduce 2.0
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Stepik]] / [[mail.ru]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
12 часов видео, 250 тестов
  +
<!-- ****************************** -->
  +
<!-- Table ending - do not touch -->
  +
|}
  +
<!-- ****************************** -->
   
 
==Machine learning==
 
==Machine learning==
  +
  +
<!-- ****************************** -->
  +
<!-- Table Format - do not touch -->
  +
{| class="a" style="width:100%;" border="1" style="width:100%; border-collapse:collapse"|+
  +
<!-- Table name -->
  +
'''Machine learning'''
  +
<!-- Table headers - do not touch -->
  +
! style="background: #EAECF0;"| Название курса||style="background: #EAECF0;"|Источник / Организация||style="background: #EAECF0;"|Возраст||style="background: #EAECF0;"|Длина курса
  +
<!-- ****************************** -->
  +
<!-- Course 1 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://stepik.org/course/4852/promo Введение в Datascience и машинное обучение]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
'''Введение'''
  +
* Big data, deep machine learning, основные понятия
  +
* Модель
  +
* Фильтрация данных
  +
* Группировка и агрегация
  +
* Визуализация, seaborn
  +
'''Решающие деревья'''
  +
* Какого музыканта Beatles я загадал или entropy reduction
  +
* Titanic: Machine Learning from Disaster
  +
* Обучение, переобучение, недообучение и кросвалидация
  +
* Последний джедай или метрики качества модели
  +
* Подбор параметров и ROC and Roll
  +
* Практика, Scikit-learn, fit, predict, you are awesome
  +
'''Random forest, нейронные сети'''
  +
* Снова возвращаемся к деревьям
  +
* Random forest
  +
* Зачем знать что-то еще, если есть Random Forest?
  +
* Секретный гость
  +
* И на Марсе будут яблони цвести
  +
* Бонусный урок - нейроэволюция
  +
* Бонусный урок - трюки в Pandas
  +
'''Stepik ML contest'''
  +
* Stepik ML contest
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Stepik]] / [[Институт Биоинформатики]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
9 часов видео, 100 заданий
  +
<!-- ****************************** -->
  +
<!-- Course 2 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/vvedeniye-v-nauku-o-dannykh Введение в науку о данных]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Введение
  +
* Математический инструментарий науки о данных
  +
* Программный инструментарий науки о данных
  +
* Машинное обучение: обучение с учителем
  +
* Машинное обучение: обучение без учителя
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Coursera]] / [[СПБГУ]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
17 часов на выполнение
  +
<!-- ****************************** -->
  +
<!-- Course 3 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/vvedenie-mashinnoe-obuchenie Введение в машинное обучение]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Знакомство с анализом данных и машинным обучением
  +
* Логические методы классификации
  +
* Метрические методы классификации
  +
* Линейные методы классификации
  +
* Метод опорных векторов и логистическая регрессия
  +
* Метрики качества классификации
  +
* Линейная регрессия
  +
* Понижение размерности и метод главных компонент
  +
* Композиции алгоритмов
  +
* Нейронные сети
  +
* Кластеризация и визуализация
  +
* Частичное обучение
  +
* Машинное обучение в прикладных задачах
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Coursera]] / [[Яндекс]] и [[ВШЭ]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
35 часов на выполнение
  +
<!-- ****************************** -->
  +
<!-- Course 4 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/mathematics-and-python Машинное обучение и анализ данных: часть 1. Математика и Python для анализа данных]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Введение
  +
* Библиотеки Python и линейная алгебра
  +
* Оптимизация и матричные разложения
  +
* Случайность
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Coursera]] / [[МФТИ]] и [[Яндекс]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
29 часов на выполнение
  +
<!-- ****************************** -->
  +
<!-- Course 5 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/supervised-learning Машинное обучение и анализ данных: часть 2. Обучение на размеченных данных]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Машинное обучение и линейные модели
  +
* Борьба с переобучением и оценивание качества
  +
* Линейные модели: классификация и практические аспекты
  +
* Решающие деревья и композиции алгоритмов
  +
* Нейронные сети и обзор методов
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Coursera]] / [[МФТИ]] и [[Яндекс]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
43 часа на выполнение
  +
<!-- ****************************** -->
  +
<!-- Course 6 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/unsupervised-learning Машинное обучение и анализ данных: часть 3. Поиск структуры в данных]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Кластеризация
  +
* Понижение размерности и матричные разложения
  +
* Визуализация и поиск аномалий
  +
* Тематическое моделирование
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Coursera]] / [[МФТИ]] и [[Яндекс]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
25 часов на выполнение
  +
<!-- ****************************** -->
  +
<!-- Course 7 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/stats-for-data-analysis Машинное обучение и анализ данных: часть 4. Построение выводов по данным]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Интервалы и гипотезы
  +
* АБ-тестирование
  +
* Закономерности и зависимости
  +
* Неделя задач
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Coursera]] / [[МФТИ]] и [[Яндекс]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
39 часов на выполнение
  +
<!-- ****************************** -->
  +
<!-- Course 8 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/data-analysis-applications Машинное обучение и анализ данных: часть 5. Прикладные задачи анализа данных]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Бизнес-задачи
  +
* Анализ медиа
  +
* Анализ текстов
  +
* Рекомендации и ранжирование
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Coursera]] / [[МФТИ]] и [[Яндекс]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
26 часов на выполнение
  +
<!-- ****************************** -->
  +
<!-- Course 9 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/data-analysis-project Машинное обучение и анализ данных: часть 6. Анализ данных: финальный проект]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
*
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Coursera]] / [[МФТИ]] и [[Яндекс]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
26 часов на выполнение
  +
<!-- ****************************** -->
  +
<!-- Course 10 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://stepik.org/course/401/promo Нейронные сети]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
'''Основы линейной алгебры'''
  +
* Опциональный ликбез по линейной алгебре: векторы, матрицы
  +
* NumPy: основы
  +
* Линейная алгебра в деле
  +
'''Перцептрон и градиентный спуск'''
  +
* Нейроны: настоящие и искусственные
  +
* Перцептрон, больше искусственных нейронов!
  +
* Градиентный спуск
  +
* Однослойные модели
  +
'''Алгоритм обратного распространения ошибки'''
  +
* Многослойный перцептрон
  +
* Алгоритм обратного распространения ошибки
  +
* Целевые функции
  +
'''Мониторинг состояния сети'''
  +
* Мониторинг состояния сети
  +
* Визуализация
  +
'''Проект по нейронной сети для управления автомобилем'''
  +
* Проект
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Stepik]] / [[Институт Биоинформатики]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
6 часов, 100 тестов
  +
<!-- ****************************** -->
  +
<!-- Course 11 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://stepik.org/course/8057/promo Машинное обучение]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Введение в машинное обучение и основные понятия статистики
  +
* Восстановление пропущенных значений
  +
* Поиск выбросов и аномалий
  +
* Кластеризация
  +
* Задача предсказания, линейная регрессия
  +
* Классификация, kNN, кросс-валидация
  +
* Деревья в машинном обучении
  +
* Линейные классификаторы
  +
* Вероятностные алгоритмы. Наивный Байес
  +
* Ансамбли алгоритмов
  +
* Отбор признаков (feature selection) и объектов
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Stepik]] / [[ОмГТУ]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
7 часов видео, 50 тестов
  +
<!-- ****************************** -->
  +
<!-- Table ending - do not touch -->
  +
|}
  +
<!-- ****************************** -->
   
 
==Применения ML==
 
==Применения ML==
  +
  +
<!-- ****************************** -->
  +
<!-- Table Format - do not touch -->
  +
{| class="a" style="width:100%;" border="1" style="width:100%; border-collapse:collapse"|+
  +
<!-- Table name -->
  +
'''Применения ML'''
  +
<!-- Table headers - do not touch -->
  +
! style="background: #EAECF0;"| Название курса||style="background: #EAECF0;"|Источник / Организация||style="background: #EAECF0;"|Возраст||style="background: #EAECF0;"|Длина курса
  +
<!-- ****************************** -->
  +
<!-- Course 1 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://stepik.org/course/50352/promo Нейронные сети и компьютерное зрение]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
'''Нейрон и нейронная сеть'''
  +
* Математическая модель нейрона
  +
* Булевы операции в виде нейронов
  +
* От нейрона к нейронной сети
  +
* Семинар: Базовая работа в PyTorch
  +
'''Строим первую нейронную сеть'''
  +
* Восстановление зависимости нейронной сетью
  +
* Компоненты нейронной сети
  +
* Алгоритм настройки нейронной сети
  +
* Графы вычислений и BackProp
  +
* Восстановление зависимостей
  +
* Реализация градиентного спуска
  +
'''Задачи, решаемые при помощи нейросетей'''
  +
* Бинарная классификация? Бинарная кросс-энтропия!
  +
* Многоклассовая классификация? Софтмакс!
  +
* Локализация, детекция, сегментация и super-resolution
  +
* Функции потерь
  +
'''Методы оптимизации'''
  +
* Самый обычный градиентный спуск
  +
* Модификации градиентного спуска
  +
* Теоретические задачи: Понимаем SGD с momentum
  +
* Классификация рукописных чисел полносвязанной сетью
  +
'''Сверточные нейронные сети'''
  +
* Свёртка, каскад свёрток
  +
* Семинар: Реализация сверточного слоя
  +
* Собери их все: архитектура LeNet (1998)
  +
* Собери их все: AlexNet (2012) и VGG (2014)
  +
* Собери их все: GoogLeNet и ResNet (2015)
  +
'''Регуляризация и нормализация'''
  +
* Ударим дропаутом по переобучению!
  +
* И целой вечности мало? Батч-нормализация!
  +
* Семинар: cлой нормализации
  +
* Семинар: Решаем задачу классификации на датасете CIFAR
  +
'''Метод максимального правдоподобия'''
  +
* Метод максимального правдоподобия
  +
* Transfer learning на примере соревнования на Kaggle
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Stepik]] / [[Samsung research]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
7 часов видео, 200 тестов
  +
<!-- ****************************** -->
  +
<!-- Course 2 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://stepik.org/course/54098/promo Нейронные сети и обработка текста]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
'''Введение'''
  +
* Естественный язык и текст, особенности обработки естественных языков
  +
* В общих чертах: лингвистический анализ, извлечение признаков
  +
* Прикладные задачи обработки текста и итоги
  +
'''Векторная модель текста и классификация длинных текстов'''
  +
* Векторная модель текста и TF-IDF
  +
* Создаём нейросеть для работы с текстом
  +
* Семинар: классификация новостных текстов
  +
'''Базовые нейросетевые методы работы с текстами'''
  +
* Общий алгоритм работы с текстами с помощью нейросетей
  +
* Дистрибутивная семантика и векторные представления слов
  +
* Семинар: рецепты еды и Word2Vec на PyTorch
  +
* Основные виды нейросетевых моделей для обработки текстов
  +
* Свёрточные нейросети для обработки текстов
  +
* Семинар: POS-тэггинг свёрточными нейросетями
  +
'''Языковые модели и генерация текста'''
  +
* Рекуррентные нейросети
  +
* Моделирование языка
  +
* Семинар: генерация имён и лозунгов с помощью RNN
  +
* Агрегация, механизм внимания
  +
* Transformer и self-attention
  +
'''Преобразование последовательностей 1-k-1 и N-k-M'''
  +
* Распознавание плоской структуры коротких текстов
  +
* Семинар: распознавание структуры рецептов
  +
* Семинар: аспектный сентимент-анализ как NER
  +
* Преобразование последовательностей (seq2seq)
  +
* Семинар: генерация кода со Stack Overflow
  +
'''Transfer learning и адаптация моделей'''
  +
* Контекстуализированные представления и перенос знаний
  +
* Семинар: PyTorch-Transformers, или... как мне запустить BERT?
  +
* Семинар: BERT для вопросно-ответного поиска
  +
'''Финальное соревнование на kaggle и заключение'''
  +
* Что ещё почитать, как развиваться
  +
* Соревнование на Kaggle: обзор задачи и базового решения
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Stepik]] / [[Samsung research]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
9 часов видео, 200 тестов
  +
<!-- ****************************** -->
  +
<!-- Course 3 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/machinnoe-obuchenie-v-finansah Машинное обучение в финансах]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Введение в машинное обучение
  +
* Прогнозирование с помощью методов машинного обучения
  +
* Трейдинг и оптимальное управление в финансах
  +
* Natural Language Processing
  +
* Применение методов машинного обучения в анализе процессов
  +
* Прогнозирование макроэкономических показателей
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Coursera]] / [[Сбербанк]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
17 часов на выполнение
  +
<!-- ****************************** -->
  +
<!-- Table ending - do not touch -->
  +
|}
  +
<!-- ****************************** -->

Текущая версия на 10:46, 3 апреля 2020

Статистика

Статистика
Название курса Источник / Организация Возраст Длина курса

Stepik / CSC

Старшая школа и студенты

11 часов видео, 200 тестов

Coursera / НГУ

Старшая школа и студенты

9 часов на выполнение

Coursera / НГУ

Старшая школа и студенты

8 часов на выполнение

Coursera / НГУ

Старшая школа и студенты

7 часов на выполнение

Coursera / НГУ

Старшая школа и студенты

5 часов на выполнение

Stepik / Институт Биоинформатики

Старшая школа и студенты

4 часа видео, 100 тестов

Stepik / Институт Биоинформатики

Старшая школа и студенты

6 часов видео, 100 тестов

Stepik / Институт Биоинформатики

Старшая школа и студенты

4 часа видео, 50 тестов

Coursera / СПБГУ

Старшая школа и студенты

36 часов на выполнение

Coursera / СПБГУ

Старшая школа и студенты

34 часов на выполнение

Coursera / СПБГУ

Старшая школа и студенты

22 часов на выполнение

Coursera / СПБГУ

Старшая школа и студенты

17 часов на выполнение

Coursera / СПБГУ

Старшая школа и студенты

17 часов на выполнение

BigData

Big Data
Название курса Источник / Организация Возраст Длина курса

Stepik / Институт Биоинформатики

Старшая школа и студенты

2 часа видео, 50 тестов

Stepik / mail.ru

Старшая школа и студенты

12 часов видео, 250 тестов

Machine learning

Machine learning
Название курса Источник / Организация Возраст Длина курса

Stepik / Институт Биоинформатики

Старшая школа и студенты

9 часов видео, 100 заданий

Coursera / СПБГУ

Старшая школа и студенты

17 часов на выполнение

Coursera / Яндекс и ВШЭ

Старшая школа и студенты

35 часов на выполнение

Coursera / МФТИ и Яндекс

Старшая школа и студенты

29 часов на выполнение

Coursera / МФТИ и Яндекс

Старшая школа и студенты

43 часа на выполнение

Coursera / МФТИ и Яндекс

Старшая школа и студенты

25 часов на выполнение

Coursera / МФТИ и Яндекс

Старшая школа и студенты

39 часов на выполнение

Coursera / МФТИ и Яндекс

Старшая школа и студенты

26 часов на выполнение

Coursera / МФТИ и Яндекс

Старшая школа и студенты

26 часов на выполнение

Stepik / Институт Биоинформатики

Старшая школа и студенты

6 часов, 100 тестов

Stepik / ОмГТУ

Старшая школа и студенты

7 часов видео, 50 тестов

Применения ML

Применения ML
Название курса Источник / Организация Возраст Длина курса

Stepik / Samsung research

Старшая школа и студенты

7 часов видео, 200 тестов

Stepik / Samsung research

Старшая школа и студенты

9 часов видео, 200 тестов

Coursera / Сбербанк

Старшая школа и студенты

17 часов на выполнение