Анализ данных и машинное обучение: различия между версиями

Материал из Кружковое движение
Перейти к навигации Перейти к поиску
Строка 788: Строка 788:
   
 
==Применения ML==
 
==Применения ML==
  +
  +
<!-- ****************************** -->
  +
<!-- Table Format - do not touch -->
  +
{| class="a" style="width:100%;" border="1" style="width:100%; border-collapse:collapse"|+
  +
<!-- Table name -->
  +
'''Применения ML'''
  +
<!-- Table headers - do not touch -->
  +
! style="background: #EAECF0;"| Название курса||style="background: #EAECF0;"|Источник / Организация||style="background: #EAECF0;"|Источник||style="background: #EAECF0;"|Длина курса
  +
<!-- ****************************** -->
  +
<!-- Course 1 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://stepik.org/course/50352/promo Нейронные сети и компьютерное зрение]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
'''Нейрон и нейронная сеть'''
  +
* Математическая модель нейрона
  +
* Булевы операции в виде нейронов
  +
* От нейрона к нейронной сети
  +
* Семинар: Базовая работа в PyTorch
  +
'''Строим первую нейронную сеть'''
  +
* Восстановление зависимости нейронной сетью
  +
* Компоненты нейронной сети
  +
* Алгоритм настройки нейронной сети
  +
* Графы вычислений и BackProp
  +
* Восстановление зависимостей
  +
* Реализация градиентного спуска
  +
'''Задачи, решаемые при помощи нейросетей'''
  +
* Бинарная классификация? Бинарная кросс-энтропия!
  +
* Многоклассовая классификация? Софтмакс!
  +
* Локализация, детекция, сегментация и super-resolution
  +
* Функции потерь
  +
'''Методы оптимизации'''
  +
* Самый обычный градиентный спуск
  +
* Модификации градиентного спуска
  +
* Теоретические задачи: Понимаем SGD с momentum
  +
* Классификация рукописных чисел полносвязанной сетью
  +
'''Сверточные нейронные сети'''
  +
* Свёртка, каскад свёрток
  +
* Семинар: Реализация сверточного слоя
  +
* Собери их все: архитектура LeNet (1998)
  +
* Собери их все: AlexNet (2012) и VGG (2014)
  +
* Собери их все: GoogLeNet и ResNet (2015)
  +
'''Регуляризация и нормализация'''
  +
* Ударим дропаутом по переобучению!
  +
* И целой вечности мало? Батч-нормализация!
  +
* Семинар: cлой нормализации
  +
* Семинар: Решаем задачу классификации на датасете CIFAR
  +
'''Метод максимального правдоподобия'''
  +
* Метод максимального правдоподобия
  +
* Transfer learning на примере соревнования на Kaggle
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Stepik]] / [[Samsung research]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
7 часов видео, 200 тестов
  +
<!-- ****************************** -->
  +
<!-- Course 2 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://stepik.org/course/54098/promo Нейронные сети и обработка текста]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
'''Введение'''
  +
* Естественный язык и текст, особенности обработки естественных языков
  +
* В общих чертах: лингвистический анализ, извлечение признаков
  +
* Прикладные задачи обработки текста и итоги
  +
'''Векторная модель текста и классификация длинных текстов'''
  +
* Векторная модель текста и TF-IDF
  +
* Создаём нейросеть для работы с текстом
  +
* Семинар: классификация новостных текстов
  +
'''Базовые нейросетевые методы работы с текстами'''
  +
* Общий алгоритм работы с текстами с помощью нейросетей
  +
* Дистрибутивная семантика и векторные представления слов
  +
* Семинар: рецепты еды и Word2Vec на PyTorch
  +
* Основные виды нейросетевых моделей для обработки текстов
  +
* Свёрточные нейросети для обработки текстов
  +
* Семинар: POS-тэггинг свёрточными нейросетями
  +
'''Языковые модели и генерация текста'''
  +
* Рекуррентные нейросети
  +
* Моделирование языка
  +
* Семинар: генерация имён и лозунгов с помощью RNN
  +
* Агрегация, механизм внимания
  +
* Transformer и self-attention
  +
'''Преобразование последовательностей 1-k-1 и N-k-M'''
  +
* Распознавание плоской структуры коротких текстов
  +
* Семинар: распознавание структуры рецептов
  +
* Семинар: аспектный сентимент-анализ как NER
  +
* Преобразование последовательностей (seq2seq)
  +
* Семинар: генерация кода со Stack Overflow
  +
'''Transfer learning и адаптация моделей'''
  +
* Контекстуализированные представления и перенос знаний
  +
* Семинар: PyTorch-Transformers, или... как мне запустить BERT?
  +
* Семинар: BERT для вопросно-ответного поиска
  +
'''Финальное соревнование на kaggle и заключение'''
  +
* Что ещё почитать, как развиваться
  +
* Соревнование на Kaggle: обзор задачи и базового решения
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Stepik]] / [[Samsung research]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
9 часов видео, 200 тестов
  +
<!-- ****************************** -->
  +
<!-- Course 3 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/machinnoe-obuchenie-v-finansah Машинное обучение в финансах]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Введение в машинное обучение
  +
* Прогнозирование с помощью методов машинного обучения
  +
* Трейдинг и оптимальное управление в финансах
  +
* Natural Language Processing
  +
* Применение методов машинного обучения в анализе процессов
  +
* Прогнозирование макроэкономических показателей
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Coursera]] / [[Сбербанк]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
17 часов на выполнение
  +
<!-- ****************************** -->
  +
<!-- Table ending - do not touch -->
  +
|}
  +
<!-- ****************************** -->

Версия 23:38, 23 марта 2020

Статистика

Статистика
Название курса Источник / Организация Источник Длина курса

Stepik / CSC

Старшая школа и студенты

11 часов видео, 200 тестов

Coursera / НГУ

Старшая школа и студенты

9 часов на выполнение

Coursera / НГУ

Старшая школа и студенты

8 часов на выполнение

Coursera / НГУ

Старшая школа и студенты

7 часов на выполнение

Coursera / НГУ

Старшая школа и студенты

5 часов на выполнение

Stepik / Институт Биоинформатики

Старшая школа и студенты

4 часа видео, 100 тестов

Stepik / Институт Биоинформатики

Старшая школа и студенты

6 часов видео, 100 тестов

Stepik / Институт Биоинформатики

Старшая школа и студенты

4 часа видео, 50 тестов

Coursera / СПБГУ

Старшая школа и студенты

36 часов на выполнение

Coursera / СПБГУ

Старшая школа и студенты

34 часов на выполнение

Coursera / СПБГУ

Старшая школа и студенты

22 часов на выполнение

Coursera / СПБГУ

Старшая школа и студенты

17 часов на выполнение

Coursera / СПБГУ

Старшая школа и студенты

17 часов на выполнение

BigData

Big Data
Название курса Источник / Организация Источник Длина курса

Stepik / Институт Биоинформатики

Старшая школа и студенты

2 часа видео, 50 тестов

Stepik / mail.ru

Старшая школа и студенты

12 часов видео, 250 тестов

Machine learning

Machine learning
Название курса Источник / Организация Источник Длина курса

Stepik / Институт Биоинформатики

Старшая школа и студенты

9 часов видео, 100 заданий

Coursera / СПБГУ

Старшая школа и студенты

17 часов на выполнение

Coursera / Яндекс и ВШЭ

Старшая школа и студенты

35 часов на выполнение

Coursera / МФТИ и Яндекс

Старшая школа и студенты

29 часов на выполнение

Coursera / МФТИ и Яндекс

Старшая школа и студенты

43 часа на выполнение

Coursera / МФТИ и Яндекс

Старшая школа и студенты

25 часов на выполнение

Coursera / МФТИ и Яндекс

Старшая школа и студенты

39 часов на выполнение

Coursera / МФТИ и Яндекс

Старшая школа и студенты

26 часов на выполнение

Coursera / МФТИ и Яндекс

Старшая школа и студенты

26 часов на выполнение

Stepik / Институт Биоинформатики

Старшая школа и студенты

6 часов, 100 тестов

Stepik / ОмГТУ

Старшая школа и студенты

7 часов видео, 50 тестов

Применения ML

Применения ML
Название курса Источник / Организация Источник Длина курса

Stepik / Samsung research

Старшая школа и студенты

7 часов видео, 200 тестов

Stepik / Samsung research

Старшая школа и студенты

9 часов видео, 200 тестов

Coursera / Сбербанк

Старшая школа и студенты

17 часов на выполнение