Анализ данных и машинное обучение: различия между версиями
EM (обсуждение | вклад) |
Marina (обсуждение | вклад) |
||
(не показано 5 промежуточных версий 1 участника) | |||
Строка 7: | Строка 7: | ||
'''Статистика''' |
'''Статистика''' |
||
<!-- Table headers - do not touch --> |
<!-- Table headers - do not touch --> |
||
− | ! style="background: #EAECF0;"| Название курса||style="background: #EAECF0;"|Источник / Организация||style="background: #EAECF0;"| |
+ | ! style="background: #EAECF0;"| Название курса||style="background: #EAECF0;"|Источник / Организация||style="background: #EAECF0;"|Возраст||style="background: #EAECF0;"|Длина курса |
<!-- ****************************** --> |
<!-- ****************************** --> |
||
<!-- Course 1 --> |
<!-- Course 1 --> |
||
Строка 382: | Строка 382: | ||
'''Big Data''' |
'''Big Data''' |
||
<!-- Table headers - do not touch --> |
<!-- Table headers - do not touch --> |
||
− | ! style="background: #EAECF0;"| Название курса||style="background: #EAECF0;"|Источник / Организация||style="background: #EAECF0;"| |
+ | ! style="background: #EAECF0;"| Название курса||style="background: #EAECF0;"|Источник / Организация||style="background: #EAECF0;"|Возраст||style="background: #EAECF0;"|Длина курса |
<!-- ****************************** --> |
<!-- ****************************** --> |
||
<!-- Course 1 --> |
<!-- Course 1 --> |
||
Строка 480: | Строка 480: | ||
'''Machine learning''' |
'''Machine learning''' |
||
<!-- Table headers - do not touch --> |
<!-- Table headers - do not touch --> |
||
− | ! style="background: #EAECF0;"| Название курса||style="background: #EAECF0;"|Источник / Организация||style="background: #EAECF0;"| |
+ | ! style="background: #EAECF0;"| Название курса||style="background: #EAECF0;"|Источник / Организация||style="background: #EAECF0;"|Возраст||style="background: #EAECF0;"|Длина курса |
<!-- ****************************** --> |
<!-- ****************************** --> |
||
<!-- Course 1 --> |
<!-- Course 1 --> |
||
Строка 493: | Строка 493: | ||
<!-- Course content --> |
<!-- Course content --> |
||
'''Введение''' |
'''Введение''' |
||
− | * |
+ | * Big data, deep machine learning, основные понятия |
− | * Модель |
+ | * Модель |
* Фильтрация данных |
* Фильтрация данных |
||
− | * Группировка и агрегация |
+ | * Группировка и агрегация |
− | * Визуализация, seaborn |
+ | * Визуализация, seaborn |
− | ''' |
+ | '''Решающие деревья''' |
* Какого музыканта Beatles я загадал или entropy reduction |
* Какого музыканта Beatles я загадал или entropy reduction |
||
* Titanic: Machine Learning from Disaster |
* Titanic: Machine Learning from Disaster |
||
Строка 788: | Строка 788: | ||
==Применения ML== |
==Применения ML== |
||
+ | |||
+ | <!-- ****************************** --> |
||
+ | <!-- Table Format - do not touch --> |
||
+ | {| class="a" style="width:100%;" border="1" style="width:100%; border-collapse:collapse"|+ |
||
+ | <!-- Table name --> |
||
+ | '''Применения ML''' |
||
+ | <!-- Table headers - do not touch --> |
||
+ | ! style="background: #EAECF0;"| Название курса||style="background: #EAECF0;"|Источник / Организация||style="background: #EAECF0;"|Возраст||style="background: #EAECF0;"|Длина курса |
||
+ | <!-- ****************************** --> |
||
+ | <!-- Course 1 --> |
||
+ | |- |
||
+ | | |
||
+ | <!-- Course format do not touch --> |
||
+ | {| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;" |
||
+ | | style="border:1px solid white;"|<strong>[https://stepik.org/course/50352/promo Нейронные сети и компьютерное зрение]</strong> |
||
+ | |- |
||
+ | <!-- Course content format do not touch --> |
||
+ | | style="border:1px solid white;"| |
||
+ | <!-- Course content --> |
||
+ | '''Нейрон и нейронная сеть''' |
||
+ | * Математическая модель нейрона |
||
+ | * Булевы операции в виде нейронов |
||
+ | * От нейрона к нейронной сети |
||
+ | * Семинар: Базовая работа в PyTorch |
||
+ | '''Строим первую нейронную сеть''' |
||
+ | * Восстановление зависимости нейронной сетью |
||
+ | * Компоненты нейронной сети |
||
+ | * Алгоритм настройки нейронной сети |
||
+ | * Графы вычислений и BackProp |
||
+ | * Восстановление зависимостей |
||
+ | * Реализация градиентного спуска |
||
+ | '''Задачи, решаемые при помощи нейросетей''' |
||
+ | * Бинарная классификация? Бинарная кросс-энтропия! |
||
+ | * Многоклассовая классификация? Софтмакс! |
||
+ | * Локализация, детекция, сегментация и super-resolution |
||
+ | * Функции потерь |
||
+ | '''Методы оптимизации''' |
||
+ | * Самый обычный градиентный спуск |
||
+ | * Модификации градиентного спуска |
||
+ | * Теоретические задачи: Понимаем SGD с momentum |
||
+ | * Классификация рукописных чисел полносвязанной сетью |
||
+ | '''Сверточные нейронные сети''' |
||
+ | * Свёртка, каскад свёрток |
||
+ | * Семинар: Реализация сверточного слоя |
||
+ | * Собери их все: архитектура LeNet (1998) |
||
+ | * Собери их все: AlexNet (2012) и VGG (2014) |
||
+ | * Собери их все: GoogLeNet и ResNet (2015) |
||
+ | '''Регуляризация и нормализация''' |
||
+ | * Ударим дропаутом по переобучению! |
||
+ | * И целой вечности мало? Батч-нормализация! |
||
+ | * Семинар: cлой нормализации |
||
+ | * Семинар: Решаем задачу классификации на датасете CIFAR |
||
+ | '''Метод максимального правдоподобия''' |
||
+ | * Метод максимального правдоподобия |
||
+ | * Transfer learning на примере соревнования на Kaggle |
||
+ | |} |
||
+ | <!-- Formating do not touch --> |
||
+ | |style="text-align:center;"| |
||
+ | [[Stepik]] / [[Samsung research]] |
||
+ | |style="text-align:center;"| |
||
+ | [[Материалы для старшей школы и студентов| Старшая школа и студенты]] |
||
+ | |style="text-align:center;"| |
||
+ | 7 часов видео, 200 тестов |
||
+ | <!-- ****************************** --> |
||
+ | <!-- Course 2 --> |
||
+ | |- |
||
+ | | |
||
+ | <!-- Course format do not touch --> |
||
+ | {| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;" |
||
+ | | style="border:1px solid white;"|<strong>[https://stepik.org/course/54098/promo Нейронные сети и обработка текста]</strong> |
||
+ | |- |
||
+ | <!-- Course content format do not touch --> |
||
+ | | style="border:1px solid white;"| |
||
+ | <!-- Course content --> |
||
+ | '''Введение''' |
||
+ | * Естественный язык и текст, особенности обработки естественных языков |
||
+ | * В общих чертах: лингвистический анализ, извлечение признаков |
||
+ | * Прикладные задачи обработки текста и итоги |
||
+ | '''Векторная модель текста и классификация длинных текстов''' |
||
+ | * Векторная модель текста и TF-IDF |
||
+ | * Создаём нейросеть для работы с текстом |
||
+ | * Семинар: классификация новостных текстов |
||
+ | '''Базовые нейросетевые методы работы с текстами''' |
||
+ | * Общий алгоритм работы с текстами с помощью нейросетей |
||
+ | * Дистрибутивная семантика и векторные представления слов |
||
+ | * Семинар: рецепты еды и Word2Vec на PyTorch |
||
+ | * Основные виды нейросетевых моделей для обработки текстов |
||
+ | * Свёрточные нейросети для обработки текстов |
||
+ | * Семинар: POS-тэггинг свёрточными нейросетями |
||
+ | '''Языковые модели и генерация текста''' |
||
+ | * Рекуррентные нейросети |
||
+ | * Моделирование языка |
||
+ | * Семинар: генерация имён и лозунгов с помощью RNN |
||
+ | * Агрегация, механизм внимания |
||
+ | * Transformer и self-attention |
||
+ | '''Преобразование последовательностей 1-k-1 и N-k-M''' |
||
+ | * Распознавание плоской структуры коротких текстов |
||
+ | * Семинар: распознавание структуры рецептов |
||
+ | * Семинар: аспектный сентимент-анализ как NER |
||
+ | * Преобразование последовательностей (seq2seq) |
||
+ | * Семинар: генерация кода со Stack Overflow |
||
+ | '''Transfer learning и адаптация моделей''' |
||
+ | * Контекстуализированные представления и перенос знаний |
||
+ | * Семинар: PyTorch-Transformers, или... как мне запустить BERT? |
||
+ | * Семинар: BERT для вопросно-ответного поиска |
||
+ | '''Финальное соревнование на kaggle и заключение''' |
||
+ | * Что ещё почитать, как развиваться |
||
+ | * Соревнование на Kaggle: обзор задачи и базового решения |
||
+ | |} |
||
+ | <!-- Formating do not touch --> |
||
+ | |style="text-align:center;"| |
||
+ | [[Stepik]] / [[Samsung research]] |
||
+ | |style="text-align:center;"| |
||
+ | [[Материалы для старшей школы и студентов| Старшая школа и студенты]] |
||
+ | |style="text-align:center;"| |
||
+ | 9 часов видео, 200 тестов |
||
+ | <!-- ****************************** --> |
||
+ | <!-- Course 3 --> |
||
+ | |- |
||
+ | | |
||
+ | <!-- Course format do not touch --> |
||
+ | {| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;" |
||
+ | | style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/machinnoe-obuchenie-v-finansah Машинное обучение в финансах]</strong> |
||
+ | |- |
||
+ | <!-- Course content format do not touch --> |
||
+ | | style="border:1px solid white;"| |
||
+ | <!-- Course content --> |
||
+ | * Введение в машинное обучение |
||
+ | * Прогнозирование с помощью методов машинного обучения |
||
+ | * Трейдинг и оптимальное управление в финансах |
||
+ | * Natural Language Processing |
||
+ | * Применение методов машинного обучения в анализе процессов |
||
+ | * Прогнозирование макроэкономических показателей |
||
+ | |} |
||
+ | <!-- Formating do not touch --> |
||
+ | |style="text-align:center;"| |
||
+ | [[Coursera]] / [[Сбербанк]] |
||
+ | |style="text-align:center;"| |
||
+ | [[Материалы для старшей школы и студентов| Старшая школа и студенты]] |
||
+ | |style="text-align:center;"| |
||
+ | 17 часов на выполнение |
||
+ | <!-- ****************************** --> |
||
+ | <!-- Table ending - do not touch --> |
||
+ | |} |
||
+ | <!-- ****************************** --> |
Текущая версия на 10:46, 3 апреля 2020
Содержание
Статистика
СтатистикаНазвание курса | Источник / Организация | Возраст | Длина курса | ||
---|---|---|---|---|---|
|
11 часов видео, 200 тестов | ||||
|
9 часов на выполнение | ||||
|
8 часов на выполнение | ||||
|
7 часов на выполнение | ||||
|
5 часов на выполнение | ||||
|
4 часа видео, 100 тестов | ||||
|
6 часов видео, 100 тестов | ||||
|
4 часа видео, 50 тестов | ||||
|
36 часов на выполнение | ||||
|
34 часов на выполнение | ||||
|
22 часов на выполнение | ||||
|
17 часов на выполнение | ||||
|
17 часов на выполнение |
BigData
Big DataНазвание курса | Источник / Организация | Возраст | Длина курса | ||
---|---|---|---|---|---|
|
2 часа видео, 50 тестов | ||||
|
12 часов видео, 250 тестов |
Machine learning
Machine learningНазвание курса | Источник / Организация | Возраст | Длина курса | ||
---|---|---|---|---|---|
|
9 часов видео, 100 заданий | ||||
|
17 часов на выполнение | ||||
|
35 часов на выполнение | ||||
|
29 часов на выполнение | ||||
|
43 часа на выполнение | ||||
|
25 часов на выполнение | ||||
|
39 часов на выполнение | ||||
|
26 часов на выполнение | ||||
|
26 часов на выполнение | ||||
|
6 часов, 100 тестов | ||||
|
7 часов видео, 50 тестов |
Применения ML
Применения MLНазвание курса | Источник / Организация | Возраст | Длина курса | ||
---|---|---|---|---|---|
|
7 часов видео, 200 тестов | ||||
|
9 часов видео, 200 тестов | ||||
|
17 часов на выполнение |