Анализ данных и машинное обучение: различия между версиями
Перейти к навигации
Перейти к поиску
EM (обсуждение | вклад) (Новая страница: «==Статистика== ==BigData== ==Machine learning== ==Применения ML==») |
EM (обсуждение | вклад) |
||
Строка 1: | Строка 1: | ||
==Статистика== |
==Статистика== |
||
+ | |||
+ | <!-- ****************************** --> |
||
+ | <!-- Table Format - do not touch --> |
||
+ | {| class="a" style="width:100%;" border="1" style="width:100%; border-collapse:collapse"|+ |
||
+ | <!-- Table name --> |
||
+ | '''Статистика''' |
||
+ | <!-- Table headers - do not touch --> |
||
+ | ! style="background: #EAECF0;"| Название курса||style="background: #EAECF0;"|Источник / Организация||style="background: #EAECF0;"|Источник||style="background: #EAECF0;"|Длина курса |
||
+ | <!-- ****************************** --> |
||
+ | <!-- Course 1 --> |
||
+ | |- |
||
+ | | |
||
+ | <!-- Course format do not touch --> |
||
+ | {| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;" |
||
+ | | style="border:1px solid white;"|<strong>[https://stepik.org/course/326/promo Математическая статистика]</strong> |
||
+ | |- |
||
+ | <!-- Course content format do not touch --> |
||
+ | | style="border:1px solid white;"| |
||
+ | <!-- Course content --> |
||
+ | '''Выборка, описательная статистика''' |
||
+ | * Общие рекомендации. Моделирование |
||
+ | * Краткий обзор понятий теории вероятностей |
||
+ | * Выборка. Выборочное пространство |
||
+ | * Описательная статистика |
||
+ | '''Точечные оценки, свойства и методы построения''' |
||
+ | * Точечные оценки и их свойства |
||
+ | * Методы построения точечных оценок |
||
+ | '''Доверительные интервалы, стратифицированные выборки''' |
||
+ | * Стратифицированные выборки |
||
+ | * Доверительные интервалы |
||
+ | '''Статистические гипотезы, параметрические критерии''' |
||
+ | * Лемма Неймана-Пирсона |
||
+ | * Критерии о параметрах нормального распределения |
||
+ | * Критерии о параметрах нормального и биномиального распределений |
||
+ | '''Критерии однородности''' |
||
+ | * Параметрические критерии однородности |
||
+ | * Непараметрические критерии однородности |
||
+ | * Однофакторный дисперсионный анализ |
||
+ | '''Критерии согласия, таблицы сопряжения''' |
||
+ | * Критерии согласия хи-квадрат и Колмогорова |
||
+ | * Критерии нормальности |
||
+ | * Таблицы сопряженности |
||
+ | '''Регрессионный анализ''' |
||
+ | * Множественная линейная регрессия |
||
+ | * Анализ остатков, корреляционный анализ |
||
+ | |} |
||
+ | <!-- Formating do not touch --> |
||
+ | |style="text-align:center;"| |
||
+ | [[Stepik]] / [[CSC]] |
||
+ | |style="text-align:center;"| |
||
+ | [[Материалы для старшей школы и студентов| Старшая школа и студенты]] |
||
+ | |style="text-align:center;"| |
||
+ | 11 часов видео, 200 тестов |
||
+ | <!-- ****************************** --> |
||
+ | <!-- Course 2 --> |
||
+ | |- |
||
+ | | |
||
+ | <!-- Course format do not touch --> |
||
+ | {| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;" |
||
+ | | style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/vvedeniye-dannyye Анализ данных: часть 1. Введение в данные]</strong> |
||
+ | |- |
||
+ | <!-- Course content format do not touch --> |
||
+ | | style="border:1px solid white;"| |
||
+ | <!-- Course content --> |
||
+ | * Основы теории вероятностей |
||
+ | * Основы статистического анализа выборочных данных |
||
+ | * Графический анализ данных |
||
+ | * Формирование выборок и подготовка данных |
||
+ | * Практические задания |
||
+ | |} |
||
+ | <!-- Formating do not touch --> |
||
+ | |style="text-align:center;"| |
||
+ | [[Coursera]] / [[НГУ]] |
||
+ | |style="text-align:center;"| |
||
+ | [[Материалы для старшей школы и студентов| Старшая школа и студенты]] |
||
+ | |style="text-align:center;"| |
||
+ | 9 часов на выполнение |
||
+ | <!-- ****************************** --> |
||
+ | <!-- Course 3 --> |
||
+ | |- |
||
+ | | |
||
+ | <!-- Course format do not touch --> |
||
+ | {| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;" |
||
+ | | style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/statisticheskikh-vzaimosvyazey Анализ данных: часть 2. Исследование статистических взаимосвязей]</strong> |
||
+ | |- |
||
+ | <!-- Course content format do not touch --> |
||
+ | | style="border:1px solid white;"| |
||
+ | <!-- Course content --> |
||
+ | * Введение в статистические критерии |
||
+ | * Критерии согласия |
||
+ | * Поиск взаимосвязей в данных и оценка их статистической значимости |
||
+ | * Линейная регрессия |
||
+ | * Итоговое задание |
||
+ | |} |
||
+ | <!-- Formating do not touch --> |
||
+ | |style="text-align:center;"| |
||
+ | [[Coursera]] / [[НГУ]] |
||
+ | |style="text-align:center;"| |
||
+ | [[Материалы для старшей школы и студентов| Старшая школа и студенты]] |
||
+ | |style="text-align:center;"| |
||
+ | 8 часов на выполнение |
||
+ | <!-- ****************************** --> |
||
+ | <!-- Course 4 --> |
||
+ | |- |
||
+ | | |
||
+ | <!-- Course format do not touch --> |
||
+ | {| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;" |
||
+ | | style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/sravneniye-sozdaniye-grupp Анализ данных: часть 3. Сравнение и создание групп]</strong> |
||
+ | |- |
||
+ | <!-- Course content format do not touch --> |
||
+ | | style="border:1px solid white;"| |
||
+ | <!-- Course content --> |
||
+ | * Одновыборочные и двухвыборочные критерии |
||
+ | * Сравнение нескольких выборок |
||
+ | * Введение в кластерный анализ |
||
+ | * Итерационные методы кластерного анализа |
||
+ | * Итоговое задание |
||
+ | |} |
||
+ | <!-- Formating do not touch --> |
||
+ | |style="text-align:center;"| |
||
+ | [[Coursera]] / [[НГУ]] |
||
+ | |style="text-align:center;"| |
||
+ | [[Материалы для старшей школы и студентов| Старшая школа и студенты]] |
||
+ | |style="text-align:center;"| |
||
+ | 7 часов на выполнение |
||
+ | <!-- ****************************** --> |
||
+ | <!-- Course 5 --> |
||
+ | |- |
||
+ | | |
||
+ | <!-- Course format do not touch --> |
||
+ | {| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;" |
||
+ | | style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/trendy-klassifikatsii Анализ данных: часть 4. Тренды и классификации]</strong> |
||
+ | |- |
||
+ | <!-- Course content format do not touch --> |
||
+ | | style="border:1px solid white;"| |
||
+ | <!-- Course content --> |
||
+ | * Анализ временных рядов |
||
+ | * Прогноз временных рядов |
||
+ | * Факторный анализ |
||
+ | * Классификация |
||
+ | * Итоговое задание |
||
+ | |} |
||
+ | <!-- Formating do not touch --> |
||
+ | |style="text-align:center;"| |
||
+ | [[Coursera]] / [[НГУ]] |
||
+ | |style="text-align:center;"| |
||
+ | [[Материалы для старшей школы и студентов| Старшая школа и студенты]] |
||
+ | |style="text-align:center;"| |
||
+ | 5 часов на выполнение |
||
+ | <!-- ****************************** --> |
||
+ | <!-- Course 6 --> |
||
+ | |- |
||
+ | | |
||
+ | <!-- Course format do not touch --> |
||
+ | {| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;" |
||
+ | | style="border:1px solid white;"|<strong>[https://stepik.org/course/76/promo Основы статистики.1]</strong> |
||
+ | |- |
||
+ | <!-- Course content format do not touch --> |
||
+ | | style="border:1px solid white;"| |
||
+ | <!-- Course content --> |
||
+ | * Введение''' |
||
+ | * Генеральная совокупность и выборка |
||
+ | * Нормальное распределение |
||
+ | * Центральная предельная теорема |
||
+ | * Идея статистического вывода, p-уровень значимости |
||
+ | '''Сравнение средних''' |
||
+ | * T-распределение |
||
+ | * Проверка распределения на нормальность, QQ-Plot |
||
+ | * Однофакторный дисперсионный анализ |
||
+ | * ANOVA |
||
+ | '''Корреляция и регрессия''' |
||
+ | * Корреляция |
||
+ | * Регрессия |
||
+ | * Гипотеза о значимости взаимосвязи и коэффициент детерминации |
||
+ | * Регрессионный анализ |
||
+ | * Классификация: логистическая регрессия и кластерный анализ |
||
+ | |} |
||
+ | <!-- Formating do not touch --> |
||
+ | |style="text-align:center;"| |
||
+ | [[Stepik]] / [[Институт Биоинформатики]] |
||
+ | |style="text-align:center;"| |
||
+ | [[Материалы для старшей школы и студентов| Старшая школа и студенты]] |
||
+ | |style="text-align:center;"| |
||
+ | 4 часа видео, 100 тестов |
||
+ | <!-- ****************************** --> |
||
+ | <!-- Course 7 --> |
||
+ | |- |
||
+ | | |
||
+ | <!-- Course format do not touch --> |
||
+ | {| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;" |
||
+ | | style="border:1px solid white;"|<strong>[https://stepik.org/course/524/promo Основы статистики.2]</strong> |
||
+ | |- |
||
+ | <!-- Course content format do not touch --> |
||
+ | | style="border:1px solid white;"| |
||
+ | <!-- Course content --> |
||
+ | * Анализ номинативных данных''' |
||
+ | * Распределение Хи-квадрат Пирсона |
||
+ | * Анализ таблиц сопряженности |
||
+ | * Точный критерий Фишера |
||
+ | * Практические задания на R |
||
+ | * Логистическая регрессия и непараметрические методы''' |
||
+ | * Логистическая регрессия: модели без предикторов и с предикторами |
||
+ | * Взаимодействие номинативных предикторов |
||
+ | * Непараметрический анализ |
||
+ | '''Кластерный анализ и метод главных компонент''' |
||
+ | * Кластерный анализ методом k - средних |
||
+ | * Может ли кластерный анализ ""ошибаться""? |
||
+ | * Иерархическая кластеризация |
||
+ | * Введение в метод анализа главных компонент |
||
+ | * Практические задания на R |
||
+ | |} |
||
+ | <!-- Formating do not touch --> |
||
+ | |style="text-align:center;"| |
||
+ | [[Stepik]] / [[Институт Биоинформатики]] |
||
+ | |style="text-align:center;"| |
||
+ | [[Материалы для старшей школы и студентов| Старшая школа и студенты]] |
||
+ | |style="text-align:center;"| |
||
+ | 6 часов видео, 100 тестов |
||
+ | <!-- ****************************** --> |
||
+ | <!-- Course 8 --> |
||
+ | |- |
||
+ | | |
||
+ | <!-- Course format do not touch --> |
||
+ | {| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;" |
||
+ | | style="border:1px solid white;"|<strong>[https://stepik.org/course/2152/promo Основы статистики.3]</strong> |
||
+ | |- |
||
+ | <!-- Course content format do not touch --> |
||
+ | | style="border:1px solid white;"| |
||
+ | <!-- Course content --> |
||
+ | * подробнее о линейной регрессии''' |
||
+ | * Линейная регрессия, линейность взаимосвязи |
||
+ | * Логарифмическая трансформация переменных |
||
+ | * Проблема гетероскедастичности |
||
+ | * Мультиколлинеарность |
||
+ | * Практические задания на R |
||
+ | '''Смешанные регрессионные модели''' |
||
+ | * Нарушение допущения о независимости наблюдений |
||
+ | * Смешанные регрессионные модели. Реализация в R |
||
+ | * Статистическая значимость, обобщённые модели и случайные эффекты |
||
+ | * Практические задания на R |
||
+ | '''Bootstrap''' |
||
+ | * Складной нож (jackknife) |
||
+ | * Bootstrap |
||
+ | * Практические задания на R |
||
+ | |} |
||
+ | <!-- Formating do not touch --> |
||
+ | |style="text-align:center;"| |
||
+ | [[Stepik]] / [[Институт Биоинформатики]] |
||
+ | |style="text-align:center;"| |
||
+ | [[Материалы для старшей школы и студентов| Старшая школа и студенты]] |
||
+ | |style="text-align:center;"| |
||
+ | 4 часа видео, 50 тестов |
||
+ | <!-- ****************************** --> |
||
+ | <!-- Course 9 --> |
||
+ | |- |
||
+ | | |
||
+ | <!-- Course format do not touch --> |
||
+ | {| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;" |
||
+ | | style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/znakomstvo-r-bazovaya-statistika Просто о статистике с R: часть 1. Знакомство с R и базовая статистика]</strong> |
||
+ | |- |
||
+ | <!-- Course content format do not touch --> |
||
+ | | style="border:1px solid white;"| |
||
+ | <!-- Course content --> |
||
+ | * Знакомство с R |
||
+ | * Работа с данными |
||
+ | * Графики с использованием ggplot2 |
||
+ | * Описательная статистика |
||
+ | * Тестирование гипотез |
||
+ | |} |
||
+ | <!-- Formating do not touch --> |
||
+ | |style="text-align:center;"| |
||
+ | [[Coursera]] / [[СПБГУ]] |
||
+ | |style="text-align:center;"| |
||
+ | [[Материалы для старшей школы и студентов| Старшая школа и студенты]] |
||
+ | |style="text-align:center;"| |
||
+ | 36 часов на выполнение |
||
+ | <!-- ****************************** --> |
||
+ | <!-- Course 10 --> |
||
+ | |- |
||
+ | | |
||
+ | <!-- Course format do not touch --> |
||
+ | {| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;" |
||
+ | | style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/lineynaya-regressiya Просто о статистике с R: часть 2. Линейная регрессия]</strong> |
||
+ | |- |
||
+ | <!-- Course content format do not touch --> |
||
+ | | style="border:1px solid white;"| |
||
+ | <!-- Course content --> |
||
+ | * Корреляционный анализ. Простая линейная регрессия |
||
+ | * Проверка значимости и валидности линейных моделей |
||
+ | * Краткое введение в мир линейной алгебры |
||
+ | * Множественная линейная регрессия |
||
+ | * Сравнение линейных моделей |
||
+ | |} |
||
+ | <!-- Formating do not touch --> |
||
+ | |style="text-align:center;"| |
||
+ | [[Coursera]] / [[СПБГУ]] |
||
+ | |style="text-align:center;"| |
||
+ | [[Материалы для старшей школы и студентов| Старшая школа и студенты]] |
||
+ | |style="text-align:center;"| |
||
+ | 34 часов на выполнение |
||
+ | <!-- ****************************** --> |
||
+ | <!-- Course 11 --> |
||
+ | |- |
||
+ | | |
||
+ | <!-- Course format do not touch --> |
||
+ | {| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;" |
||
+ | | style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/lineyniye-modeli-s-diskretnimi-prediktorami Просто о статистике с R: часть 3. Линейные модели с дискретными предикторами]</strong> |
||
+ | |- |
||
+ | <!-- Course content format do not touch --> |
||
+ | | style="border:1px solid white;"| |
||
+ | <!-- Course content --> |
||
+ | * Модели с дискретными и непрерывными предикторами |
||
+ | * Модели с разными значениями угла наклона для групп |
||
+ | * Однофакторный дисперсионный анализ |
||
+ | * Многофакторный дисперсионный анализ |
||
+ | |} |
||
+ | <!-- Formating do not touch --> |
||
+ | |style="text-align:center;"| |
||
+ | [[Coursera]] / [[СПБГУ]] |
||
+ | |style="text-align:center;"| |
||
+ | [[Материалы для старшей школы и студентов| Старшая школа и студенты]] |
||
+ | |style="text-align:center;"| |
||
+ | 22 часов на выполнение |
||
+ | <!-- ****************************** --> |
||
+ | <!-- Course 12 --> |
||
+ | |- |
||
+ | | |
||
+ | <!-- Course format do not touch --> |
||
+ | {| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;" |
||
+ | | style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/obobshchennye-linejnye-modeli Просто о статистике с R: часть 4. Обобщенные линейные модели]</strong> |
||
+ | |- |
||
+ | <!-- Course content format do not touch --> |
||
+ | | style="border:1px solid white;"| |
||
+ | <!-- Course content --> |
||
+ | * Знакомство с обобщенными линейными моделями |
||
+ | * Проблема выбора модели |
||
+ | * Обобщенные линейные модели для счетных данных |
||
+ | * Обобщенные линейные модели с бинарным откликом |
||
+ | |} |
||
+ | <!-- Formating do not touch --> |
||
+ | |style="text-align:center;"| |
||
+ | [[Coursera]] / [[СПБГУ]] |
||
+ | |style="text-align:center;"| |
||
+ | [[Материалы для старшей школы и студентов| Старшая школа и студенты]] |
||
+ | |style="text-align:center;"| |
||
+ | 17 часов на выполнение |
||
+ | <!-- ****************************** --> |
||
+ | <!-- Course 13 --> |
||
+ | |- |
||
+ | | |
||
+ | <!-- Course format do not touch --> |
||
+ | {| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;" |
||
+ | | style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/smeshannye-lineynye-modeli Просто о статистике с R: часть 5. Смешанные линейные модели]</strong> |
||
+ | |- |
||
+ | <!-- Course content format do not touch --> |
||
+ | | style="border:1px solid white;"| |
||
+ | <!-- Course content --> |
||
+ | * Знакомство со смешанными линейными моделями |
||
+ | * Моделирование структуры дисперсии в смешанных моделях |
||
+ | * Смешанные линейные модели для счетных данных |
||
+ | * Смешанные линейные модели для бинарных данных |
||
+ | |} |
||
+ | <!-- Formating do not touch --> |
||
+ | |style="text-align:center;"| |
||
+ | [[Coursera]] / [[СПБГУ]] |
||
+ | |style="text-align:center;"| |
||
+ | [[Материалы для старшей школы и студентов| Старшая школа и студенты]] |
||
+ | |style="text-align:center;"| |
||
+ | 17 часов на выполнение |
||
+ | <!-- ****************************** --> |
||
+ | <!-- Table ending - do not touch --> |
||
+ | |} |
||
+ | <!-- ****************************** --> |
||
==BigData== |
==BigData== |
Версия 23:37, 23 марта 2020
Содержание
Статистика
СтатистикаНазвание курса | Источник / Организация | Источник | Длина курса | ||
---|---|---|---|---|---|
|
11 часов видео, 200 тестов | ||||
|
9 часов на выполнение | ||||
|
8 часов на выполнение | ||||
|
7 часов на выполнение | ||||
|
5 часов на выполнение | ||||
|
4 часа видео, 100 тестов | ||||
|
6 часов видео, 100 тестов | ||||
|
4 часа видео, 50 тестов | ||||
|
36 часов на выполнение | ||||
|
34 часов на выполнение | ||||
|
22 часов на выполнение | ||||
|
17 часов на выполнение | ||||
|
17 часов на выполнение |