Анализ данных и машинное обучение: различия между версиями

Материал из Кружковое движение
Перейти к навигации Перейти к поиску
(Новая страница: «==Статистика== ==BigData== ==Machine learning== ==Применения ML==»)
 
Строка 1: Строка 1:
 
==Статистика==
 
==Статистика==
  +
  +
<!-- ****************************** -->
  +
<!-- Table Format - do not touch -->
  +
{| class="a" style="width:100%;" border="1" style="width:100%; border-collapse:collapse"|+
  +
<!-- Table name -->
  +
'''Статистика'''
  +
<!-- Table headers - do not touch -->
  +
! style="background: #EAECF0;"| Название курса||style="background: #EAECF0;"|Источник / Организация||style="background: #EAECF0;"|Источник||style="background: #EAECF0;"|Длина курса
  +
<!-- ****************************** -->
  +
<!-- Course 1 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://stepik.org/course/326/promo Математическая статистика]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
'''Выборка, описательная статистика'''
  +
* Общие рекомендации. Моделирование
  +
* Краткий обзор понятий теории вероятностей
  +
* Выборка. Выборочное пространство
  +
* Описательная статистика
  +
'''Точечные оценки, свойства и методы построения'''
  +
* Точечные оценки и их свойства
  +
* Методы построения точечных оценок
  +
'''Доверительные интервалы, стратифицированные выборки'''
  +
* Стратифицированные выборки
  +
* Доверительные интервалы
  +
'''Статистические гипотезы, параметрические критерии'''
  +
* Лемма Неймана-Пирсона
  +
* Критерии о параметрах нормального распределения
  +
* Критерии о параметрах нормального и биномиального распределений
  +
'''Критерии однородности'''
  +
* Параметрические критерии однородности
  +
* Непараметрические критерии однородности
  +
* Однофакторный дисперсионный анализ
  +
'''Критерии согласия, таблицы сопряжения'''
  +
* Критерии согласия хи-квадрат и Колмогорова
  +
* Критерии нормальности
  +
* Таблицы сопряженности
  +
'''Регрессионный анализ'''
  +
* Множественная линейная регрессия
  +
* Анализ остатков, корреляционный анализ
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Stepik]] / [[CSC]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
11 часов видео, 200 тестов
  +
<!-- ****************************** -->
  +
<!-- Course 2 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/vvedeniye-dannyye Анализ данных: часть 1. Введение в данные]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Основы теории вероятностей
  +
* Основы статистического анализа выборочных данных
  +
* Графический анализ данных
  +
* Формирование выборок и подготовка данных
  +
* Практические задания
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Coursera]] / [[НГУ]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
9 часов на выполнение
  +
<!-- ****************************** -->
  +
<!-- Course 3 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/statisticheskikh-vzaimosvyazey Анализ данных: часть 2. Исследование статистических взаимосвязей]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Введение в статистические критерии
  +
* Критерии согласия
  +
* Поиск взаимосвязей в данных и оценка их статистической значимости
  +
* Линейная регрессия
  +
* Итоговое задание
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Coursera]] / [[НГУ]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
8 часов на выполнение
  +
<!-- ****************************** -->
  +
<!-- Course 4 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/sravneniye-sozdaniye-grupp Анализ данных: часть 3. Сравнение и создание групп]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Одновыборочные и двухвыборочные критерии
  +
* Сравнение нескольких выборок
  +
* Введение в кластерный анализ
  +
* Итерационные методы кластерного анализа
  +
* Итоговое задание
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Coursera]] / [[НГУ]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
7 часов на выполнение
  +
<!-- ****************************** -->
  +
<!-- Course 5 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/trendy-klassifikatsii Анализ данных: часть 4. Тренды и классификации]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Анализ временных рядов
  +
* Прогноз временных рядов
  +
* Факторный анализ
  +
* Классификация
  +
* Итоговое задание
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Coursera]] / [[НГУ]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
5 часов на выполнение
  +
<!-- ****************************** -->
  +
<!-- Course 6 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://stepik.org/course/76/promo Основы статистики.1]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Введение'''
  +
* Генеральная совокупность и выборка
  +
* Нормальное распределение
  +
* Центральная предельная теорема
  +
* Идея статистического вывода, p-уровень значимости
  +
'''Сравнение средних'''
  +
* T-распределение
  +
* Проверка распределения на нормальность, QQ-Plot
  +
* Однофакторный дисперсионный анализ
  +
* ANOVA
  +
'''Корреляция и регрессия'''
  +
* Корреляция
  +
* Регрессия
  +
* Гипотеза о значимости взаимосвязи и коэффициент детерминации
  +
* Регрессионный анализ
  +
* Классификация: логистическая регрессия и кластерный анализ
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Stepik]] / [[Институт Биоинформатики]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
4 часа видео, 100 тестов
  +
<!-- ****************************** -->
  +
<!-- Course 7 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://stepik.org/course/524/promo Основы статистики.2]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Анализ номинативных данных'''
  +
* Распределение Хи-квадрат Пирсона
  +
* Анализ таблиц сопряженности
  +
* Точный критерий Фишера
  +
* Практические задания на R
  +
* Логистическая регрессия и непараметрические методы'''
  +
* Логистическая регрессия: модели без предикторов и с предикторами
  +
* Взаимодействие номинативных предикторов
  +
* Непараметрический анализ
  +
'''Кластерный анализ и метод главных компонент'''
  +
* Кластерный анализ методом k - средних
  +
* Может ли кластерный анализ ""ошибаться""?
  +
* Иерархическая кластеризация
  +
* Введение в метод анализа главных компонент
  +
* Практические задания на R
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Stepik]] / [[Институт Биоинформатики]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
6 часов видео, 100 тестов
  +
<!-- ****************************** -->
  +
<!-- Course 8 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://stepik.org/course/2152/promo Основы статистики.3]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* подробнее о линейной регрессии'''
  +
* Линейная регрессия, линейность взаимосвязи
  +
* Логарифмическая трансформация переменных
  +
* Проблема гетероскедастичности
  +
* Мультиколлинеарность
  +
* Практические задания на R
  +
'''Смешанные регрессионные модели'''
  +
* Нарушение допущения о независимости наблюдений
  +
* Смешанные регрессионные модели. Реализация в R
  +
* Статистическая значимость, обобщённые модели и случайные эффекты
  +
* Практические задания на R
  +
'''Bootstrap'''
  +
* Складной нож (jackknife)
  +
* Bootstrap
  +
* Практические задания на R
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Stepik]] / [[Институт Биоинформатики]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
4 часа видео, 50 тестов
  +
<!-- ****************************** -->
  +
<!-- Course 9 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/znakomstvo-r-bazovaya-statistika Просто о статистике с R: часть 1. Знакомство с R и базовая статистика]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Знакомство с R
  +
* Работа с данными
  +
* Графики с использованием ggplot2
  +
* Описательная статистика
  +
* Тестирование гипотез
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Coursera]] / [[СПБГУ]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
36 часов на выполнение
  +
<!-- ****************************** -->
  +
<!-- Course 10 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/lineynaya-regressiya Просто о статистике с R: часть 2. Линейная регрессия]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Корреляционный анализ. Простая линейная регрессия
  +
* Проверка значимости и валидности линейных моделей
  +
* Краткое введение в мир линейной алгебры
  +
* Множественная линейная регрессия
  +
* Сравнение линейных моделей
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Coursera]] / [[СПБГУ]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
34 часов на выполнение
  +
<!-- ****************************** -->
  +
<!-- Course 11 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/lineyniye-modeli-s-diskretnimi-prediktorami Просто о статистике с R: часть 3. Линейные модели с дискретными предикторами]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Модели с дискретными и непрерывными предикторами
  +
* Модели с разными значениями угла наклона для групп
  +
* Однофакторный дисперсионный анализ
  +
* Многофакторный дисперсионный анализ
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Coursera]] / [[СПБГУ]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
22 часов на выполнение
  +
<!-- ****************************** -->
  +
<!-- Course 12 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/obobshchennye-linejnye-modeli Просто о статистике с R: часть 4. Обобщенные линейные модели]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Знакомство с обобщенными линейными моделями
  +
* Проблема выбора модели
  +
* Обобщенные линейные модели для счетных данных
  +
* Обобщенные линейные модели с бинарным откликом
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Coursera]] / [[СПБГУ]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
17 часов на выполнение
  +
<!-- ****************************** -->
  +
<!-- Course 13 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://ru.coursera.org/learn/smeshannye-lineynye-modeli Просто о статистике с R: часть 5. Смешанные линейные модели]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
* Знакомство со смешанными линейными моделями
  +
* Моделирование структуры дисперсии в смешанных моделях
  +
* Смешанные линейные модели для счетных данных
  +
* Смешанные линейные модели для бинарных данных
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Coursera]] / [[СПБГУ]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
17 часов на выполнение
  +
<!-- ****************************** -->
  +
<!-- Table ending - do not touch -->
  +
|}
  +
<!-- ****************************** -->
   
 
==BigData==
 
==BigData==

Версия 23:37, 23 марта 2020

Статистика

Статистика
Название курса Источник / Организация Источник Длина курса

Stepik / CSC

Старшая школа и студенты

11 часов видео, 200 тестов

Coursera / НГУ

Старшая школа и студенты

9 часов на выполнение

Coursera / НГУ

Старшая школа и студенты

8 часов на выполнение

Coursera / НГУ

Старшая школа и студенты

7 часов на выполнение

Coursera / НГУ

Старшая школа и студенты

5 часов на выполнение

Stepik / Институт Биоинформатики

Старшая школа и студенты

4 часа видео, 100 тестов

Stepik / Институт Биоинформатики

Старшая школа и студенты

6 часов видео, 100 тестов

Stepik / Институт Биоинформатики

Старшая школа и студенты

4 часа видео, 50 тестов

Coursera / СПБГУ

Старшая школа и студенты

36 часов на выполнение

Coursera / СПБГУ

Старшая школа и студенты

34 часов на выполнение

Coursera / СПБГУ

Старшая школа и студенты

22 часов на выполнение

Coursera / СПБГУ

Старшая школа и студенты

17 часов на выполнение

Coursera / СПБГУ

Старшая школа и студенты

17 часов на выполнение

BigData

Machine learning

Применения ML