Материал из Кружковое движение
Перейти к навигации
Перейти к поиску
Статистика
Статистика
Название курса |
Источник / Организация |
Источник |
Длина курса
|
Математическая статистика
|
Выборка, описательная статистика
- Общие рекомендации. Моделирование
- Краткий обзор понятий теории вероятностей
- Выборка. Выборочное пространство
- Описательная статистика
Точечные оценки, свойства и методы построения
- Точечные оценки и их свойства
- Методы построения точечных оценок
Доверительные интервалы, стратифицированные выборки
- Стратифицированные выборки
- Доверительные интервалы
Статистические гипотезы, параметрические критерии
- Лемма Неймана-Пирсона
- Критерии о параметрах нормального распределения
- Критерии о параметрах нормального и биномиального распределений
Критерии однородности
- Параметрические критерии однородности
- Непараметрические критерии однородности
- Однофакторный дисперсионный анализ
Критерии согласия, таблицы сопряжения
- Критерии согласия хи-квадрат и Колмогорова
- Критерии нормальности
- Таблицы сопряженности
Регрессионный анализ
- Множественная линейная регрессия
- Анализ остатков, корреляционный анализ
|
|
Stepik / CSC
|
Старшая школа и студенты
|
11 часов видео, 200 тестов
|
Анализ данных: часть 1. Введение в данные
|
- Основы теории вероятностей
- Основы статистического анализа выборочных данных
- Графический анализ данных
- Формирование выборок и подготовка данных
- Практические задания
|
|
Coursera / НГУ
|
Старшая школа и студенты
|
9 часов на выполнение
|
|
Coursera / НГУ
|
Старшая школа и студенты
|
8 часов на выполнение
|
|
Coursera / НГУ
|
Старшая школа и студенты
|
7 часов на выполнение
|
|
Coursera / НГУ
|
Старшая школа и студенты
|
5 часов на выполнение
|
Основы статистики.1
|
- Введение
- Генеральная совокупность и выборка
- Нормальное распределение
- Центральная предельная теорема
- Идея статистического вывода, p-уровень значимости
Сравнение средних
- T-распределение
- Проверка распределения на нормальность, QQ-Plot
- Однофакторный дисперсионный анализ
- ANOVA
Корреляция и регрессия
- Корреляция
- Регрессия
- Гипотеза о значимости взаимосвязи и коэффициент детерминации
- Регрессионный анализ
- Классификация: логистическая регрессия и кластерный анализ
|
|
Stepik / Институт Биоинформатики
|
Старшая школа и студенты
|
4 часа видео, 100 тестов
|
Основы статистики.2
|
- Анализ номинативных данных
- Распределение Хи-квадрат Пирсона
- Анализ таблиц сопряженности
- Точный критерий Фишера
- Практические задания на R
- Логистическая регрессия и непараметрические методы
- Логистическая регрессия: модели без предикторов и с предикторами
- Взаимодействие номинативных предикторов
- Непараметрический анализ
Кластерный анализ и метод главных компонент
- Кластерный анализ методом k - средних
- Может ли кластерный анализ ""ошибаться""?
- Иерархическая кластеризация
- Введение в метод анализа главных компонент
- Практические задания на R
|
|
Stepik / Институт Биоинформатики
|
Старшая школа и студенты
|
6 часов видео, 100 тестов
|
Основы статистики.3
|
- подробнее о линейной регрессии
- Линейная регрессия, линейность взаимосвязи
- Логарифмическая трансформация переменных
- Проблема гетероскедастичности
- Мультиколлинеарность
- Практические задания на R
Смешанные регрессионные модели
- Нарушение допущения о независимости наблюдений
- Смешанные регрессионные модели. Реализация в R
- Статистическая значимость, обобщённые модели и случайные эффекты
- Практические задания на R
Bootstrap
- Складной нож (jackknife)
- Bootstrap
- Практические задания на R
|
|
Stepik / Институт Биоинформатики
|
Старшая школа и студенты
|
4 часа видео, 50 тестов
|
|
Coursera / СПБГУ
|
Старшая школа и студенты
|
36 часов на выполнение
|
|
Coursera / СПБГУ
|
Старшая школа и студенты
|
34 часов на выполнение
|
|
Coursera / СПБГУ
|
Старшая школа и студенты
|
22 часов на выполнение
|
|
Coursera / СПБГУ
|
Старшая школа и студенты
|
17 часов на выполнение
|
|
Coursera / СПБГУ
|
Старшая школа и студенты
|
17 часов на выполнение
|
BigData
Big Data
Название курса |
Источник / Организация |
Источник |
Длина курса
|
Управление вычислениями
|
контейнеризация и Docker
- Знакомство с Docker
- Работа с файлами в контейнерах Docker
- Взаимодействие контейнеров Docker
- Работа с образами Docker
- Технологические основы и роль контейнеризации
Workflows и Pipelines
- Работа с данными и пайплайны
- Инструменты пайплайнинга и подходы к описанию пайплайнов
- Snakemake: имплицитное описание графа анализа, создание пайплайнов
Common workflow language
- Знакомство с CWL
- Описание инструментов с использованием CWL
- CWL: полезные компоненты, создание пайплайнов
|
|
Stepik / Институт Биоинформатики
|
Старшая школа и студенты
|
2 часа видео, 50 тестов
|
Hadoop. Система для обработки больших объемов данных
|
Введение
Распределенная файловая система HDFS
- Архитектура HDFS
- Shell-команды
- Java API
MapReduce
- Парадигма MapReduce, фреймворк
- Java API
- Hadoop Streaming
- Алгоритмы на MapReduce
- Реляционные функции
- Расчет TF-IDF
алгоритмы на графах в MapReduce
- Графы в MapReduce
- Поиск кратчайшего пути в графе
- PageRank
- Проблемы MR-алгоритмов на графах
Pig и Hive
- Pig, основные операторы PigLatin
- Hive
- Pig vs Hive
NoSQL базы данных HBase и Cassandra
- Способы хранения данных, NoSQL
- HBase
- Cassandra
Spark
- Основные понятия Spark, операторы, фреймворк
Yarn.MapReduce2.0
- Что такое YARN?
- Компоненты YARN
- MapReduce 2.0
|
|
Stepik / mail.ru
|
Старшая школа и студенты
|
12 часов видео, 250 тестов
|
Machine learning
Machine learning
Название курса |
Источник / Организация |
Источник |
Длина курса
|
Введение в Datascience и машинное обучение
|
Введение
- Биг дэйта, дип машин лернинг, основные понятия
- Модель, нет, не супермодель, начнем с дерева
- Фильтрация данных
- Группировка и агрегация, ничего, скоро привыкнем
- Визуализация, seaborn, почти также круто, как ggplot2
решающие деревья
- Какого музыканта Beatles я загадал или entropy reduction
- Titanic: Machine Learning from Disaster
- Обучение, переобучение, недообучение и кросвалидация
- Последний джедай или метрики качества модели
- Подбор параметров и ROC and Roll
- Практика, Scikit-learn, fit, predict, you are awesome
Random forest, нейронные сети
- Снова возвращаемся к деревьям
- Random forest
- Зачем знать что-то еще, если есть Random Forest?
- Секретный гость
- И на Марсе будут яблони цвести
- Бонусный урок - нейроэволюция
- Бонусный урок - трюки в Pandas
Stepik ML contest
|
|
Stepik / Институт Биоинформатики
|
Старшая школа и студенты
|
9 часов видео, 100 заданий
|
Введение в науку о данных
|
- Введение
- Математический инструментарий науки о данных
- Программный инструментарий науки о данных
- Машинное обучение: обучение с учителем
- Машинное обучение: обучение без учителя
|
|
Coursera / СПБГУ
|
Старшая школа и студенты
|
17 часов на выполнение
|
Введение в машинное обучение
|
- Знакомство с анализом данных и машинным обучением
- Логические методы классификации
- Метрические методы классификации
- Линейные методы классификации
- Метод опорных векторов и логистическая регрессия
- Метрики качества классификации
- Линейная регрессия
- Понижение размерности и метод главных компонент
- Композиции алгоритмов
- Нейронные сети
- Кластеризация и визуализация
- Частичное обучение
- Машинное обучение в прикладных задачах
|
|
Coursera / Яндекс и ВШЭ
|
Старшая школа и студенты
|
35 часов на выполнение
|
|
Coursera / МФТИ и Яндекс
|
Старшая школа и студенты
|
29 часов на выполнение
|
|
Coursera / МФТИ и Яндекс
|
Старшая школа и студенты
|
43 часа на выполнение
|
|
Coursera / МФТИ и Яндекс
|
Старшая школа и студенты
|
25 часов на выполнение
|
|
Coursera / МФТИ и Яндекс
|
Старшая школа и студенты
|
39 часов на выполнение
|
|
Coursera / МФТИ и Яндекс
|
Старшая школа и студенты
|
26 часов на выполнение
|
|
Coursera / МФТИ и Яндекс
|
Старшая школа и студенты
|
26 часов на выполнение
|
Нейронные сети
|
Основы линейной алгебры
- Опциональный ликбез по линейной алгебре: векторы, матрицы
- NumPy: основы
- Линейная алгебра в деле
Перцептрон и градиентный спуск
- Нейроны: настоящие и искусственные
- Перцептрон, больше искусственных нейронов!
- Градиентный спуск
- Однослойные модели
Алгоритм обратного распространения ошибки
- Многослойный перцептрон
- Алгоритм обратного распространения ошибки
- Целевые функции
Мониторинг состояния сети
- Мониторинг состояния сети
- Визуализация
Проект по нейронной сети для управления автомобилем
|
|
Stepik / Институт Биоинформатики
|
Старшая школа и студенты
|
6 часов, 100 тестов
|
Машинное обучение
|
- Введение в машинное обучение и основные понятия статистики
- Восстановление пропущенных значений
- Поиск выбросов и аномалий
- Кластеризация
- Задача предсказания, линейная регрессия
- Классификация, kNN, кросс-валидация
- Деревья в машинном обучении
- Линейные классификаторы
- Вероятностные алгоритмы. Наивный Байес
- Ансамбли алгоритмов
- Отбор признаков (feature selection) и объектов
|
|
Stepik / ОмГТУ
|
Старшая школа и студенты
|
7 часов видео, 50 тестов
|
Применения ML