Материал из Кружковое движение
Перейти к навигации
Перейти к поиску
Статистика
СтатистикаНазвание курса |
Источник / Организация |
Источник |
Длина курса
|
---|
Математическая статистика
|
Выборка, описательная статистика
- Общие рекомендации. Моделирование
- Краткий обзор понятий теории вероятностей
- Выборка. Выборочное пространство
- Описательная статистика
Точечные оценки, свойства и методы построения
- Точечные оценки и их свойства
- Методы построения точечных оценок
Доверительные интервалы, стратифицированные выборки
- Стратифицированные выборки
- Доверительные интервалы
Статистические гипотезы, параметрические критерии
- Лемма Неймана-Пирсона
- Критерии о параметрах нормального распределения
- Критерии о параметрах нормального и биномиального распределений
Критерии однородности
- Параметрические критерии однородности
- Непараметрические критерии однородности
- Однофакторный дисперсионный анализ
Критерии согласия, таблицы сопряжения
- Критерии согласия хи-квадрат и Колмогорова
- Критерии нормальности
- Таблицы сопряженности
Регрессионный анализ
- Множественная линейная регрессия
- Анализ остатков, корреляционный анализ
|
|
Stepik / CSC
|
Старшая школа и студенты
|
11 часов видео, 200 тестов
|
Анализ данных: часть 1. Введение в данные
|
- Основы теории вероятностей
- Основы статистического анализа выборочных данных
- Графический анализ данных
- Формирование выборок и подготовка данных
- Практические задания
|
|
Coursera / НГУ
|
Старшая школа и студенты
|
9 часов на выполнение
|
|
Coursera / НГУ
|
Старшая школа и студенты
|
8 часов на выполнение
|
|
Coursera / НГУ
|
Старшая школа и студенты
|
7 часов на выполнение
|
|
Coursera / НГУ
|
Старшая школа и студенты
|
5 часов на выполнение
|
Основы статистики.1
|
- Введение
- Генеральная совокупность и выборка
- Нормальное распределение
- Центральная предельная теорема
- Идея статистического вывода, p-уровень значимости
Сравнение средних
- T-распределение
- Проверка распределения на нормальность, QQ-Plot
- Однофакторный дисперсионный анализ
- ANOVA
Корреляция и регрессия
- Корреляция
- Регрессия
- Гипотеза о значимости взаимосвязи и коэффициент детерминации
- Регрессионный анализ
- Классификация: логистическая регрессия и кластерный анализ
|
|
Stepik / Институт Биоинформатики
|
Старшая школа и студенты
|
4 часа видео, 100 тестов
|
Основы статистики.2
|
- Анализ номинативных данных
- Распределение Хи-квадрат Пирсона
- Анализ таблиц сопряженности
- Точный критерий Фишера
- Практические задания на R
- Логистическая регрессия и непараметрические методы
- Логистическая регрессия: модели без предикторов и с предикторами
- Взаимодействие номинативных предикторов
- Непараметрический анализ
Кластерный анализ и метод главных компонент
- Кластерный анализ методом k - средних
- Может ли кластерный анализ ""ошибаться""?
- Иерархическая кластеризация
- Введение в метод анализа главных компонент
- Практические задания на R
|
|
Stepik / Институт Биоинформатики
|
Старшая школа и студенты
|
6 часов видео, 100 тестов
|
Основы статистики.3
|
- подробнее о линейной регрессии
- Линейная регрессия, линейность взаимосвязи
- Логарифмическая трансформация переменных
- Проблема гетероскедастичности
- Мультиколлинеарность
- Практические задания на R
Смешанные регрессионные модели
- Нарушение допущения о независимости наблюдений
- Смешанные регрессионные модели. Реализация в R
- Статистическая значимость, обобщённые модели и случайные эффекты
- Практические задания на R
Bootstrap
- Складной нож (jackknife)
- Bootstrap
- Практические задания на R
|
|
Stepik / Институт Биоинформатики
|
Старшая школа и студенты
|
4 часа видео, 50 тестов
|
|
Coursera / СПБГУ
|
Старшая школа и студенты
|
36 часов на выполнение
|
|
Coursera / СПБГУ
|
Старшая школа и студенты
|
34 часов на выполнение
|
|
Coursera / СПБГУ
|
Старшая школа и студенты
|
22 часов на выполнение
|
|
Coursera / СПБГУ
|
Старшая школа и студенты
|
17 часов на выполнение
|
|
Coursera / СПБГУ
|
Старшая школа и студенты
|
17 часов на выполнение
|
BigData
Big DataНазвание курса |
Источник / Организация |
Источник |
Длина курса
|
---|
Управление вычислениями
|
контейнеризация и Docker
- Знакомство с Docker
- Работа с файлами в контейнерах Docker
- Взаимодействие контейнеров Docker
- Работа с образами Docker
- Технологические основы и роль контейнеризации
Workflows и Pipelines
- Работа с данными и пайплайны
- Инструменты пайплайнинга и подходы к описанию пайплайнов
- Snakemake: имплицитное описание графа анализа, создание пайплайнов
Common workflow language
- Знакомство с CWL
- Описание инструментов с использованием CWL
- CWL: полезные компоненты, создание пайплайнов
|
|
Stepik / Институт Биоинформатики
|
Старшая школа и студенты
|
2 часа видео, 50 тестов
|
Hadoop. Система для обработки больших объемов данных
|
Введение
Распределенная файловая система HDFS
- Архитектура HDFS
- Shell-команды
- Java API
MapReduce
- Парадигма MapReduce, фреймворк
- Java API
- Hadoop Streaming
- Алгоритмы на MapReduce
- Реляционные функции
- Расчет TF-IDF
алгоритмы на графах в MapReduce
- Графы в MapReduce
- Поиск кратчайшего пути в графе
- PageRank
- Проблемы MR-алгоритмов на графах
Pig и Hive
- Pig, основные операторы PigLatin
- Hive
- Pig vs Hive
NoSQL базы данных HBase и Cassandra
- Способы хранения данных, NoSQL
- HBase
- Cassandra
Spark
- Основные понятия Spark, операторы, фреймворк
Yarn.MapReduce2.0
- Что такое YARN?
- Компоненты YARN
- MapReduce 2.0
|
|
Stepik / mail.ru
|
Старшая школа и студенты
|
12 часов видео, 250 тестов
|
Machine learning
Применения ML