Анализ данных и машинное обучение: различия между версиями

Материал из Кружковое движение
Перейти к навигации Перейти к поиску
Строка 375: Строка 375:
   
 
==BigData==
 
==BigData==
  +
  +
<!-- ****************************** -->
  +
<!-- Table Format - do not touch -->
  +
{| class="a" style="width:100%;" border="1" style="width:100%; border-collapse:collapse"|+
  +
<!-- Table name -->
  +
'''Big Data'''
  +
<!-- Table headers - do not touch -->
  +
! style="background: #EAECF0;"| Название курса||style="background: #EAECF0;"|Источник / Организация||style="background: #EAECF0;"|Источник||style="background: #EAECF0;"|Длина курса
  +
<!-- ****************************** -->
  +
<!-- Course 1 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://stepik.org/course/1612/promo Управление вычислениями]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
'''контейнеризация и Docker'''
  +
* Знакомство с Docker
  +
* Работа с файлами в контейнерах Docker
  +
* Взаимодействие контейнеров Docker
  +
* Работа с образами Docker
  +
* Технологические основы и роль контейнеризации
  +
'''Workflows и Pipelines'''
  +
* Работа с данными и пайплайны
  +
* Инструменты пайплайнинга и подходы к описанию пайплайнов
  +
* Snakemake: имплицитное описание графа анализа, создание пайплайнов
  +
'''Common workflow language'''
  +
* Знакомство с CWL
  +
* Описание инструментов с использованием CWL
  +
* CWL: полезные компоненты, создание пайплайнов
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Stepik]] / [[Институт Биоинформатики]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
2 часа видео, 50 тестов
  +
<!-- ****************************** -->
  +
<!-- Course 2 -->
  +
|-
  +
|
  +
<!-- Course format do not touch -->
  +
{| role="presentation" class="a mw-collapsible mw-collapsed" style="border:1px solid white;"
  +
| style="border:1px solid white;"|<strong>[https://stepik.org/course/150/promo Hadoop. Система для обработки больших объемов данных]</strong>
  +
|-
  +
<!-- Course content format do not touch -->
  +
| style="border:1px solid white;"|
  +
<!-- Course content -->
  +
'''Введение'''
  +
* Что такое Hadoop?
  +
'''Распределенная файловая система HDFS'''
  +
* Архитектура HDFS
  +
* Shell-команды
  +
* Java API
  +
'''MapReduce'''
  +
* Парадигма MapReduce, фреймворк
  +
* Java API
  +
* Hadoop Streaming
  +
* Алгоритмы на MapReduce
  +
* Реляционные функции
  +
* Расчет TF-IDF
  +
'''алгоритмы на графах в MapReduce'''
  +
* Графы в MapReduce
  +
* Поиск кратчайшего пути в графе
  +
* PageRank
  +
* Проблемы MR-алгоритмов на графах
  +
'''Pig и Hive'''
  +
* Pig, основные операторы PigLatin
  +
* Hive
  +
* Pig vs Hive
  +
'''NoSQL базы данных HBase и Cassandra'''
  +
* Способы хранения данных, NoSQL
  +
* HBase
  +
* Cassandra
  +
'''Spark'''
  +
* Основные понятия Spark, операторы, фреймворк
  +
'''Yarn.MapReduce2.0'''
  +
* Что такое YARN?
  +
* Компоненты YARN
  +
* MapReduce 2.0
  +
|}
  +
<!-- Formating do not touch -->
  +
|style="text-align:center;"|
  +
[[Stepik]] / [[mail.ru]]
  +
|style="text-align:center;"|
  +
[[Материалы для старшей школы и студентов| Старшая школа и студенты]]
  +
|style="text-align:center;"|
  +
12 часов видео, 250 тестов
  +
<!-- ****************************** -->
  +
<!-- Table ending - do not touch -->
  +
|}
  +
<!-- ****************************** -->
   
 
==Machine learning==
 
==Machine learning==

Версия 23:37, 23 марта 2020

Статистика

Статистика
Название курса Источник / Организация Источник Длина курса

Stepik / CSC

Старшая школа и студенты

11 часов видео, 200 тестов

Coursera / НГУ

Старшая школа и студенты

9 часов на выполнение

Coursera / НГУ

Старшая школа и студенты

8 часов на выполнение

Coursera / НГУ

Старшая школа и студенты

7 часов на выполнение

Coursera / НГУ

Старшая школа и студенты

5 часов на выполнение

Stepik / Институт Биоинформатики

Старшая школа и студенты

4 часа видео, 100 тестов

Stepik / Институт Биоинформатики

Старшая школа и студенты

6 часов видео, 100 тестов

Stepik / Институт Биоинформатики

Старшая школа и студенты

4 часа видео, 50 тестов

Coursera / СПБГУ

Старшая школа и студенты

36 часов на выполнение

Coursera / СПБГУ

Старшая школа и студенты

34 часов на выполнение

Coursera / СПБГУ

Старшая школа и студенты

22 часов на выполнение

Coursera / СПБГУ

Старшая школа и студенты

17 часов на выполнение

Coursera / СПБГУ

Старшая школа и студенты

17 часов на выполнение

BigData

Big Data
Название курса Источник / Организация Источник Длина курса

Stepik / Институт Биоинформатики

Старшая школа и студенты

2 часа видео, 50 тестов

Stepik / mail.ru

Старшая школа и студенты

12 часов видео, 250 тестов

Machine learning

Применения ML