Перейти до головного змісту

Аналіз даних та статистичне виведення на мові R

ПРО ЦЕЙ КУРС

Будь-яке вивчення науки про дані починається з розуміння чим є насправді дані. Математична статистика та найбільш сучасна і популярна мова програмування R - це базовий інструментарій, яким повинен володіти будь-хто в галузі науки про дані. Даний курс присвячений основам отримання результатів, які ґрунтуються на статистичному виведенні. В якості практичної складової використовується мова R.

Це є базовий курс для майбутніх аналітиків. Завдяки отриманим знанням вони зможуть проводити первинний статистичний аналіз даних, висувати гіпотези та оцінювати їх на основі зібраних даних. Також мовою програмування обрана мова R, яка є найбільш вживаною мовою для статистиків на сьогодні.

План курсу:

Тиждень 1

  • Аналіз даних
  • Статистика
  • Типи даних
  • Центральна тенденція
  • Візуальний аналіз даних
  • Трактування результатів

Тиждень 2

  • Коробчата діаграма
  • Інтерквартильний розмах
  • Приклад використання візуального аналізу для очищення даних
  • Дисперсія
  • Середньоквадратичне відхилення
  • Вступ до R

Тиждень 3

  • Теорія ймовірності
  • Ймовірність однієї події
  • Ймовірність кількох подій
  • Умовні ймовірності
  • Дерева прийняття рішень
  • Теорема Байеса
  • Біноміальний розподіл
  • Нормальний розподіл
  • Z-стандартизація
  • Коваріація
  • Кореляція
  • Регресія

Тиждень 4

  • Вивідна статистика
  • Вибірка
  • Принципи формування репрезентативної вибірки
  • Центральна гранична теорема
  • Довірчий інтервал для пропорції
  • Рівень довіри
  • Розмір вибірки
  • Довірчий інтервал для середнього значення
  • Покроковий план побудови довірчого інтервалу

Тиждень 5

  • Тестування гіпотез
  • Тестування гіпотез для середнього значення
  • p-value
  • Статистична значущість
  • Тестування гіпотез для пропорції
  • Покроковий план тестування гіпотез

IRF

Курс «Аналіз даних та статистичне виведення на мові R» виготовлено в межах "Ініціативи з розвитку аналітичних центрів в Україні", яку виконує МФ «Відродження» у партнерстві з Фондом розвитку аналітичних центрів (TTF) за фінансової підтримки посольства Швеції в Україні. Думки та позиції викладені в цьому курсі є позицією автора та необов'язково відображають позицію уряду Швеції.

Довжина курсу

5 тижнів.

Початок курсу

17 жовтня 2016.

ВИМОГИ ДО ЗНАНЬ СТУДЕНТІВ

Знання математики на рівні старших класів середньої школи.

ВИКЛАДАЧ

Анастасія Корнілова

Фахівець з даних (data scientist) Ciklum (Львів). До того: V.I.Tech, Softserve - data scientist, Cahootsy - lead data analyst. Загальний досвід в аналітиці даних - 4 роки, загалом в IT - 9 років. Веде власні блоги: energyfirefox.blogspot.com, datascientistdiary.blogspot.com.

Поширені питання

Курс безкоштовний?

Курс є повністю безкоштовним. Викладач може рекомендувати навчальну літературу, щоб Ви могли глибше вивчити ту чи іншу тему, але доступних в рамках курсу матеріалів буде достатньо для успішного його завершення. Все що Вам знадобиться,– доступ до мережі Інтернет на швидкості, достатній для перегляду відеолекцій.

Чи зможу я отримати сертифікат по завершенню цього курсу?

Так! Успішно складіть всі завдання курсу й отримайте сертифікат про його завершення за підписом викладачки!

В який час будуть проходити заняття?

Відеолекції, завдання та форум будуть доступні в будь-який час протягом курсу.

  1. Старт

    Жовт. 2016
Внести до списку