Основы анализа данных

Анализ данных с помощью языков SQL и Python

Объём данных, хранящихся в базах данных, в коммерческих структурах, от небольших магазинов до международных финансовых корпораций, растёт стремительно. Одновременно увеличивается скорость принятия управленческих решений в бизнесе. Совместно два этих фактора диктуют необходимость в точных срезах определённых данных и обработки данных для этой цели с большей скоростью и профессионализмом.

Преподаватель программы

Юрий Зубков
специалист по анализу данных

Программа предназначена для менеджеров и других специалистов, в работе которых возникает необходимость в подготовке аналитических выборок и отчётов для принятия управленческих решений.

Программа состоит из двух частей: анализ данных на языке запросов к базам данных SQL и основы статистического анализа данных с использованием языка программирования Python.

Во многих случаях для принятия управленческих решений не требуется выявление статистических закономерностей, а требуются точные ответы на вопросы типа «Что? Где? Когда?». Ответы на вопросы такого типа дают результаты запросов к базе данных на языке SQL. Примеры таких вопросов следующие.

Если фирма занимается сделками с недвижимостью, то может интересовать, сколько и/ или какие объекты площадью более 60 (100, 200, 300 и т. д.) квадратных метров было реализовано в определённый период и определёнными менеджерами, соотношение между сделками типа «продажа» и «аренда» в определённый период, другие подобные вопросы.

Если фирма реализует некоторый товар в разных разновидностях во многих регионах или странах, то может интересовать, каковы предпочтения жителей того или иного региона или страны, возраста, в том числе в определённые периоды времени, различные нюансы заключения сделок.

Для прогноза, восстановления отсутствующих данных и выявления скрытых тенденций требуется статистический анализ данных. Язык программирования Python в специализированной интерактивной среде программирования прижился в сфере статистического анализа данных благодаря отличным средствам визуализации данных и результатов их анализа.

При этом курс «учит учиться»: по результатам обучения студенты будут способны в случае необходимости подобрать для решения более редких задач необходимую библиотеку Python и написать скрипт для взаимодействия с ней.

Содержание программы

Анализ данных на языке SQL

Учимся извлекать данные из базы (в примерах и заданиях для самостоятельного выполнения используются 7 учебных баз данных)

  1. Проектирование базы данных
    1. Реляционная модель данных
    2. Основы проектирования базы данных
    3. Реляционная алгебра и её операции
    4. Создание базы данных, таблиц, модификация данных
  2. Создание базы данных и таблиц.
    1. ALTER TABLE — изменение таблиц.
    2. INSERT — вставка данных.
    3. UPDATE — обновление данных.
    4. DELETE — удаление данных.
  3. Запросы на выборку данных, операторы SQL и предикаты
    1. SELECT — запрос на выборку данных.
    2. IN — поиск данных из указанного множества.
    3. BETWEEN — поиск данных из указанного интервала.
    4. LIKE — поиск строки с указанными символами.
    5. JOIN — соединение таблиц базы данных.
    6. GROUP BY — группировка в запросах.
    7. HAVING — интересующие значения агрегатных функций.
    8. EXISTS и проверка существования набора значений.
    9. Подзапросы в SQL, их виды, корректность использования.
  4. Операции над множествами
    1. UNION — объединение результатов запросов.
    2. INTERSECT, EXCEPT — пересечение, разность результатов запросов.
  5. Функции и конструкции SQL
    1. Агрегатные функции - SUM, MIN, MAX, AVG, COUNT.
    2. Функции даты и времени.
    3. Функции для округления и других действий с дробными числами.
    4. Функции для работы со строками.
    5. Функция COALESCE — первое не-NULL значение.
    6. ALL и ANY: больше всех, равно хотя бы какому-либо.
    7. TOP и другие конструкции для вывода диапазона строк.

Извлекаем данные из базы самостоятельно: лабораторная работа (20 заданий по анализу предпочтений разновидностей товара по странам, регионам, возрастам, временным отрезкам и другим признакам, используется одна база данных)

Статистический анализ данных с использованием языка программирования Python

  1. Введение в язык программирования Python и его конструкции, необходимые для использования библиотек для статистического анализа данных
  2. Начальные сведения из математической статистики
    1. Выборки данных и описательная статистика.
    2. Случайные величины и законы их распределения.
    3. Проверка статистических гипотез.
  3. Методы построения математических моделей
    1. Корреляционный анализ.
    2. Регрессионный анализ.
    3. Дисперсионный анализ.
    4. Кластерный анализ.
    5. Факторный анализ.
    6. Анализ рядов динамики.
    7. Более редкие задачи и необходимые для этого библиотеки Python (обзор).

Тест по основам математической статистики, интерпретации результатов анализа и использованию библиотек языка программирования Python.

По окончании программы вы получаете сертификат о прохождении программы. Кроме того все выпускники данной программы получат скидку 20% на обучение на любой из учебных программ нашей школы.
Без предварительных знаний
Язык обучения: русский, латышский
Продолжительность
3 месяца (84 часов)
Начало обучения
6 января 2020 года
Дни и время занятий
понедельник, среда 18:00—21:00
Стоимость обучения
Специальное предложение только до 16.12.2019
Со своим компьютером
249
в месяц
Со школьным компьютером
299
в месяц
Со своим компьютером
299
в месяц
Со школьным компьютером
349
в месяц
Скидка школьникам 10%
Гарантия возврата денег в течение14 дней

Язык обученияФорма обучения

Спасибо за регистрацию на учебу в Webskola.
Мы с вами свяжемся в ближайшее время!