Версия для слабовидящих

Размер текста:

Цветовая схема:

Изображения:

Программирование на Python. Уровень 4. Анализ и визуализация данных Pandas, Numpy, Matplotlib

Программирование на Python. Уровень 4. Анализ и визуализация данных Pandas, Numpy, Matplotlib

Институт развития профессиональных компетенций и квалификаций

Повышение квалификации
Формат
Очно-заочная (дистанционная)
Кол-во часов
72 ак. ч.
Стоимость
40000 ₽
Онлайн
Да

18

часов теории

28

часов практических занятий

9

тем обучения

Программа повышения квалификации «Программирование на Python. Уровень 4. Анализ и визуализация данных: Pandas, Numpy, Matplotlib» ориентирована на лиц, имеющих среднее профессиональное или высшее образование, которые стремятся овладеть современными инструментами обработки информации. Курс разработан на основе профессионального стандарта «Программист» и нацелен на формирование компетенций, необходимых для формализации задач, разработки, отладки программного кода и создания тестовых наборов данных. Программа позволяет слушателям качественно усовершенствовать навыки сбора и анализа структурированных данных для решения профессиональных задач.

 Практический интенсив включает в себя изучение ключевых библиотек Python: NumPy, Matplotlib и Pandas. Вы освоите принципы работы с многомерными массивами (ndarray), структурами Series и DataFrame, а также механизмы векторизированных вычислений и приемы оптимизации расчетов. Особое внимание уделяется визуализации: от построения линейных графиков и гистограмм до настройки элементов диаграмм, аннотаций и экспорта готовых изображений в форматы PNG, SVG и PDF. Обучение проходит в интерактивной среде Jupyter с использованием системы контроля версий Git.

 В процессе обучения вы научитесь загружать и сохранять данные в форматах CSV, Excel, SQL и JSON, выполнять их очистку от пропусков и дубликатов, а также осуществлять группировку и агрегацию. Слушатели освоят продвинутые методы объединения наборов данных, работу с временными рядами и расчет базовых статистических показателей. Программа рассчитана на 72 часа и завершается итоговой аттестацией в форме зачета (тестирования), после успешного прохождения которого выдается официальное удостоверение о повышении квалификации Финансового университета при Правительстве РФ.

О программе

Базовый инструментарий и настройка окружения

Вы освоите установку и конфигурирование специализированного ПО, включая дистрибутив Anaconda, и научитесь работать в интерактивной среде Jupyter для проведения оперативного анализа данных.

Обучение включает освоение системы контроля версий Git и принципов организации вычислений, что обеспечит воспроизводимость вашего кода и порядок в программных проектах.

Высокопроизводительные вычисления с NumPy

Глубокое изучение архитектуры библиотеки NumPy: от работы с многомерными массивами ndarray до использования векторизированных вычислений и универсальных функций.

Вы научитесь оптимизировать алгоритмы, заменяя стандартные циклы Python эффективными матричными операциями, что значительно ускорит решение задач линейной алгебры и статистики.

Профессиональная визуализация в Matplotlib

Освоение полного спектра инструментов визуализации: построение линейных, столбчатых, коробчатых диаграмм и гистограмм с детальной настройкой всех элементов графиков.

Вы научитесь оформлять графики в профессиональном стиле, добавлять аннотации и экспортировать результаты в форматы высокого качества (PNG, SVG, PDF) для отчетов и презентаций.

Комплексная обработка данных в Pandas

Изучение структур Series и DataFrame для эффективной работы с табличными данными, включая загрузку и сохранение информации в форматах CSV, Excel, SQL и JSON.

Вы овладеете навыками первичной обработки и «очистки» данных: научитесь фильтровать, сортировать информацию, а также корректно обрабатывать пропуски и дубликаты.

Продвинутая аналитика и временные ряды

Освоение методов статистического анализа, группировки и агрегации данных, а также специализированных инструментов для работы с временными рядами.

Вы научитесь объединять разрозненные наборы данных методами слияния и сцепления (merge, join, concat), выполнять ресемплирование и рассчитывать скользящие показатели для выявления трендов.

Практический опыт и официальный статус

Обучение построено на решении реальных практических кейсов и интенсивной самостоятельной работе в формате Jupyter-ноутбуков под руководством экспертов.

Программа завершается итоговой аттестацией, после которой вы получите официальное удостоверение Финансового университета при Правительстве РФ, подтверждающее вашу квалификацию.

Программа

Тема 1. "Установка и настройка программного обеспечения. Базовый инструментарий"

  • Изучение принципов организации и управления вычислениями, а также взаимосвязи между библиотеками Python (NumPy, Pandas, Matplotlib).
  • Освоение работы с дистрибутивом Anaconda, создание виртуальных окружений и использование среды Jupyter для интерактивного анализа.
  • Знакомство с распределенной системой контроля версий Git для управления программным кодом.
  • Практика: установка Anaconda в различных ОС, запуск первого ноутбука и устранение типовых ошибок при настройке пакетов.

Тема 2. "Библиотека NumPy. Вычислительные задачи"

  • Разбор характеристик массива ndarray: размерность, типы данных NumPy и структура библиотеки.
  • Изучение принципов векторизированных вычислений и применения универсальных функций (ufunc).
  • Освоение стандартных функций для выполнения арифметических, статистических и линейно-алгебраических операций.
  • Практический семинар по созданию массивов различной сложности и генерации случайных данных.

Тема 3. "Эффективные вычисления с NumPy. Практические кейсы"

  • Продвинутая работа с формой массивов (reshape, transpose) и использование механизмов булевой индексации.
  • Изучение методов оптимизации стандартных циклов Python через векторизацию для повышения производительности.
  • Применение инструментов профилирования для измерения времени выполнения расчетов.
  • Практика: сравнительный анализ алгоритмов (чистый Python vs NumPy) с визуализацией результатов в Jupyter.

Тема 4. "Библиотека Matplotlib. Визуализация данных"

  • Обзор видов графиков: линейные, точечные, столбчатые диаграммы, гистограммы и «ящики с усами» (boxplot).
  • Изучение иерархии объектов Matplotlib: работа с Figure и Axes, настройка осей, сеток, легенд и аннотаций.
  • Освоение параметров экспорта изображений и настройки разрешения (DPI) для сохранения графиков в форматах PNG, SVG, PDF.
  • Практическое задание по построению комплексной диаграммы с несколькими подграфиками и детальной конфигурацией их внешнего вида.

Тема 5. "Прикладная визуализация данных в Matplotlib. Практические кейсы"

  • Выбор оптимальных типов визуализации в зависимости от поставленной аналитической задачи.
  • Изучение стилей оформления графиков и методов комбинирования различных типов диаграмм на одном холсте.
  • Практика: построение графиков математических функций и визуализация распределения случайных величин с применением готовых стилевых решений.

Тема 6. "Библиотека Pandas. Статистика и анализ данных"

  • Изучение объектов Series и DataFrame: работа с индексами, выборка строк и столбцов.
  • Освоение механизмов группировки данных (groupby) и выполнение операций агрегирования.
  • Применение инструментов для расчета описательных статистик и создания сводных таблиц.
  • Практический семинар: загрузка данных, анализ типов колонок и формирование статистических показателей по группам.

Тема 7. "Структурирование данных в Pandas. Практические кейсы"

  • Техники первичной обработки данных: переименование признаков, фильтрация и многоуровневая сортировка.
  • Освоение методов импорта и экспорта данных при работе с форматами CSV, Excel и JSON.
  • Изучение приемов «очистки» данных: выявление и устранение пропусков (dropna, fillna) и дубликатов строк.
  • Практика: комплексная очистка реального набора данных с последующим сохранением структурированного результата.

Тема 8. "Статистика и временные ряды"

  • Работа со специализированными типами данных для представления времени: Timestamp, DatetimeIndex и Period.
  • Изучение периодических индексов и выполнение специфических операций временной статистики.
  • Освоение методов ресемплирования данных и вычисления скользящих окон (среднее, медиана).
  • Практическое задание: загрузка временного ряда, анализ динамики показателей и визуализация трендов на графике.

Тема 9. "Анализ статистики и агрегация данных. Практические кейсы"

  • Изучение методов объединения данных: сцепление (concat), наложение (stack) и логическое слияние (merge, join).
  • Решение проблем согласования ключей и типов данных при интеграции информации из разных источников.
  • Трансформация таблиц из «длинного» формата в «широкий» и обратно.
  • Практика: объединение нескольких наборов данных по общему ключу, расчет итоговых агрегированных показателей и выгрузка финального DataFrame.

Итоговая аттестация

Итоговая аттестация в формате зачета

Преподаватели и эксперты программы

Кондратенко Николай Александрович

Кондратенко Николай Александрович

руководитель проектов компании Билайн, аспирант РУДН ВШУ

Документ, который Вы получите

Как приступить к обучению

Шаг 1

Выбрать программу и оставить заявку

Шаг 2

Собрать документы и пройти оформление в личном кабинете anketa.fa.ru

Шаг 3

Получить договор и документы для оплаты

Шаг 4

Внести оплату и начать обучение

Вас могут заинтересовать

Контакты менеджера (куратора) программы

Выбрать дату

Выбрать дату

Выбрать год