Аналитика данных в Python
О курсе
Основной целью курса является формирование у обучающихся определенного ООП (п. 5.4 Общей характеристики ООП) состава компетенций для подготовки к профессиональной деятельности.
Курс посвящен дисциплине "Аналитика данных в Python", изучаемой в 5-м семестре бакалавриата "Прикладная информатика".
В курсе раскрываются вопросы алгоритмизации и основы программирования на языке Python, курс также знакомит студентов со стандартными возможностями языка и его библиотеками на уровне, достаточном для решения задач обработки и анализа данных. Рассматриваются базовые элементы и синтаксические конструкции языка Python 3. Описываются основные методы и приемы работы с рядами и табличными данными с применением популярных Python-библиотек.
Особое внимание уделяется самостоятельной проработке тем, связанных с основными анализа данных на языке Python.
Результаты обучения
1. Уверенное пользование языком Python для решения различных задач анализа данных, включая обработку, очистку и преобразование данных с использованием популярных библиотек (pandas, numpy), а также эффективно визуализировать полученные результаты средствами matplotlib и seaborn.
2. Умение проводить полный разведочный анализ набора данных, включающий выявление зависимостей между переменными, обнаружение аномалий и подготовку отчетов с подробной визуализацией результатов исследований.
3. Умение самостоятельно разрабатывать сценарии для анализа данных, выбирать подходящие алгоритмы для их обработки, применять статистические тесты и готовить структурированные презентации полученных выводов.
Компетенции, формируемые в курсе:
1. Способен применять естественнонаучные и общеинженерные знания, методы математического анализа и моделирования, теоретического и экспериментального исследования в профессиональной деятельности.
- Владеет навыками анализа данных.
- Умеет строить автоматизированные модели анализа данных.
- Знает основные технологии анализа данных.
2. Способен разрабатывать алгоритмы и программы, пригодные для практического применения.
- Владеет языками процедурного и объектно-ориентированного программирования.
- Умеет работать с современными системами программирования, включая объектно-ориентированные.
- Знает технологии разработки алгоритмов и программ, основы объектно- ориентированного подхода к программированию.
Образовательная программа ООП
Направления подготовки бакалавриата:
09.03.03 "Прикладная информатика"
Программа курса
Модуль 1: Основы программирования на Python. Базовая статистика
Темы лекций:
- Основы программирования на Python. Среда разработки Google Colaboratory.
- Базовая статистика.
Темы практических занятий:
- Математический аппарат языка Python. Введение в модуль NumPy.
- Статистика и комбинаторика. Математическая библиотека Python – SymPy.
- Анализ данных. Основы работы с Pandas.
Модуль 2: Библиотека NumPy и векторизованные вычисления
Темы лекций:
- Введение в NumPy.
- Операции с массивами.
Темы практических занятий:
- Работа с текстовыми данными. Сбор данных из открытых источников. Предварительная обработка текстовых данных.
- Построение и анализ сетей графов. Библиотека Networkx.
Модуль 3. Библиотека Pandas
Темы лекций:
- Основы работы с Pandas.
- Манипуляции с данными.
Темы практических занятий:
- Модели и алгоритмы машинного обучения. Оценка алгоритмов машинного обучения. Прогнозирование данных. Библиотека SciPy, Sklearn.
- Иерархическая кластеризация. Деревья решений. Случайный лес. Ансамбли моделей. Модуль Sklearn.
- Обучение без учителя. Алгоритм кластеризации. Метод k-средних.
Модуль 4. Визуализация данных
Темы лекций:
- Библиотека Matplotlib.
- Библиотека seaborn.
Темы практических занятий:
- Визуализация данных. Представление результатов исследования. Построение графического изображения результатов статистического анализа данных.
- Обработка и визуализация графических изображений.
- Создание нейронной сети. Использование библиотеки Keras.
- Аналитика данных на Python (семинар).
Длительность курса, количественные характеристики, форма аттестации
Продолжительность курса – 18 недель
Трудоемкость освоения курса – 144 часа
Трудоемкость курса – 4 зачетные единицы
Форма контроля – экзамен
Автор курса
Copyright © 2026.
Томский политехнический университет. Все права защищены
Tomsk Polytechnic University, All rights reserved.

- Учитель: Разумников Сергей Викторович