КУРС : "Хранилища данных"

 

Информация о подразделении, отвечающем за СЭУМК.

Подразделение разработчик СЭУМК Разработчики СЭУМК
Кафедра Вычислительной техники Институт
  1. Кудинов А.В.
  2. Пекарская С.С.

Обеспечивающая кафедра

Код специальности, специальность

№, Дисциплина

Уровень

Курс

Форма обучения

Количество часов, (Аудиторная, Самостоятельная, Кредиты)

Форма контроля

Кафедра Вычислительной Техники 230400 Хранилища данных  6 очная  108 (32, 76, 3)  экзамен 
ЦЕЛИ КУРСА

Формирование у обучающихся знаний методов и принципов организации и оперирования большими объемами данных с применением современных информационных средств и технологий.

МЕЖПРЕДМЕТНЫЕ СВЯЗИ

Дисциплина «Хранилища данных» (В.1.5) вариативной части профессионального цикла (М2.В).

Для ее успешного освоения требуются знания и навыки, полученные студентами при изучении дисциплины «Современные проблемы информационных систем и технологий» (М1.В2) (ПРЕРЕКВИЗИТЫ).

Содержание разделов дисциплины «Хранилища данных» согласовано с содержанием дисциплин, изучаемых параллельно (КОРЕКВИЗИТЫ):

  • «Методы исследования и моделирования информационных процессов и технологий» (М2.Б1).
  • «Системная инженерия» (М2.Б2).
СТРУКТУРА ТЕОРЕТИЧЕСКОЙ ЧАСТИ КУРСА

 1. Эволюция корпоративных информационных систем. Хранилища данных

Цель и задачи дисциплины, ее роль и место в общей системе подготовки специалист. Основные понятия. История вопроса. Понятие OLAP. Различия между транзакционными и аналитическими системами. Области применения хранилищ данных.

2. Структура хранилища данных

Общие свойства хранилищ данных. Данные хранилища. Компоненты хранилища.

3. Методология построения хранилищ данных. Выбор метода реализации хранилищ данных

Подходы к стратегии построения. Модели разработки. Этапы спиральной модели применительно к разработке хранилищ данных. Компонентная архитектура. Техническая архитектура. Две группы аналитических платформ. Обзор рынка BI. Продукция Microsoft. Продукция Sybase. Продукция Oracle. Интеграция информационных ресурсов в хранилищах данных. Проблема интеграции данных. Возможности SQL Server 2010 Integration Services. Планирование ETL проекта для хранилища данных.

4. Технология Data Mining

Общие понятия. История вопроса. Приложения. Технология (процесс) добычи знаний. Решаемые задачи. Математические основы (РАД). Data Mining в MSSAS. 

5. Многомерные кубы

 Основные понятия кубов. Иерархии измерений. Структура ХД. Примеры кубов. Три способа хранения агрегатных данных.

СТРУКТУРА ПРАКТИЧЕСКОЙ ЧАСТИ КУРСА

Лабораторные работы 

  1. Проектирование, реализация и наполнение БД, являющей источником данных для хранилища.
  2. Проектирование  структуры хранилища данных.
  3. Реализация хранилища данных под управлением Microsoft SQL Server 2008 Analysis Services.
  4. Использование Microsoft Office Excel как стандартного OLAP-клиента для доступа к данным хранилища.
  5. Создание специализированного клиентского приложения для  доступа к данным хранилища.
КЛЮЧЕВЫЕ СЛОВА

Хранилище данных, многомерные кубы, OLAP, агрегатные данные, BI, Data Mining

ИНФОРМАЦИЯ ДЛЯ СВЯЗИ С ПРЕПОДАВАТЕЛЯМИ

Copyright ©2014. Tomsk Polytechnic University, 
All rights reserved.

Уровень квалификации: Начальный