• Главная
  • Карта сайта
Не найдено

Введення в OLAP на практичному прикладі

Проблеми аналітики, OLAP, сховищ даних викликають все більший інтерес у російських ІТ-фахівців. До теперішнього часу в нашій комп'ютерного друку та Інтернеті опубліковано чимало хороших, академічно за способом викладу матеріалів з цієї тематики, в тому числі і вступного характеру. Ми ж пропонуємо вашій увазі статтю, в якій свідомо намагаємося пояснити OLAP "на пальцях", на конкретному прикладі. Практика показує, що таке пояснення необхідно і деяким ІТ-фахівцям і особливо кінцевим користувачам.

Практика показує, що таке пояснення необхідно і деяким ІТ-фахівцям і особливо кінцевим користувачам

Отже, OLAP * 1 в першому наближенні, "на пальцях", можна визначити як особливий спосіб аналізу даних і отримання звітів. Його суть полягає в наданні користувачу багатовимірної таблиці, автоматично підсумовує дані в різних розрізах і дозволяє інтерактивно керувати обчисленнями і формою звіту. У цій статті буде розказано про технології та описано основні операції OLAP на прикладі аналізу рахунків-фактур підприємства, зайнятого оптовою торгівлею продуктами харчування.

_____

* 1. OLAP - On-Line Analytical Processing, оперативний аналіз даних.

OLAP - On-Line Analytical Processing, оперативний аналіз даних

Як інструмент буде розглянута OLAP-система самого простого і недорогого класу - OLAP-клієнт * 1. Для прикладу обрана найбільш проста продукт з числа OLAP-клієнтів - "Контур Стандарт" компанії Intersoft Lab. (Для наочності далі в статті загальноприйняті терміни OLAP будуть позначатися жирним шрифтом і супроводжуватися англомовними аналогами.)

_____

* 1. Більш докладно про класифікацію OLAP-систем розказано в статті "OLAP, зроблено в Росії" в PC Week / RE, №3 / 2001.

Отже, приступимо до роботи з системою. Для початку потрібно описати Джерело даних (data source) - шлях до таблиці і її поля. Це завдання користувача, який знає фізичну реалізацію бази даних. Для кінцевих користувачів він переводить назву таблиці і її полів в терміни предметної області. За "джерелом даних" стоїть локальна таблиця, таблиця або подання (view) SQL-сервера або збережена процедура.

Швидше за все в конкретній базі даних рахунку-фактури зберігаються не в одній, а в декількох таблицях. Крім того, частина полів або записів може не використовуватися для аналізу. Тому далі створюється Вибірка (result set або query), - в якій налаштовуються: алгоритм об'єднання таблиць по ключових полях, умови фільтрації і набір повертаються полів. Назвемо нашу вибірку "Рахунки-фактури" і помістимо в неї все поля джерела даних "Рахунки-фактури". Таким чином, ІТ-фахівець, створюючи семантичний шар, приховує фізичну реалізацію бази даних від кінцевого користувача.

Потім налаштовується OLAP-звіт. Цим може зайнятися фахівець в предметній області. Спочатку поля плоскої вибірки даних розбиваються на дві групи - факти (facts або measures) і вимірювання (dimensions). Факти - це цифри, а вимірювання - "розрізи", в яких будуть підсумовуватися факти. У нашому прикладі вимірами стануть: "Регіон", "Місто", "Покупець", "Товар", "Дата", а факт буде один - поле "Сума" рахунки-фактури. Для факту потрібно вибрати один або кілька алгоритмів агрегації. OLAP здатний не тільки підсумувати підсумки, а й виконувати більш складні обчислення, аж до статистичного аналізу. При виборі декількох алгоритмів агрегації будуть створені віртуальні, обчислювані факти (calculated facts). У прикладі вибрано один алгоритм агрегації - "Сума".

У прикладі вибрано один алгоритм агрегації - Сума

Особлива властивість OLAP-систем - генерація вимірювань і даних по старшим часових періодів з дати і автоматичне обчислення підсумків за цими періодами. Виберемо періоди "Рік", "Квартал" і "Місяць", при цьому даних за кожен день в звіті не буде, але з'являться згенеровані вимірювання "Рік", "Квартал" і "Місяць". Назвемо звіт "Аналіз продажів" і збережемо його. Робота по створенню інтерфейсу аналітичного додатки закінчена.

Тепер, щодня або щомісяця запускаючи цей інтерфейс, користувач буде бачити таблицю і графік, в яких рахунки-фактури підсумовані по товарах, покупцям і періодів.

Для того щоб маніпуляції з даними були інтуїтивно зрозумілі, інструментами управління динамічної таблицею є елементи самої таблиці - її колонки і рядки. Користувач може переміщати їх, видаляти, фільтрувати і виконувати інші OLAP-операції. При цьому таблиця автоматично обчислює нові проміжні і остаточні підсумки.

При цьому таблиця автоматично обчислює нові проміжні і остаточні підсумки

Наприклад, перетягнувши (операція "move") колонку "Товар" на перше місце, ми отримаємо звіт про порівняння - "Порівняння обсягів продажів товарів за рік". Щоб агрегувати дані за рік, досить перетягнути колонки "Квартал" і "Місяць" у верхню частину таблиці - "область неактивних вимірювань". Вимірювання "Квартал" і "Місяць", перенесені в цю область, будуть закриті (операція "close dimension"), т. Е. Виключені зі звіту; при цьому факти підсумуйте за рік. Незважаючи на те що вимірювання закриті, по ним можна задавати конкретні роки, квартали і місяці для фільтрації даних (операція "filter").

Для більшої наочності змінимо тип графіка, що ілюструє OLAP-таблицю, і його розташування на екрані.

Поглиблення в дані (операція "drill down") дозволяє отримати більш детальні відомості про продажі цікавить нас товару. Клацнувши на знаку "+" напроти товару "Кава", ми побачимо обсяги його продажів в розрізі регіонів. Розкривши регіон "Урал", отримаємо обсяги продажів в розрізі міст Уральського регіону, заглибившись в дані по "Катеринбургу", зможемо переглянути дані по оптовим покупцям цього міста.

Розкривши регіон Урал, отримаємо обсяги продажів в розрізі міст Уральського регіону, заглибившись в дані по Катеринбургу, зможемо переглянути дані по оптовим покупцям цього міста

Для установки фільтрів можна використовувати і відкриті вимірювання. Щоб порівняти динаміку продажів цукерок у Москві і Єкатеринбурзі, встановимо фільтри на вимірювання "Товар" і "Місто".

Закриємо непотрібні вимірювання і виберемо тип графіка "Лінія". На отриманому графіку можна простежити динаміку продажів, оцінити сезонні коливання і зв'язок падінь і зростання збуту товару в різних містах.

Таким чином, ми переконалися, що OLAP-технологія дозволяє користувачеві з одного інтерфейсу випустити десятки видів самих різних звітів, керуючи динамічної OLAP-таблицею за допомогою миші. Завданням програміста, який володіє таким інструментом, стає рутинне кодування звітних форм, а настройка OLAP-клієнта на бази даних. При цьому способи управління звітом інтуїтивно зрозумілі кінцевому користувачеві.

При цьому способи управління звітом інтуїтивно зрозумілі кінцевому користувачеві

Дійсно, OLAP - це природне продовження і розвиток ідеї електронних таблиць. По суті, візуальний інтерфейс OLAP - це теж електронна таблиця (spreadsheet), але оснащена потужною машиною обчислень і особливим стандартом представлення даних і управління ними. Більш того, деякі OLAP-клієнти реалізовані як add-in до MS Excel. Тому мільйонна армія "білих комірців", впевнено володіє електронними таблицями, дуже швидко освоює і OLAP-інструменти. Для них це "оксамитова революція", що надає нові можливості, але не сполучена з необхідністю перевчатися.

Якщо читач, прочитавши цю статтю, чи не втратив інтересу до OLAP, він може звернутися до згаданих на початку матеріалами. Збірники таких матеріалів розміщені на ряді сайтів в Інтернеті, включаючи сайт Intersoft lab - www.iso.ru. З нього можна також завантажити демонстраційну версію системи "Контур Стандарт" з описаним в статті прикладом.

Зауваження та питання технічному директору компанії Intersoft Lab можна надсилати за адресою: [email protected].

Версія для друку

Тільки зареєстровані користувачі можуть залишати коментарі.

Провайдеры:
  • 08.09.2015

    Batyevka.NET предоставляет услуги доступа к сети Интернет на территории Соломенского района г. Киева.Наша миссия —... 
    Читать полностью

  • 08.09.2015
    IPNET

    Компания IPNET — это крупнейший оператор и технологический лидер на рынке телекоммуникаций Киева. Мы предоставляем... 
    Читать полностью

  • 08.09.2015
    Boryspil.Net

    Интернет-провайдер «Boryspil.net» начал свою работу в 2008 году и на данный момент является одним из крупнейших поставщиков... 
    Читать полностью

  • 08.09.2015
    4OKNET

    Наша компания работает в сфере телекоммуникационных услуг, а именно — предоставлении доступа в сеть интернет.Уже... 
    Читать полностью

  • 08.09.2015
    Телегруп

    ДП «Телегруп-Украина» – IT-компания с 15-летним опытом работы на рынке телекоммуникационных услуг, а также официальный... 
    Читать полностью

  • 08.09.2015
    Софтлинк

    Высокая скоростьМы являемся участником Украинского центра обмена трафиком (UA — IX) с включением 10 Гбит / сек... 
    Читать полностью