Prelucrarea analitică online, sau OLAP, este o tehnologie eficientă de prelucrare a datelor, în urma căreia, pe baza unor tablouri uriașe de tot felul de date, sunt afișate informațiile finale. Acesta este un produs puternic care ajută la accesarea, preluarea și vizualizarea informațiilor pe un computer, analizându-le din diferite puncte de vedere.
OLAP este un instrument care oferă o poziție strategică pentru planificarea pe termen lung și are în vedere informațiile de bază ale datelor operaționale pentru o perspectivă de 5, 10 sau mai mulți ani. Datele sunt stocate în baza de date cu dimensiunea, care este atributul lor. Utilizatorii pot vizualiza același set de date cu atribute diferite, în funcție de scopul analizei.
Istoric OLAP
OLAP nu este un concept nou și a fost folosit de zeci de ani. De fapt, originea tehnologiei a fost urmărită până în 1962. Dar termenul a fost inventat abia în 1993 de autorul bazei de date Ted Coddom, care a stabilit și 12 reguli pentru produs. Ca și în multe alte aplicații, conceptul a trecut prin mai multe etape de evoluție.
Istoricul tehnologiei OLAP în sine datează din 1970, când au fost lansate resursele de informații Express și primul server Olap. Acestea au fost achiziționate de Oracle în 1995 și ulterior au devenit baza prelucrării analitice online a mecanismului de calcul multidimensional pe care renumitul brand de computer îl furniza în baza sa de date. În 1992, un alt cunoscut produs de prelucrare analitică online Essbase a fost lansat de Arbor Software (achiziționat de Oracle în 2007).

În 1998, Microsoft a lansat serverul de prelucrare a datelor de analiză online, MS Analysis Services. Aceasta a contribuit la popularitatea tehnologiei și a determinat dezvoltarea altor produse. Astăzi, există mai mulți furnizori de renume mondial care oferă aplicații Olap, inclusiv IBM, SAS, SAP, Essbase, Microsoft, Oracle, IcCube.
Prelucrare analitică online
OLAP este un instrument care vă permite să luați decizii cu privire la evenimentele planificate. Calculul Atipic Olap poate fi mai complicat decât doar agregarea datelor. Interogările analitice pe minut (AQM) sunt utilizate ca referință standard pentru compararea performanțelor diferitelor instrumente. Aceste sisteme ar trebui să ascundă utilizatorii cât mai mult posibil de sintaxa interogărilor complexe și să ofere un timp de răspuns constant pentru toată lumea (indiferent cât de complicați sunt).
Există următoarele caracteristici cheie ale OLAP:
- Reprezentări de date multidimensionale.
- Suport pentru calcularea complexă.
- Informații temporare.
Prezentarea multidimensională oferă baza procesării analitice prin acces flexibil la datele corporative. Permite utilizatorilor să analizeze datele în orice dimensiune și la orice nivel de agregare.
Suportul pentru calcularea complexă este baza software-ului OLAP.
Informațiile temporare sunt utilizate pentru a evalua eficacitatea oricărei aplicații analitice într-o anumită perioadă de timp. De exemplu, luna aceasta față de luna precedentă, luna respectivă față de aceeași lună a anului trecut.
Structura datelor multidimensionale
Una dintre principalele caracteristici ale procesării analitice online este structura multidimensională a datelor. Un cub poate avea mai multe dimensiuni. Datorită acestui model, întregul proces de analiză inteligentă OLAP este simplu pentru manageri și directori, deoarece obiectele reprezentate în celule sunt obiecte de afaceri din lumea reală. În plus, acest model de date permite utilizatorilor să proceseze nu numai structurile structurate, ci și cele nestructurate și semi-structurate.Toate acestea le fac deosebit de populare pentru analiza datelor și aplicațiile BI.

Caracteristici cheie ale sistemelor OLAP:
- Utilizați metode de analiză a datelor multidimensionale.
- Oferiți suport avansat al bazei de date.
- Creați interfețe ușor de utilizat pentru utilizatorul final.
- Sprijină arhitectura client / server.
Una dintre componentele principale ale conceptelor OLAP este un server din partea clientului. Pe lângă agregarea și pre-procesarea datelor dintr-o bază de date relațională, oferă parametri avansați de calcul și înregistrare, funcții suplimentare, capacități de interogare de bază avansate și alte funcții.
În funcție de aplicația de eșantion selectată de utilizator, sunt disponibile diverse modele și instrumente de date, inclusiv alerte în timp real, o funcție pentru aplicarea scenariilor ce-dacă, optimizare și rapoarte OLAP complexe.
Forma cubică
Conceptul se bazează pe o formă cubică. Locația datelor din ea arată modul în care OLAP aderă la principiul analizei multivariate, ca urmare a faptului că o structură de date este creată pentru o analiză rapidă și eficientă.
Un cub OLAP se mai numește „hipercub”. Este descris ca fiind format din fapte (măsuri) numerice, clasificate după fațete (dimensiuni). Dimensiunile se referă la atribute care definesc o problemă de afaceri. Mai simplu spus, o dimensiune este o etichetă care descrie o măsură. De exemplu, în rapoartele de vânzări, măsura va fi volumul vânzărilor, iar dimensiunile vor include perioada vânzărilor, vânzătorii, un produs sau serviciu și regiunea vânzărilor. În raportarea operațiunilor de producție, măsura poate fi costurile totale de producție și unitățile de producție. Dimensiunile vor fi data sau ora producției, faza sau faza de producție, chiar și lucrătorii implicați în procesul de producție.

Cubul de date OLAP este piatra de temelie a sistemului. Datele din cub sunt organizate folosind un model de stea sau un fulg de zăpadă. În centru există un tabel de date care conține agregate (măsuri). Este asociat cu o serie de tabele de măsurare care conțin informații despre măsuri. Dimensiunile descriu modul în care aceste măsuri pot fi analizate. Dacă un cub conține mai mult de trei dimensiuni, este adesea numit hipercub.
Una dintre principalele funcții aparținând cubului este natura sa statică, ceea ce implică faptul că cubul nu poate fi schimbat după dezvoltarea lui. Prin urmare, procesul de construire a unui cub și de configurare a unui model de date este un pas crucial către procesarea adecvată a datelor în arhitectura OLAP.
Agregarea datelor
Utilizarea agregărilor este principalul motiv pentru care cererile sunt procesate mult mai rapid în instrumentele OLAP (în comparație cu OLTP). Agregările sunt rezumate ale datelor care au fost calculate anterior în timpul procesării. Toți membrii stocați în tabelele de dimensiuni OLAP definesc interogările pe care le poate primi cubul.
Într-un cub, acumulările de informații sunt stocate în celule, ale căror coordonate sunt specificate în funcție de dimensiuni specifice. Numărul de agregate pe care le poate conține un cub depinde de toate combinațiile posibile de elemente de dimensiune. Prin urmare, un cub tipic dintr-o aplicație poate conține un număr extrem de mare de agregate. Un calcul preliminar va fi efectuat numai pentru agregatele cheie care sunt distribuite în cubul analitic de analiză online. Acest lucru va reduce semnificativ timpul necesar pentru a determina orice agregare atunci când executați o interogare într-un model de date.
Există, de asemenea, două opțiuni legate de agregări cu ajutorul cărora puteți îmbunătăți performanța unui cub final: creați o agregare a capacității de memorie cache și utilizați agregarea bazată pe o analiză a solicitărilor utilizatorilor.
Principiul de lucru
De obicei, analiza informațiilor operaționale obținute din tranzacții poate fi efectuată folosind o simplă foaie de calcul (valorile datelor sunt prezentate în rânduri și coloane). Acest lucru este bun, având în vedere natura bidimensională a datelor. În cazul OLAP, există diferențe datorate tabloului de date multidimensionale.Deoarece sunt deseori obținute din surse diferite, este posibil ca o foaie de calcul să nu poată întotdeauna să le proceseze eficient.
Cubul rezolvă această problemă și, de asemenea, se asigură că depozitul de date OLAP funcționează în mod logic și ordonat. Compania colectează date din numeroase surse și este prezentată în diferite formate, cum ar fi fișiere text, fișiere multimedia, fișe de calcul Excel, baze de date Access și chiar baze de date OLTP.

Toate datele sunt colectate într-un depozit completat direct din surse. În ea, informațiile brute primite de la OLTP și alte surse vor fi șterse de orice tranzacție eronată, incompletă și inconsistentă.
După curățare și conversie, informațiile vor fi stocate într-o bază de date relațională. Apoi va fi încărcat pe serverul OLAP multidimensional (sau cubul Olap) pentru analiză. Utilizatorii finali responsabili de aplicațiile de afaceri, de exploatarea datelor și de alte operațiuni comerciale vor avea acces la informațiile de care au nevoie din cubul Olap.
Beneficiile modelului Array
OLAP este un instrument care oferă performanțe de interogare rapidă, care se realizează prin stocare optimizată, indexare multidimensională și cache, care sunt avantaje semnificative ale sistemului. În plus, avantajele sunt:
- Date mai mici pe disc.
- Calcul automatizat al agregatelor cu un nivel superior de date.
- Modelele Array oferă indexare naturală.
- Recuperarea eficientă a datelor se realizează prin pre-structurare.
- Compact pentru seturi de date cu dimensiuni reduse.
Dezavantajele OLAP includ faptul că unele soluții (etapa de procesare) pot fi destul de lungi, în special cu cantități mari de informații. Acest lucru este corectat de obicei prin efectuarea numai a procesării incrementale (datele care au fost modificate sunt studiate).
Operații analitice de bază
convoluție (roll-up / drill-up) este cunoscut și sub denumirea de „consolidare”. Coagularea presupune colectarea tuturor datelor care pot fi obținute și calcularea tuturor într-una sau mai multe dimensiuni. Cel mai adesea, acest lucru poate necesita aplicarea unei formule matematice. Ca exemplu OLAP, putem lua în considerare o rețea de vânzare cu amănuntul cu puncte de vânzare în diferite orașe. Pentru a identifica modelele și a anticipa tendințele de vânzări viitoare, datele despre acestea din toate punctele sunt „prăbușite” în departamentul principal de vânzări al companiei pentru consolidare și calcul.
dezvăluire (Drill-down). Acesta este opusul coagulării. Procesul începe cu un set mare de date și apoi se descompune în părți mai mici, permițând astfel utilizatorilor să vizualizeze detaliile. În exemplul rețelei de vânzare cu amănuntul, analistul va analiza datele de vânzări și va analiza mărcile sau produsele individuale care sunt considerate cele mai bune vânzări în fiecare dintre magazinele din diferite orașe.

secțiune (Felie și zaruri). Acesta este un proces în care operațiunile analitice includ două acțiuni: obținerea unui set de date specifice din cubul OLAP („tăierea” aspectului de analiză) și vizualizarea acestuia din diferite puncte de vedere sau unghiuri. Acest lucru se poate întâmpla atunci când toate datele punctelor de ieșire sunt primite și introduse în hipercub. Analistul decupează datele de vânzări din OLAP Cube. Acesta va fi apoi vizualizat atunci când se analizează vânzările de unități individuale din fiecare regiune. În acest moment, alți utilizatori se pot concentra pe evaluarea rentabilității vânzărilor sau pe evaluarea eficacității unei campanii de marketing și publicitate.
poftă de mâncare (Pivot). Axele de date sunt rotite în ea pentru a oferi un înlocuitor pentru prezentarea informațiilor.
Soiuri de baze de date
În principiu, acesta este un cub OLAP tipic care implementează procesarea analitică a datelor multidimensionale folosind cubul OLAP sau orice cub de date, astfel încât procesul analitic să poată adăuga dimensiuni după cum este necesar. Orice informație încărcată într-o bază de date multidimensională va fi stocată sau arhivată și poate fi apelată la nevoie.
Tip OLAP | valoare |
OLAP relațional (ROLAP) | ROLAP este un SGBD avansat, împreună cu maparea datelor multidimensionale pentru a efectua operațiuni relaționale standard |
OLAP multidimensional (MOLAP) | MOLAP - implementează lucrări în date multidimensionale |
Prelucrare analitică hibridă online (HOLAP) | În abordarea HOLAP, totalurile agregate sunt stocate într-o bază de date multidimensională, iar informațiile detaliate sunt stocate într-o bază de date relațională. Aceasta asigură atât eficiența modelului ROLAP, cât și performanța modelului MOLAP. |
Desktop OLAP (DOLAP) | În Desktop OLAP, utilizatorul descarcă o parte din datele din baza de date local sau pe desktopul său și o analizează. DOLAP este relativ ieftin de implementat, deoarece oferă foarte puține funcționalități în comparație cu alte sisteme OLAP |
Web OLAP (WOLAP) | Web OLAP este un sistem OLAP accesibil printr-un browser web. WOLAP este o arhitectură pe trei niveluri. Este format din trei componente: client, middleware și server de baze de date |
OLAP mobil | OLAP mobil ajută utilizatorii să primească și să analizeze datele OLAP folosind dispozitivele lor mobile |
OLAP spațial | SOLAP este creat pentru a facilita gestionarea datelor spațiale și non-spațiale într-un sistem de informații geografice (GIS) |
Există sisteme sau tehnologii OLAP mai puțin cunoscute, dar acestea sunt principalele care sunt utilizate în prezent de marile corporații, structuri de afaceri și chiar de guvern.

Instrumente OLAP
Instrumentele pentru prelucrarea analitică online sunt foarte bine prezentate pe internet sub formă de versiuni plătite și gratuite.
Cele mai populare dintre ele:
- Dundas BI de la Dundas Data Visualization este o platformă bazată pe browser pentru informații de afaceri și vizualizare a datelor, care include tablouri de bord integrate, instrumente de raportare OLAP și analiză de date.
- Yellowfin este o platformă de business intelligence, care este o soluție integrată unică, concepută pentru companii din diverse industrii și dimensiuni. Acest sistem este configurat pentru întreprinderile din domeniul contabilității, publicității, agriculturii.
- ClicData este o soluție de business intelligence (BI) concepută în principal pentru utilizarea de către întreprinderile mici și mijlocii. Instrumentul permite utilizatorilor finali să creeze rapoarte și tablouri de bord. Board a fost creat pentru a combina business intelligence, managementul performanței corporative și este un sistem complet funcțional care servește companiilor de nivel mediu și corporativ.
- Domo este un pachet de management de afaceri bazat pe cloud care se integrează cu mai multe surse de date, inclusiv foi de calcul, baze de date, rețele sociale și orice soluție software existentă sau locală.
- InetSoft Style Intelligence este o platformă software de business intelligence care permite utilizatorilor să creeze tablouri de bord, tehnologie vizuală de analiză OLAP și rapoarte folosind mecanismul mashup.
- Birst de la Infor Company este o soluție în rețea pentru analiști și analize de afaceri, care combină ideile diferitelor echipe și ajută la luarea deciziilor în cunoștință de cauză. Instrumentul permite utilizatorilor descentralizați să crească modelul echipelor corporative.
- Halo este un sistem complet de gestionare a lanțului de aprovizionare și informații de afaceri care ajută la planificarea afacerilor și la prognozarea inventarului pentru gestionarea lanțului de aprovizionare. Sistemul folosește date din toate sursele - mari, mici și intermediare.
- Chartio este o soluție de business intelligence bazată pe cloud care oferă fondatorilor, grupurilor de afaceri, analiștilor de date și grupurilor de produse instrumente organizaționale pentru munca de zi cu zi.
- Exago BI este o soluție bazată pe web concepută pentru implementare în aplicații web. Implementarea Exago BI permite companiilor de toate dimensiunile să ofere clienților lor rapoarte speciale, în timp util și interactiv.
Impactul asupra afacerii
Utilizatorul va găsi OLAP în majoritatea aplicațiilor de afaceri din industrii.Analiza este folosită nu numai de afaceri, ci și de alte părți interesate.

Unele dintre cele mai comune aplicații ale sale includ:
- Analiza de date OLAP de marketing.
- Situații financiare care acoperă vânzările și cheltuielile, bugetarea și planificarea financiară.
- Managementul proceselor de afaceri.
- Analiza vânzărilor
- Marketing de baze de date.
Industriile continuă să crească, ceea ce înseamnă că utilizatorii vor vedea în curând mai multe aplicații OLAP. Prelucrarea adaptată multidimensional oferă o analiză mai dinamică. Din acest motiv, aceste sisteme și tehnologii OLAP sunt utilizate pentru a evalua ce-dacă scenarii și scenarii de afaceri alternative.