Suportul software pentru depozite de date si OLAP
Depozitele de date si tehnologia OLAP au aparut in anii 90, insa suportul software disponibil atunci nu raspundea necesitatilor. O solutie a problemei este SQL Server 7.0, accesibila utilizatorului final si adaptata necesitatilor companiilor mici.
Instrumentul SQL indeplineste urmatoarele functii: transformarea si exportarea datele, stocarea datelor in depozite de date si in baze de date multidimensionale, analiza datelor, prezentarea datelor.
10.1. Serviciul de transformare a datelor
Principala sursa de date a serviciului o reprezinta bazele de 252f57c date relationale. Acesta asigura colectarea si transformarea datelor prin:
validarea datelor care presupun uniformizarea unitatii de masura, verificarea incadrarii pe categorii, clase sau grupuri, verificarea consistensei datelor,
curatarea datelor, care presupune reconcilierea datelor provenite din mai multe surse prin compararea nomenclatoarelor folosite de diverse aplicatii si utilizarea ulterioara a unui singur nomenclator.
migrarea datelor, presupune transportarea datelor in depozit; un aspect important il constituie sincronizarea surselor de date in vederea preluarii datelor la acelasi moment;
transformarea datelor, care presupune pregatirea datelor preluate din sursele primare si utilizarea lor in analize complexe (de ex: comansarea coloanelor, divizarea coloanelor, transformarea dintr-un format in altul).
10.2. Serviciul de asistare a decizei
Realizeaza analiza si prezentare datelor prin:
Instrumentele de dezvoltare incluse in SQL Server sunt:
sisteme de gestiune a datelor operationale;
serviciul de extragere si transformare a datelor;
serverul OLAP de analiza multidimensionala si agregare;
instrumente pentru utilizatorul final.
Stocarea datelor OLAP
Modelele structurale multidimensionale specifice tehnologiei OLAP se pot stoca in mai multe moduri:
ROLAP (Relational OLAP) - stocarea datelor primare si a agregarilor in structurile relationale cu timpi de raspuns slabi, cu avantajul utilizarii unui spatiu pe disc mai mic (se foloseste pentru datele interogate mai rar).
MOLAP (Multidimensional OLAP) - stocheaza in structurile multidimensionale atat datele de baza, cat si pe cele agregate; calculele necesare se efectueaza in interiorul cubului si are performante in ceea ce priveste timpul de raspuns, dar ocupa spatiu mare pe disc.
HOLAP ( Hybrid OLAP) - combinatie a structurilor enuntate; calculele sunt efectuate in interiorul cubului, iar datele de baza sunt stocate in tabelele depozite de date.
Analiza datelor folosind limbaje de procesare a datelor multidimensionale
Pentru a raspunde necesitatilor de analiza a datelor, instrumentele OLAP trebuie sa ofere o serie de operatii analitice precum: consolidarea (ROLL-UP), parcurgerea in jos (DRILL-DOWN), sectionarea (slicing), schimbarea perspectivelor (dicing).
Pentru a raspunde acestor cerinte Microsoft furnizeaza limbajul MDX, iar ORACLE limbajul EXPRESS. Acestea contin instructiuni de definire a datelor si instructiuni de manipulare de date. Produsele EXPRESS de la ORACLE se caracterizeaza prin:
multidimensionalitate,
reprezentarea datelor nu se limiteaza la 2 sau 3 foi de calcul,
intretinerea ierarhiilor permite o foarte usoara consolidare si agregarea datelor la diferite nivele de detaliu,
procesul de analiza presupune un mediu pentru aplicatie care implica serii de timp sau analize incrucisate,
mediul de programare este structurat si cuprinde structuri conditionate si repetitive, depanare, compilare, executie;
acces la datele relationale, la mai multe baze de date,
facilitati de citire a datelor.
Produsele EXPRESS, ORACLE sunt de trei categorii: produse Server, unelte client si solutii pentru aplicatii analitice.
|