Documente online.
Zona de administrare documente. Fisierele tale
Am uitat parola x Creaza cont nou
 HomeExploreaza
upload
Upload




Conceptul de baza de date

Informatica


1. Conceptul de baza de date

Distinctia īntre date, informatii si cunostinte :

q       datele sunt definite de trei elemente: un identificator, atribute si valoare ;



q       informatia este un mesaj care are caracter de noutate, altfel spus care īnlatura o nedeterminare (necunoastere) ;

q       cunostintele reprezinta informatii simple sau agregate, pe care le dobāndim de- 10310v2112k a lungul timpului, relativ la: obiecte, fenomene sau procese din lumea reala.

Organizarea datelor din punct de vedere informatic are 2 componente:

q       organizarea datelor īn memoria interna a calculatorului, care cuprinde structurile de tip lista, coada, stiva si decoada;

q       organizarea datelor pe memoria externa, care cuprinde structurile de tip fisier si baza de date.

O baza de date poate fi definita ca un ansamblu de date elementare sau structurate, accesibile unei comunitati de utilizatori. Mai concret, o baza de date, este un ansamblu de fisiere intercorelate, care contine nucleul de date necesare unui sistem informatic(aplicatie informatica).

Un fisier este un ansamblu de īnregistrari fizice, omogene din punct de vedere al continutului si al prelucrarii. O īnregistrare fizica este unitatea de transfer īntre memoria interna si cea externa a calculatorului. Aceasta este formata din una sau mai multe īnregistrari logice. O īnregistrare logica este unitatea de prelucrare din punct de vedere al programului utilizator. Aceasta este formata dintr-un ansamblu de cāmpuri, care descriu o anumita realitate.

O banca de date este o BD mai putin structurata si care deserveste sistemele documentare.

Tipuri de BD :

client-server

bazelor de date distribuite, consecinta a distribuirii īn spatii a sub-unitatilor unei īntreprinderii si a facilitatilor oferite de retelele extinse;

baze de date avansate: baze de date active depinzind de aparitia unor evenimente si daca sunt īndeplinite anumite conditii, baze de date deductive, care cupleaza un motor de inferente, baze de date multidimensionale explorate folosind proceduri de analiza multidimensionale (OLAP) sau proceduri de analiza statistico-matematice (Data Mining) ;

accesarea bazelor de date īn sisteme Internet/Intranet/Extranet.

2.Obiectivele fundamentale ale unei baze de date (BD)

Centralizarea datelor permite: suprimarea redundantei, asigurarea unicitatii īnregistrarii si controlul centralizat (asupra datelor).

Independenta īntre date si prelucrari. Baza de date, ca imagine a unei anumite realitati, trebuie actualizata permanent. Acest lucru nu trebuie sa afecteze programele de prelucrare. Pentru aceasta trebuie ca fiecare program sa aiba o viziune proprie asupra BD (fig. 1).


Realizarea de legaturi īntre entitatile de date, care sunt indispensabile pentru exploatarea eficienta a sistemului informatic.

Integritatea datelor asigura fiabilitatea si coerenta bazei de date (BD). Pentru aceasta trebuie definite restrictii de integritate cum ar fi:

q       apartenenta la o lista de valori sau interval;

q       apartenenta la un anumit format;

q       reguli de coerenta cu alte date.

Securitatea datelor. Baza de date trebuie sa fie protejata īmpotriva unei distrugeri logice (anomalie de actualizare) sau fizice. Pentru aceasta exista instrumente care permit:

q       crearea unor puncte de repriza; altfel spus salvarea din timp īn timp a unor copii coerente ale bazei de date;

q       gestiunea unui jurnal de tranzactii; lista operatiilor realizate asupra bazei de date dupa ultimul punct de repriza.

Confidentialitatea datelor este asigurata prin proceduri de:

q       identificare a utilizatorilor prin nume sau cod;

q       autentificarea prin parole;

q       autorizarea accesului diferentiat prin drepturi de creare, consultare modificare sau stergere pentru anumite segmente de date.

Partajarea datelor permite īnlantuirea tranzactiilor solicitate simultan pe aceiasi īnregistrare din baza de date, prin blocarea cererilor īn asteptare si deservirea ulterioara a acestora.

Sistemul de Gestiune a Bazelor de Date (SGBD)

Un sistem de gestiune a bazelor de date constituie o interfata īntre utilizatori si BD, care permite īn principal crearea, actualizarea si consultarea acesteia. Īn acest context putem defini SGBD-ul ca un instrument de asamblare, codificare, aranjare, protectie si regasire a datelor īn BD.

Figura  2 Schema generala a unui SGBD

Principalele functiuni pe care le īndeplineste un SGBD sunt urmatoarele (fig. 2):

q       memorarea datelor pe suportul extern prin sistemul de gestiune a fisierelor;

q       gestiunea datelor si a legaturilor dintre ele īn vederea unei regasiri rapide prin intermediul sistemului de acces (SGBD intern);

q       introducerea si extragerea datelor din spre exterior īn forma ceruta de utilizator prin intermediul SGBD-ului extern.

Obiectivele unui SGBD

Obiectivul principal al unei BD este de a separa descrierea datelor fata de programele de aplicatii, idee care a fost exprimata pentru prima data īn anul 1965. Pentru atingerea acestui obiectiv este necesara o abstractizare a datelor memorate īn BD. Astfel s-a ajuns ca astazi sa existe 3 niveluri de reprezentare si perceptie a unei BD: extern, conceptual si intern.

Independenta fizica a datelor

Schema interna a BD descrie modul īn care datele sunt organizate pe suportul fizic (fisiere, īnregistrari) precum si metodele de acces, criteriile de ordonare si regasire ale acestora, astfel īncāt sa se asigure un grad de performanta si suplete cāt mai ridicat.

Independenta fizica a datelor consta īn posibilitatea de a schimba organizarea interna a datelor si structurile de īnregistrare, fara a modifica programele care le folosesc (programe utilizator). Raportāndu-ne la structura pe cele 3 niveluri, aceasta īnseamna independenta schemei interne de cea conceptuala, care descrie aceleasi date, dar pe niveluri diferite. Spre exemplu, pe baza unor criterii de performanta si flexibilitate a accesului la date, se pot adauga indecsi noi, se pot reorganiza anumite fisiere, fara a afecta schema conceptuala.

Independenta logica a datelor

Schema conceptuala a BD se obtine printr-o sinteza si integrare a schemelor externe, care reprezinta interese informationale de grup sau individuale. Īn aceste conditii, este normal ca fiecare grup de utilizatori sa aiba posibilitatea sa-si modifice īn timp cerintele informationale fara a afecta schema conceptuala a BD.

Independenta logica a datelor consta īn posibilitatea de a modifica schemele externe fara a modifica schema conceptuala. Principalele avantaje ale independentei logice a datelor sunt urmatoarele:

q       permite oricarui grup de utilizatori sa vizualizeze datele asa cum īsi doresc;

q       permite evolutia īn timp a schemelor externe ale fiecarui grup de utilizatori fara a afecta schema conceptuala;

q       permite evolutia unei anumite scheme externe fara a afecta celelalte scheme externe.

Manipularea datelor prin limbaje declarative (neprocedurale)

Īn general, exista doua categorii de utilizatori care manipuleaza datele dintr-o BD: utilizatori interactivi care, de regula, nu sunt informaticienii si programatorii. Prima categorie, are nevoie de limbaje de interogare foarte simple, apropiate de limbajul natural, care sa le permita īntr-o maniera foarte simpla sa-si obtina informatiile de care au nevoie. Un exemplu de astfel de limbaj, care este si standardizat, este SQL (Structured Query Language). Cea de-a doua categorie de utilizatori (programatorii de aplicatii) folosesc de regula limbaje procedurale cum sunt cele traditionale (generatia a treia: C, COBOL, PL1, etc.), limbaje orientate obiect (C++, Java) sau limbaje din generatia a 4-a (4LG) orientate pe descrierea specificatiilor la nivel utilizator final.

Administrarea cāt mai simpla a datelor

Un SGBD trebuie sa furnizeze instrumente adecvate pentru descrierea datelor, atāt din punct de vedere al schemei externe cāt si al schemei interne.

Operatiile de descriere si de modificare a descrierii datelor sunt cunoscute sub numele de administrarea datelor. Pentru a permite un control eficient asupra datelor si a rezolva diferite conflicte care pot aparea cu ocazia definirii acestora, aceasta operatie cade īn sarcina unui grup restrāns de persoane numite administratori de date. Administrarea centralizata a datelor, nu conduce totdeauna la realizarea unor BD performante, capabile sa multumeasca categorii de utilizatori diferiti. Pentru a īnlatura acest impediment, SGBD-urile actuale ofera instrumente adecvate care permit o descentralizare a descrierii datelor, asigurānd īn acelasi timp coerenta necesara īntre diversele descrieri partiale.

Eficacitatea accesului la date

Fiecare utilizator doreste ca interogarile sale asupra BD sa furnizeze informatiile necesare acestuia īntr-un timp cāt mai scurt. Exista doi parametri care masoara performantele accesului la date: numarul de tranzactii pe secunda si timpul de raspuns. Dimensiunile celor 2 parametri sunt dependente si de modul īn care sistemul de operare al calculatorului, sub care functioneaza SGBD-ul, aloca si partajeaza resursele fizice (unitatea centrala, memoria interna, memoria externa).

Un element foarte important care influenteaza acesti parametri īl constituie operatiile de intrare/iesire pe disc. Pentru a optimiza aceste operatii, majoritatea SGBD-urilor actuale folosesc memorii cache, unde se depoziteaza datele cele mai frecvent utilizate pe parcursul executiei unei aplicatii.

Partajarea datelor se realizeaza prin controlul accesului concurent la BD. Mai multi utilizatori vor sa acceseze simultan aceeasi īnregistrare din BD. Fizic, acest lucru nu este posibil deoarece mecanismul de acces la disc si la memoria interna este unic. Prin urmare cererile de acces simultane, sunt īnregistrate īntr-un fir de asteptare si sunt deservite īntr-o anumita ordine.

Coerenta datelor consta īn respectarea unor dependete care pot exista īntre datele din BD (vezi capitolul 7). De exemplu data angajarii unui salariat trebuie sa fie mai mare decāt data nasterii. Regulile explicite sau implicite pe care datele trebuie sa le respecte de-a lungul evolutiei lor īn BD, se numesc restrictii de integritate. SGBD-ul trebuie sa fie capabil sa pastreze coerenta datelor prin verificarea acestor restrictii de integritate.

Redundanta controlata consta īn posibilitatea de a īnregistra unele date, eliminānd astfel situatiile de īnregistrare multiple. Cu cāt redundenta este mai mica cu atāt performantele BD cresc.

Securitatea datelor (vezi capitolul 7) se refera la doua aspecte:

accesul controlat al utilizatorilor la BD (confidentialitate);

refacerea BD īn urma unor avarii.

Confidentialitatea datelor este asigurata prin proceduri de:

identificare a utilizatorilor prin nume sau cod;

autentificare a prin parole;

autorizare a accesului diferentiat prin drepturi de creare, consulatare, modificare sau stergere pentru anumite segmente de date.

Baza de date trebuie sa fie protejata īmpotriva unor distrugeri logice (anomalie de actualizare) sau fizice. Pentru acestea SGBD-ul trebuie sa ofere instrumente pentru:

crearea unor puncte de reluare; altfel spus, salvarea din timp īn timp a unor copii curente ale BD;

gestiunea unui jurnal de tranzactii; lista operatiilor realizate asupra BD dupa ultimul punct de repriza.

Daca apare o anomalie, care ar putea distruge BD, pe baza copiei de la ultima repriza si a jurnalului de tranzactii, se poate reface baza de date īn forma initiala. Protectia īmpotriva unei distrugeri fizice se face prin realizarea unor copii a BD.

Sisteme de Gestiune pentru Baze de date Distribuite (SGBDD)

Necesitatea descentralizarii sistemelor informatice, pe de o parte, si realizarea pe plan mondial a unor retele de calculatoare care permit conectarea mai multor baze de date īntr-o retea, pe de alta parte, au dus la aparitia bazelor de date distribuite si, implicit, a SGBDD. Un sistem de BDD este format dintr-o colectie de baze de date locale, amplasate geografic īn puncte diferite (noduri ale unei retele de calculatoare) si legate logic prin relatii functionale, astfel īncāt pot fi vazute la nivel global ca o singura baza de date.

Obiectivele principale ale unui SGBDD sunt:

q       definirea si manipularea colectiilor de date distribuite pe calculatoare diferite, ca un singur ansamblu logic (baza de date distribuita);

q       distribuirea datelor trebuie sa se faca dupa criterii foarte variate care sa raspunda tuturor necesitatilor utilizatorilor;

q       utilizatorii manipuleaza datele fara a cunoaste locul unde sunt memorate;

q       pentru cresterea gradului de fiabilitate sau de performanta, datele pot fi duplicate pe mai multe sisteme, fara ca utilizatorii sa cunoasca acest lucru;

q       asigurarea coerentei bazei de date īn cazul operatiilor de actualizare si de reluare īn caz de incidente la unul sau la mai multe din nodurile retelei;

q       exploatarea bazei de date īn regim de multi-acces;

q       controlul accesului la date.

4. Niveluri de reprezentare a datelor in BD

Īn demersul realizarii unei baze de date exista trei niveluri de perceptie a acesteia (figura 4):

q       extern, corespunzator utilizatorilor, care īsi exprima cerintele informationale prin asa-numitele scheme externe (subscheme);

q       conceptual, aferent administratorului bazei de date, care se concretizeaza īn schema conceptuala;

q       intern, corespunzator programatorului, care realizeaza reprezentarea datelor pe suportul fizic.


Figura  4

5. Nivelul conceptual (modelul conceptual)

Nivelul conceptual este nivelul central care reflecta datele structurate astfel īncāt acestea sa poata fi preluate si prelucrate cu ajutorul unui SGBD.

Īn proiectarea bazelor de date, la nivel conceptual, se pot utiliza mai multe modele, dintre care cel mai frecvent utilizat īn ultima vreme este modelul Entitate-Atribut-Corespondenta.

Modelul EAC abstractizeaza lumea reala si o transpune, pe de o parte, īn agregari de date elementare, numite entitati, iar pe de alta parte, īn legaturi īntre entitati, denumite corespondente (sau asocieri). Asadar, o entitate corespunde unui obiect din lumea reala, identificat, īn general, printr-un nume (o factura, un produs finit, un furnizor, un client etc.). O entitate este un model de obiect identificat īn lumea reala - material (o persoana, un lucru etc.), imaterial (un eveniment) sau abstract - al carui tip este definit de un nume si de o lista de proprietati (atribute). Un atribut se defineste ca fiind o proprietate a unei entitati sau a unei corespondente, caracterizata printr-un nume si un tip. Realizare a unei entitati se numeste multimea formata din cāte o valoare pentru fiecare atribut al entitatii. Identificatorul unei entitati este atributul (sau grupul de atribute si roluri) a carui realizare (valoare) caracterizeaza īn mod unic o realizare a entitatii. Īn reprezentarea grafica, de regula, identificatorul se subliniaza cu o linie continua.

O corespondenta sau asociere reprezinta o legatura logica īntre doua sau mai multe realizari de entitati. La nivelul limbajului natural, este definita printr-un verb. O corespondenta (asociere) poate avea proprietati particulare, date de atribute specifice.

Rolul unei entitati este un nume care desemneaza modul de participare al entitatii la o asociere. Identificarea asocierilor se realizeaza prin rolurile entitatilor participante deci, concret, cu ajutorul identificatorilor entitatilor participante.

O corespondenta īntre realizari diferite ale aceleeasi entitati se numeste asociere reflexiva, caz īn care este recomandata precizarea rolurilor fiecarei entitati īn cadrul asocierii.

Reguli:

q       o asociere nu poate exista decāt o singura data īntre aceleasi entitati;

q       numele entitatilor, corespondentelor, rolurilor, atributelor trebuie sa fie unice īn cadrul modelului conceptual, iar apoi īn baza de date definita.

Conceptele prezentate sunt utilizate īn modelarea diferitelor situatii descrise īn limbaj natural. Īn exemplul urmator este ilustrata abstractizarea unui ansamblu de date, extras din limbajul natural, aplicānd modelul EAC.

Exemplu:

Produsele finite ale unei fabrici, reprezentānd articole de īncaltaminte, sunt livrate clientilor. La livrare se īntocmesc facturi, care contin data livrarii, articole de īncaltaminte, fiecare dintre ele īntr-o anumita cantitate si la un anumit pret unitar, cota TVA corespunzatoare articolului respectiv, cu ajutorul carora se calculeaza valoarea totala a facturii. O asemenea situatie s-ar putea reprezenta prin urmatoarea schema entitate-corespondenta:

q       Entitati: ;

q       Corespondenta: ; nu are identificator;

q       Atribute:

q       Identificatori: .

Grafic se reprezinta astfel:


Se stie ca o factura poate cuprinde mai multe articole livrate, cu alte cuvinte, va contine cel putin un articol. De asemenea, īntr-o anumita perioada de timp, un articol poate sa nu fie comandat de catre clienti sau poate fi solicitat de mai multi dintre acestia, adica poate face obiectul niciuneia sau mai multor facturi. Īn proiectarea bazei de date trebuie sa se tina seama si de faptul ca un cod de produs finit trebuie sa se regaseasca printre codurile articolelor facturate. Toate acestea se numesc reguli de gestiune.

Pe baza regulilor de gestiune se stabilesc cardinalitati īntre realizarile atributelor din entitati si cele ale proprietatilor din asocieri (corespondente). Acestea exprima maniera de participare a valorilor atributelor din entitati la fiecare aparitie de valori din asocieri. Putem vorbi despre o cardinalitate minima (0 sau 1) si una maxima
(1 sau n).

Īn exemplul anterior, pentru stabilirea corecta a cardinalitatilor se va tine seama de urmatoarele reguli, observate īn activitatea de facturare si livrare:

q       un articol de īncaltaminte, īntr-un anumit interval de timp, poate fi cuprins īn minim zero facturi (se poate īntāmpla ca un anumit produs fabricat sa nu mai fie comandat de catre clienti) sau se poate factura de mai multe ori, adica - vom spune - se poate regasi īn maxim n facturi;

q       factura īntocmita la o anumita data poate contine, īn cantitati si la preturi diferite, minimum un articol de īncaltaminte, maximum n (adica unul sau mai multe produse finite ce urmeaza a fi livrate unui client al fabricii).

Figura 6 prezinta partea de model conceptual anterioara, la care s-au adaugat cardinalitatile:

Figura 6

 


Document Info


Accesari: 8720
Apreciat: hand-up

Comenteaza documentul:

Nu esti inregistrat
Trebuie sa fii utilizator inregistrat pentru a putea comenta


Creaza cont nou

A fost util?

Daca documentul a fost util si crezi ca merita
sa adaugi un link catre el la tine in site


in pagina web a site-ului tau.




eCoduri.com - coduri postale, contabile, CAEN sau bancare

Politica de confidentialitate | Termenii si conditii de utilizare




Copyright © Contact (SCRIGROUP Int. 2024 )