Documente online.
Zona de administrare documente. Fisierele tale
Am uitat parola x Creaza cont nou
 HomeExploreaza
upload
Upload




Prezentarea pachetului de programe spss


PREZENTAREA PACHETULUI DE PROGRAME SPSS

1.1. FAMILIA SPSS

Statistical Package for the Social Sciences (pe scurt, SPSS) este un produs al firmei americane SPSS Inc., destinat gestionarii si prelucrarii statistice 212i83c a datelor. El se adreseaza tuturor celor care au de efectuat calcule statistice, indiferent de domeniul in care isi desfasoara activitatea (urmarirea productiei si a vanzarilor, marketing, cercetare stiintifica etc.) si de nivelul cunostintelor lor de statistica. Dintre cei care folosesc SPSS la ora actuala, jumatate lucreaza in industrie si afaceri, peste o treime in cercetare si invatamant, iar restul in institutii guvernamentale.

Firma SPSS este binecunoscuta in intreaga lume. Avand oficii in patru continente (America de Nord, Europa, Asia si Australia), ea s-a impus in domeniul realizarii de soft pentru prelucrarea statistica a datelor prin doua produse: SPSS si SYSTAT. Versiunile pentru Windows ale ambelor pachete de programe au fost alese in 1993 ca PC-Magazine Editors' Choice.

Prima varianta a produsului SPSS a fost elaborata in urma cu peste 25 de ani. De atunci, fiecare dintre marile schimbari care au avut loc in lumea calculatoarelor a fost urmata, la scurta vreme, de aparitia unei noi versiuni.

In scopul satisfacerii cerintelor unui numar cat mai mare de utilizatori, care dispun de calculatoare si sisteme de operare diferite, au fost realizate si puse in circulatie mai multe variante ale produsului SPSS:

SPSS-X,  pentru calculatoare care utilizeaza sistemele de operare UNIX si OS/2;

SPSS/PC+,  pentru calculatoare personale care folosesc sistemele de operare PC-DOS si MS-DOS;

SPSS/Windows, pentru calculatoare personale care lucreaza sub Windows.

Exista mai multe versiuni ale fiecarei variante a SPSS, care difera intre ele nu numai prin prelucrarile statistice posibile si prin modul de realizare a interfetei cu utilizatorul, dar mai ales prin cerintele lor in privinta hard-ului si/sau a soft-ului sistemelor de calcul pe care pot fi folosite. Versiunile utilizate de cele mai multe persoane, in prezent, sunt:

• versiunea 4.0, a variantei SPSS/PC+, care functioneaza pe calculatoare personale compatibile IBM, XT si AT;

• versiunea 6.1, a variantei SPSS/Windows, care functioneaza sub Windows 3.1, sub Windows NT 3.5 si pe calculatoare Macintosh;

• versiunea 7.0, a variantei SPSS/Windows, care functioneaza sub sistemul de operare Windows 95 si sub Windows NT 3.51;

• versiunea 10.0 variantei SPSS/Windows.

1.2. CE SE POATE FACE CU SPSS ?

Cu SPSS se pot efectua diverse analize statistice ale datelor achizitionate cu ocazia cercetarilor derulate in domeniul vast al stiintelor socio-umane. In mod concret, cu ajutorul SPSS, un cercetator poate sa realizeze urmatoarele activitati:

• organizarea datelor unei cercetari intr-o baza de date in care, pentru fiecare obiect luat in evidenta, sunt inregistrate valori ale unor variabile (informatii provenite din observatii, masuratori sau calcule);

• gruparea unor variabile in vederea examinarii efectului asocierii lor;

• calculul principalilor indici statistici (media, mediana, abaterea standard etc.);

• testarea ipotezelor statistice folosind teste parametrice si neparametrice;

• calculul a diversi indici de corelatie intre variabile;

• utilizarea unor procedee statistice avansate;

• reprezentari grafice ale rezultatelor.

1.3. CONDITII NECESARE PENTRU UTILIZAREA SPSS/WINDOWS

Versiunea 7.0 a SPSS are urmatoarele cerinte hard:

• un calculator personal compatibil IBM, dotat cu un microprocesor 80486 sau mai bun;

• cel putin 8 MB memorie RAM;

• 45 MB spatiu liber pe discul hard;

• un monitor VGA sau SVGA.

In plus, este necesar sa fie instalat sistemul de operare Windows 95.

1.4. CATEVA CARACTERISTICI ALE VERSIUNII 7.0 A SPSS

Versiunea 7.0 efectueaza o gama foarte larga de prelucrari, de diverse complexitati (de la afisarea datelor in liste si tabele si calculul indicilor statisticii descriptive pana la analize sofisticate, precum modele liniare generale, MANOVA sau regresii neliniare), insotite de reprezentari grafice sugestive. Amintim cateva caracteristici ale acestor versiuni, care le fac usor de utilizat.

• Introducerea si modificarea datelor este o operatie simpla, datorita existentei unui editor de date care lucreaza cu tabele (gen spreadsheet). Pe ecran este afisat un tabel, ale carui linii corespund cazurilor (subiecti care raspund unui chestionar sau obiecte observate) si in ale carui coloane figureaza variabilele (raspunsuri date de subiecti, rezultatele unor observatii sau masuratori ori valori obtinute prin calcule). Utilizatorul poate 'naviga' prin acest tabel, dupa dorinta, inspectand valorile existente, schimband unele date, adaugand sau stergand cazuri si variabile. SPSS adapteaza automat dimensiunile tabelului astfel incat sa nu se piarda nici o valoare introdusa. Nu exista limitari in privinta numarului de cazuri sau de variabile care pot fi incluse in fisierul de date.

• Datele pot fi preluate si din fisiere create de alte programe, cum sunt: tabele create de Lotus 1-2-3 si Excel, baze de date create de dBase, fisiere de date salvate in format SYLK (symbolic link), fisiere de text ASCII. De asemenea, fisierele de date create de SPSS pot fi exportate in Lotus 1-2-3 _i Excel sau pot fi salvate in format SYLK ori ca fisiere de text ASCII.

• Inainte de efectuarea prelucrarilor statistice, datele pot fi modificate automat de catre SPSS, pe baza unor algoritmi indicati de utilizator pentru recodificarea valorilor sau prin aplicarea unor functii aritmetice. De exemplu, intr-un fisier in care cazurile sunt reprezentate de persoane examinate psihologic iar variabilele de scorurile acestora la diverse teste psihologice, toate cotele brute pot fi schimbate automat in cote T.

• Utilizatorul poate alege cazurile care sa fie luate in considerare la efectuarea prelucrarilor, formuland conditii asupra valorilor uneia sau a mai multor variabile. De exemplu, in studiul relatiei dintre nivelul de scolarizare si preferinta pentru diverse genuri muzicale pot fi incluse, din intregul fisier de date, doar persoanele domiciliate in mediu urban.

• Utilizatorul poate decide cum sa fie tratate de SPSS cazurile in care valoarea unei variabile nu este cunoscuta sau nu prezinta interes pentru cercetare. Ele pot sa fie sau sa nu fie incluse in calcule.

• Grafice diverse permit depistarea rapida a valorilor aberante. Acestea sunt valori izolate, diferite mult de celelalte din acelasi fisier, care ar putea fi datorate unor erori la introducerea datelor.

• Utilizatorul are controlul deplin asupra tuturor variabilelor prelucrate. El decide cum sa se afiseze valorile in listele de iesire (pe ce lungime, cu cate cifre zecimale) si ce text sa fie scris in locul denumirilor de variabile (daca acestea nu sunt destul de sugestive) sau in locul valorilor variabilelor (daca in fisierul de date s-au introdus coduri). De exemplu, daca pentru variabila corespunzatoare mediului de domiciliu al subiectilor, cu denumirea MEDDOM, s-au introdus in fisier valorile U si R, in listele de iesire poate sa apara scris 'Urban' in loc de U si 'Rural' in loc de R, iar numele variabilei sa fie inlocuit cu textul 'Mediu de domiciliu'.

• Orice prelucrare se poate face in conditii extrem de variate. Spre exemplu, calculul frecventelor poate fi insotit sau nu de afisarea tabelului de frecvente, de reprezentarea grafica prin histograma sau prin diagrama in coloane, de calculul unor indici statistici cum ar fi cuantile, indici ai tendintei centrale (media, mediana, modul), parametri de imprastiere (dispersia, valoarea minima si maxima); reprezentarea grafica poate lua in considerare frecventele absolute ale valorilor sau procentele; peste histograma se poate sau nu suprapune curba normala.

Este greu de imaginat o varianta de prelucrare a datelor pe care SPSS sa nu o poata realiza.

• Alegerea modului de prelucrare a datelor este deosebit de simpla, datorita meniurilor si a cutiilor de dialog la care se ajunge prin manevrarea mouse-ului.

Modul de operare cu mouse-ul poate fi invatat in doar cateva minute.

• Utilizatorul nu are nevoie sa citeasca un manual pentru a sti cum sa comande o prelucrare. Optiunea Help este accesibila permanent si ii poate explica semnificatia diversilor termeni din meniuri si casute de dialog.

In plus, un program tutorial on-line ofera explicatii si exemple care ajuta la orientarea rapida printre prelucrarile numeroase care pot fi realizate de SPSS.

• SPSS poate fi folosit si de persoane putin initiate in statistica. Pentru orice notiune necunoscuta, dintr-o casuta de dialog sau chiar dintr-o lista de iesire, este suficient sa se indice denumirea respectiva, pe ecran, cu mouse-ul si sa se aleaga optiunea What's This, pentru ca SPSS sa afiseze un text explicativ.

Cu SPSS se pot chiar reactualiza si completa cunostintele de statistica, intrucat butonul Help permite accesul la un glosar de termeni statistici.



• Daca un grup de prelucrari se efectueaza periodic (de exemplu, daca intereseaza situatia zilnica a raspunsurilor la un chestionar primite prin posta) nu este nevoie sa se repete de fiecare data intreaga succesiune de cautari prin meniuri si de alegeri de optiuni. Se poate cere sa se inregistreze intr-un fisier de comenzi toate aceste operatii, executate de utilizator o singura data. Fisierul va fi rulat ori de cate ori este necesar. La nevoie, fisierul poate fi modificat, adaugandu-se sau stergandu-se comenzi.

• Rezultatele prelucrarilor statistice se pot vizualiza prin tabele de diverse formate si prin multe tipuri de reprezentari grafice: histograme, diagrame in coloane -izolate sau grupate-, diagrame de structura circulare, nori statistici in care punctele corespunzatoare unor grupe diferite de cazuri sunt colorate diferit, diagrame care indica in acelasi timp media, valorile extreme si repartitia valorilor unei variabile pentru valori diferite ale altei variabile (de exemplu, varsta locuitorilor din mai multe orase).

• Listele de rezultate, tabelele si graficele realizate de SPSS pot fi incluse in rapoarte, asa cum se prezinta pe ecran sau modificate. Utilizatorul poate interveni in ele prin:

• editarea de text;

• schimbarea caracteristicilor fontului (tip, stil, culoare, marime);

• ascunderea unor variabile din tabele;

• reorganizarea informatiilor din tabele (de exemplu, un tabel de frecvente, care contine pe linii raspunsurile la un chestionar, iar pe coloane localitatea de domiciliu si, in cadrul fiecarei localitati, sexul clientilor, poate fi transformat intr-un tabel cu numai doua coloane -corespunzatoare sexului clientilor - si cu grupe de linii, cate o grupa pentru fiecare localitate);

• modificarea desenelor prin deplasarea axelor, rotirea lor sau chiar schimbarea tipului de grafic.

1.5. MODULELE PACHETULUI DE PROGRAME SPSS

SPSS este un produs modular. Acest lucru constituie un avantaj, din doua motive:

• utilizatorii pot cumpara doar modulele care le sunt necesare;

• atunci cand apare necesitatea completarii ultimei versiuni a SPSS cu functiuni sau algoritmi de prelucrare a datelor, se realizeaza module noi, care se adauga celor existente deja, fara a fi necesara inlocuirea produsului.

Prezentam in continuare cateva dintre modulele cele mai mult folosite, cu denumirea sub care sunt comercializate.

Base module realizeaza gestionarea datelor si a fisierelor, transformarea datelor, diverse reprezentari grafice, precum si prelucrarile statistice cele mai frecvent aplicate:

• calculul frecventelor, al indicilor tendintei centrale si al indicatorilor variabilitatii;

• calculul unor masuri de asociere si testarea independentei probabilistice pentru date incluse in tabele de contingenta;

• compararea mediilor si a dispersiilor unei variabile intre populatii;

• analiza de varianta unifactoriala;

• calculul coeficientilor de corelatie Pearson, Kendall si Spearman;

• analiza de regresie liniara;

• teste neparametrice.

Modulul Professional Statistics se utilizeaza numai impreuna cu modulul de baza. Include proceduri pentru calculul similaritatii si al disimilaritatii variabilelor, clasificarea cazurilor pe baza valorilor unor variabile si identificarea factorilor continuti de variabile. Efectueaza analiza de discriminant, analiza factoriala, analiza de clusteri, scalarea multidimensionala, regresia ponderata si analiza fidelitatii.

Modulul Advanced Statistics se foloseste numai impreuna cu modulul de baza. El permite efectuarea unor prelucrari statistice complicate, necesare atunci cand datele nu indeplinesc conditiile de aplicare a prelucrarilor statistice obisnuite. Dintre metodele care pot fi utilizate folosind acest modul amintim: analiza de regresie logistica, analiza de varianta ANOVA generalizata, analiza de varianta multivariata MANOVA, analiza logliniara, analiza de regresie neliniara, analiza probit si logit, analiza duratei de viata, analiza de supravietuire Kaplan-Meier si modelul liniar general (GLM).

Modulul Tables se utilizeaza numai impreuna cu modulul de baza. El serveste la condensarea datelor in tabele cu una, doua sau trei dimensiuni. Fiecare dimensiune este definita printr-o variabila sau printr-un grup de variabile (de exemplu, pe linii se poate reprezenta profesia si sexul subiectilor, iar pe coloane, raspunsurile posibile la un item dintr-un chestionar). In cazul tabelelor tridimensionale, se intocmeste cate un tabel bidimensional pentru fiecare nivel al variabilei sau al grupei de variabile care defineste cea de a treia dimensiune.

Tabelele pot contine frecvente (pentru fiecare celula sau pentru fiecare valoare a fiecarei variabile) ori valorile unor indicatori statistici (media, abaterea standard etc.) pentru o variabila, calculate pentru fiecare valoare posibila a altei variabile sau pe intregul tabel.

Avantajul oferit de modulul Tables comparativ cu modulul de baza consta in posibilitatea de cuprindere a mai multor variabile independente intr-un singur tabel.

Modulul Exact Tests calculeaza valori exacte pentru nivelurile de semnificatie (valorile p) ale statisticilor utilizate in teste neparametrice si in analiza tabelelor de contingenta, spre deosebire de modulul de baza, care calculeaza doar valori asimptotice.

Aplicarea testelor statistice din modulul de baza este corecta doar daca sunt indeplinite anumite presupuneri, specifice fiecarui test: volumul esantionului este suficient de mare, variabila cercetata are o lege de repartitie particulara, precizata etc. Daca aceste presupuneri nu sunt adevarate, valorile p afisate de modulul de baza nu sunt precise.

Modulul Exact Tests calculeaza nivelurile de semnificatie pentru:

• teste neparametrice aplicate la un esantion, la doua esantioane independente sau perechi si la k esantioane dependente sau independente;

• teste aplicate tabelelor de contingenta 2x2 si rxc;

teste de semnificatie pentru coeficientii de corelatie Pearson si Spearman;

• teste referitoare la relatiile dintre variabile masurate pe scala nominala sau pe scala ordinala.

Modulul CHAID (Chi-squared Automatic Interaction Detector) aplica algoritmi de segmentare pentru impartirea unei populatii in grupe disjuncte, care difera intre ele in ceea ce priveste un criteriu precizat. Fiecare grupa este definita printr-o combinatie de variabile predictor, determinata astfel incat fiecare caz pentru care se cunosc valorile predictorilor respectivi sa poata fi repartizat in grupa potrivita.

Grupele formate la fiecare pas al algoritmilor de segmentare sunt vizualizate sub forma unei dendrograme.

Spre deosebire de analiza de clusteri, care de asemenea formeaza grupe disjuncte in multimea cazurilor analizate, CHAID utilizeaza o variabila dependenta drept criteriu pentru realizarea clasificarii. In plus, CHAID permite predictia valorilor variabilei dependente.

Modulul Categories se foloseste in scopul determinarii influentei exercitate de caracteristicile produselor sau a serviciilor asupra preferintei consumatorilor.

Datele de intrare sunt constituite din opiniile subiectilor, exprimate prin scoruri sau ranguri, fata de mai multe produse descrise prin aceleasi variabile, dar care difera intre ele prin valorile variabilelor. Algoritmii aplicati calculeaza scoruri de utilitate pentru fiecare valoare a fiecarei variabile, identifica atributele produsului care au cea mai mare importanta pentru consumator si determina caracteristicile produsului care ar fi preferat cel mai mult.

Modulul Categories permite si vizualizarea obiectelor analizate, prin puncte, in scopul identificarii asemanarii sau a deosebirii dintre acestea. Pentru reducerea numarului de dimensiuni cu ajutorul carora sunt reprezentate obiectele se pot aplica urmatoarele proceduri de scalare optimala: analiza corespondentelor, analiza omogenitatii, analiza componentelor principale neliniara si analiza corelatiilor canonice neliniara. Aceste metode pot fi utilizate si atunci cand variabilele prin care sunt descrise obiectele sunt masurate pe scale diferite sau cand exista perechi de variabile masurate pe scala de interval intre care relatia este neliniara.

Modulul TRENDS serveste la analiza si reprezentarea grafica a seriilor de timp. Se estimeaza coeficientii modelului potrivit unei serii de timp, prin urmatoarele tehnici:

• proceduri de netezire;

• metode de regresie;

• analiza Box-Jenkins (ARIMA), pentru estimarea modelelor sezoniere si nesezoniere unidimensionale;

• procedura de descompunere sezoniera, pentru estimarea factorilor sezonieri, aditivi si multiplicativi, din serii de timp periodice;

• analiza componentelor de frecventa.


Document Info


Accesari: 1117
Apreciat: hand-up

Comenteaza documentul:

Nu esti inregistrat
Trebuie sa fii utilizator inregistrat pentru a putea comenta


Creaza cont nou

A fost util?

Daca documentul a fost util si crezi ca merita
sa adaugi un link catre el la tine in site


in pagina web a site-ului tau.




eCoduri.com - coduri postale, contabile, CAEN sau bancare

Politica de confidentialitate | Termenii si conditii de utilizare




Copyright © Contact (SCRIGROUP Int. 2024 )