Laborator: Statistica Univariata Descriptiva
Sectia Asistenta Sociala si Sociologie, Anul I
Scopul Laboratorului este de a furniza studentilor cunostinte teoretice de Statistica Descriptiva Univariata si utilizarea acestor cunostinte in programe de analiza statistica (SPSS); studentii trebuie sa se familiarizeze cu utilizarea softului SPSS si cu meniurile acestuia, introducerea datelor, codificarea variabilelor.
Laborator 1.
Introducere in SPSS.
Notiuni introductive de utilizarea a SPSS
Meniul File
Se foloseste pentru:
Deschiderea unui Nou Document,
Deschiderea unui Document Existent,
Printare,
Salvarea Documentelor,
Salvarea Documentelor sub un alt nume,
Re-deschiderea ultimelor documente utilizate
Inchiderea Sesiunii de lucru.
Meniul EDIT:
Copiere,
Decupare,
Stergere Documente, coloane, randuri
Gasirea valorilor unei Variabile
Schimbarea Setarilor Programului SPSS.
Casuta de Dialog Options permite (re)configurarea SPSS.
Meniul VIEW:
Aparitie/disparitie bara de Stare
Modificarea meniurilor de lucru
Modificare Fonturi
Vizualizarea / ascunderea liniilor tabelare si a valorilor
Meniul DATA se foloseste pentru:
Definirea Variabilelor
Inserare de Variabile
Inserare de Noi Cazuri
Identificarea cazurilor
Pentru lipirea mai multor baze de date (in cazul unui sondaj de opinie in cadrul caruia datele au fost centralizate de mai multi operatori) - Merge Files
Pentru SPSS 13. se pot identifica inclusiv dublarile (ilicite) de cazuri realizate de catre operatorii de baze de date.
In situatia in care dorim sa aflam informatii doar despre o parte a esantionului, si sa omitem celelalte cazuri folosim Select Cases.
Daca vrem sa selectam un Esantion aleator de cazuri din baza de date procedam astfel: Select Cases - Random Sample.
Selectarea unor subesantioane pentru analize separate (Select Cases)
Meniul TRANSFORM permite:
Modificarea Variabilelor existente, in aceeasi variabila, sau crearea uneia noi
Inlocuirea valorilor lipsa
Compute - crearea de indici sintetici pe baza variabilelor deja existente (ex. Indicele increderii in membrii diferitelor partied politice, calculate ca si medie a increderii in toate personajele publice ale partidului).
O variabila poate fi codificata obtinand o alta variabila sau transformandu-se ea insasi (Recode - Into the same variable & Into Different Variable).
Analyse:
Initierea diferitelor metode de analiza statistica (descriptiva, inferentiala, univariata, multivariata).
Meniul Graphs:
Se utilizeaza pentru crearea de grafice.
Bare, 2D sau 3 D
Linii,
Pie Charts,
Histograme.
Serii de Timp, etc.
Meniul UTILITIES:
Afisarea informatiilor despre variabilele incluse in baza de date
Informatii despre baza de date
Setarea Meniurilor si a Editoarelor SPSS (eliminarea casutelor de dialog inutile, etc)
Meniul WINDOWS:
Controleaza aparitia pe ecran a diferitelor ferestre SPSS.
Meniul Help
Informeaza asupra utilizarii diferitelor module ale SPSS.
Laborator 2.
Concepte Uzuale in Statistica Sociala
Populatia statistica reprezinta o colectie de obiecte simple sau complexe, de aceeasi natura (persoane, animale, plante, obiecte, familie, clasa de elevi, etc) care reprezinta obiectul cercetarii.
Unitatile statistice sunt elementele componente (constitutive) ale colectivitatii statistice, simple (student, taran) sau complexe (familia, echipa, grupa de studenti).
Inferenta statistica se refera la utilizarea informatiilor despre un esantion pentru a obtine concluzii (inferente) asupra populatiei la care se refera esantionul.
Esantionul reprezinta un grup de unitati statistice care sunt extrase din cadrul populatiei si asupra caruia se realizeaza, nemijlocit, investigatia. Esantionul trebuie sa fie reprezentativ, adica unitatile vor fi astfel alese incat prin intermediul acestui studiu (redus) sa obtinem concluzii cu valabilitate generala, care dau seama de caracteristicile intregului univers de cercetare.
In functie de maniera de selectie a esantionului avem esantioane probabiliste, in care fiecare individ al populatiei are sanse calculabile, diferite de 0 de a fi selectat in esantion si non-probabiliste, in selectia carora intervin elemente subiective. Pentru a elimina cat mai mult din subiectivismul in alegerea unitatilor de esantionare operatorilor de teren li se impun o serie de reguli de esantionare care trebuiesc respectate (ex. Trebuie sa aleaga respondentii conform unor cote de esantionare).
Caracteristicile, variabilele statistice reprezinta insusiri sau trasaturi ce caracterizeaza si delimiteaza unitatile populatiei. Variabilele pot fi masurare, manipulate sau controlate pe parcursul cercetarii. Acestea difera dupa rolul jucat in cercetare si dupa tipul de masurare.
Variabile independente si dependente. Variabilele independente sunt acelea manipulate in timp ce variabilele dependente sunt masurate sau inregistrate. Variabilele independente (caracteristici de personalitate, socio-demografice, sex, varsta, profesie, nivel de scolarizare) induc efecte, influenteaza variabilele dependente (decizie de vot, consum mass media, etc).
Scale de masurare ale variabilelor. In functie de nivelul de masurare dorit se va recurge la scale non-metrice (nominale si ordinale) si metrice (interval si proportionale).
Scala nominala este cea mai restrictiva din punct de vedere matematic si are cea mai redusa capacitate de masurare. Aceasta scala indica faptul ca un obiect poseda o caracteristica sau alta, fara a induce vreo ierarhizare intre acestea (romanii sunt: moldoveni, olteni, ardeleni, etc).
Scala ordinala permite ordonarea caracteristicilor ierarhic (prima, a doua, a treia, etc) fara a furniza informatii suplimentare despre marimea diferentelor dintre acestea.
Ex.: urmatoarele 3 intrebari (sursa: Barometru de Opinie Publica Octombrie 2004) sunt tipice pentru scalele ordinale.
Cata incredere aveti in ? |
Foarte multa |
Multa |
Putina |
Foarte putina |
Deloc |
|
|
Traian Basescu |
|
|
|
|
|
|
Markó Béla |
|
|
|
|
|
|
Adrian Nastase |
|
|
|
|
|
Scala Interval. Utilizeaza unitati de masura egale ceea ce permite nu doar ordonarea categoriilor de raspuns (alternativelor) ci si a distantelor dintre acestea in functie de anumite criterii. Scalele de masurare Celsius si Fahrenheit sunt astfel de exemple.
Scala Proportionala realizeaza masurarea in cel mai inalt grad posibil. Permite efectuarea tuturor operatiilor premise de celelalte scale, inclusiv multiplicarea sau divizarea unui numar de pe scala cu altul. Scala proportionala are un punct zero unic. Scalele de masurare ale timpului si spatiului sunt tipice pentru acest tip de scale.
Variantele (valorile) variabilei reprezinta formele concrete de manifestare ale variabilei.
Tipul de Scala |
Proprietati ale Scalelor |
|||
|
Clasificari |
Ordonari |
Intervale Egale |
Origine Unica |
Nominala |
V |
|
|
|
Ordinala |
V |
V |
|
|
Interval |
V |
V |
V |
|
Proportionala |
V |
V |
V |
V |
Laborator 3.
Indicatori Statistici ai Variabilelor Cantitative
Prin "indicatori statistici" ne referim la o serie de valori atasate variabilelor statistice cantitative, prin intermediul carora se incearca exprimarea, intr-o maniera sintetica, a informatiei continute de variabile.
Distingem intre;
A.Indicatorii Tendintei Centrale
Rolul acestora este de a reda printr-o valoare numerica unica nivelul general al valorilor seriei sau ordinul de marime al acestor valori. Media aritmetica, mediana si valoarea modala reprezinta indicatorii tendintei centrale.
Media (aritmetica) este suma tuturor valorilor dintr-o populatie impartita la numarul de indivizi ai populatiei. Luand in considerare urmatorul set de date: 5 3 54 93 83 22 17 19, media aritmetica a esantionului, pe baza careia se va calcula media populatiei este:
Mediana (Me)
Presupunand ca toti indivizii dintr-o populatie sunt asezati in ordine crescatoare in functie de o anumita valoare, mediana este valoarea care imparte exact in doua parti acest sir de valori. .
Ex pentru 21 cazuri, se ia valoarea a - 11 - a..
Datele |
|
Ordonarea datelor |
|
Median |
48, 10 cazuri inainte si 10 cazuri dupa. |
Ex.: Pentru 20 de cazuri de ia in considerare valoarea de mijloc dintre cele doua valori centrale.
Datele |
|
Ordonarea datelor |
|
Median |
48, intre 47 si 49 |
Cuartilele sunt valorile care impart distributie in 4 intervale (sferturi).
25% valori - cuartila 1 - 25% valori - Me=Q2 - 25% Q3 - 25%.
In aceeasi categorie includem decilele (creaza 10 intervale) si percentilele (100 intervale).
Cuartila 2 si Mediana se suprapun.
Modul sau Valoarea Modala (Mo) reprezinta valoarea ce caracterizeaza indivizul tipic al populatiei (ci frecventa cea mai mare).
Mo = Me - 3 (Media - Me)
Este posibil sa intalnim distributii unimodale sau plurimodale (mai multe valori modale).
In functie de tipul de scala de masurare al unei variabile. Putem folosi diferiti indicatori ai tendintei centrale, dupa cum urmeaza in tabelul alaturat.
Tipul de Scala |
Proprietati ale Scalelor |
|||
|
Valoarea Modala |
Mediana |
Media Aritmetica |
Media Geometrica |
Nominala |
V |
|
|
|
Ordinala |
V |
V |
|
|
Interval |
V |
V |
V |
|
Proportionala |
V |
V |
V |
V |
Indicatorii de Dispersie
Caracterizeaza o populatie statistica din punctual de vedere al omogenitatii / eterogenitatii. Indicatorii de dispersie reprezinta o informatie suplimentara atasata indicatorilor tendintei centrale. In constructia modelelor explicative, indicatorii de dispersie indica gradul de determinare al unui fenomen, adica sporirea posibilitatii de a prezice starea unui fenomen.
Dintre indicatorii de dispersie cei mai semnificativi sunt amplitudinea si abaterea standard.
Amplitudinea
A = X maxim - X minim (diferenta intre valoarea maxima sic ea minima). Bazandu-se pe 2 valori "extreme"
Deviatia standard (standard deviation), б, notata cu sigma.
Aceasta se calculeaza prin ridicarea la patrat a diferentelor dintre valorile individuale si medie, insumarea patratelor si impartirea la numarul de cazuri (n) existente. Din valoarea finala se extrage radicalul.
Ex..
Indicatorii formei Distributiei
Indicatorii de Oblicitate (skewness) indica in ce masura valorile centrale se abate spre dreapta/stanga fata de curba normala (teoretica, in cazul careia Media = Me = Mo).
Oblicitatea = (Media - Mo) / б
Sau
Oblicitatea = 3(Media - Me) / б
Indicatorii de Boltire (kurtosis) indica inaltimea "cocoasei curbei" distributiei fata de curba normala, teoretica. Putem avea curbe platicurtice (aplatizate) cu valori negative sau leptocurtice (ascutite) cu valori pozitive.
Curba (clopotul) lui Gauss. 34,1% dintre cazuri sunt cuprinse intre medie si deviatia standard.
Distributia normala modeleaza variabilele continue aleatoare (acestea iau
valori cuprinse intre ±∞)
Laborator 4.
Codificarea Variabilelor in format SPSS
Variable Viewer - permite codificarea variabilelor
Alegere nume Variabila (maxim 8 caractere)
Stabilire zecimale vizibile
Alegere tip variabila
Denumire Variabila
Stabilire valori Variabila
Stabilirea Valorilor Lipsa
Vizualizare Variabile, introducere noi cazuri sau variabile.
Laborator 5.
Obtinerea in SPSS a indicatorilor statistici.
Analyse - Descriptive Statistics - Frequescies - Stastistics & Charts
Analyse - Descriptives - Descriptives - Options
Tabel de Frecventa: Frecventa Absoluta
Frecventa Relativa (%)
Procentaje Valide
Procente Cumulative
Bibliografie:
Traian Rotariu, 1999, Metode Statistice Aplicate in Stiintele Sociale,Editura Polirom, pp 43 - 66. (Indicatori Statistici)
Ioan Marginean, 2000, Proiectarea Cercetarii Sociologice, Editura Polirom, pp 101 - 140.
SPSS 10.00 Statistic Coach & Help
|