Marian Popa
Ajunsi la sfârsitul tematicii care face obiectul acestei introduceri în statistica psihologica aplicata, se cuvine sa aruncam o privire de ansamblu asupra semnificatiei generale a utilizarii metodei statistice. Acest lucru ne va fi util pentru exploata în mod corect si eficient forta probatorie a testelor statistice, fara a ne lasa subjugati de iluzia infailibilitatii lor.
Doua sunt aspectele care merita o atentie speciala din acest punct de vedere:
A.   737n132h ; alegerea testului statistic în raport cu datele disponibile si ipoteza cercetarii
B.   737n132h ; integrarea analizei statistice în documentul de cercetare
În statistica, cel mai simplu lucru este "sa aplici formula" si sa calculezi rezultatul. Dificultatea consta în a alege "formula" (a se citi: procedura statistica adecvata scopului propus si datelor disponibile) si a interpreta rezultatul. Pentru a rezolva aceasta problema sunt necesare cunostinte de psihologie experimentala, dar si o experienta destul de îndelungata în prelucrarea datelor. Totusi, situatia poate fi mult usurata daca se respecta un set de reguli de baza cu privire la realizarea unui model de cercetare bazat pe analiza statistica:
  737n132h ; Punctul de pornire este formularea ipotezei. Ea deriva din problema cercetarii si se exprima sub forma raspunsului pe care, în mod legitim, cercetatorul se asteapta sa îl confirme cu ajutorul datelor statistice.
  737n132h ;   737n132h ;   737n132h ; Exemplu:
  737n132h ;   737n132h ; Problema cercetarii: Într-un centru de dializa se observa ca pacientii sufera de tulburari anxioase severe.
  737n132h ;   737n132h ; Modelul cercetarii: Un program de reducere a anxietatii bazat pe exercitii de relaxare, prezentate pe casete video este realizat pe un grup de pacienti. Se aplica un chestionar de evaluare a anxietatii grupului studiat si unui grup de control, care nu a urmat programul de relaxare.
  737n132h ;   737n132h ; Ipoteza cercetarii: Exercitiile de relaxare reduc nivelul anxietatii
  737n132h ; Se identifica variabilele cercetarii. În exemplul de mai sus:
  737n132h ;   737n132h ; Variabila independenta este "apartenenta la grupurile cercetarii". Aceasta poate primi doua valori conventionale: "1" pentru subiectii care au urmat sedinte de relaxare; "2"pentru subiectii din grupul de control.
  737n132h ;   737n132h ; Variabila dependenta este "nivelul anxietatii", masurata pe o scala de interval/raport
  737n132h ; Se recolteaza datele cercetarii, având grija sa fie respectate toate conditiile si criteriile care sa asigure corectitudinea acestora. Orice eroare în aceasta faza (în special cu privire la constituirea esantionului dar si legat de motivarea subiectilor, corectitudinea înregistrarilor, etc.) se vor traduce în dificultati insurmontabile în faza de prelucrare si analiza a datelor. În cazul nostru, se va acorda constituirii grupurilor de studiu, având grija ca acestea sa nu difere sub aspectul unor aspecte care pot influenta efectul relaxarii (vârsta, nivel de instruire, sex, severitate a bolii, etc.).
  737n132h ; Se sintetizeaza datele cercetarii si se trece la prelucrarea acestora. Fazele obligatorii ale acestor prelucrari sunt urmatoarele:
  737n132h ;   737n132h ; Analiza preliminara a variabilelor, cu ajutorul procedurilor statistice descriptive. Scopurile urmarite:
  737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ; i.   737n132h ; verificarea corectitudinii datelor
  737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ; ii.   737n132h ; evidentierea caracteristicilor distributiei fiecarei variabile, în vederea alegerii ulterioare a testului statistic adecvat
  737n132h ;   737n132h ; Corectarea eventualelor erori de înregistrare, rezolvarea situatiilor în care exista date lipsa, transformarea variabilelor, daca acest lucru se impune, etc.
  737n132h ;   737n132h ; Testarea ipotezei cu ajutorul testului statistic de semnificatie si adoptarea deciziei cu privire la ipoteza cercetarii.
Din cele prezentate, rezulta faptul ca alegerea testului statistic este ultima si nu prima dintre problemele pe care trebuie sa si le puna cercetatorul. Daca toate celelalte faze au fost urmate în succesiunea lor fireasca, alegerea testului statistic devine o problema relativ simpla. Principalele componente ale algoritmului de selectare sunt urmatoarele:
  737n132h ; Se identifica variabila independenta
  737n132h ; Se identifica variabila dependenta
a)   737n132h ; daca este de tip nominal/ordinal, se aplica un test neparametric
b)   737n132h ; daca este de tip interval/raport
i)   737n132h ;   737n132h ; daca respecta conditiile si daca, mai ales, esantionul este mare, se recomanda alegerea unui test parametric
ii)   737n132h ;   737n132h ; daca nu respecta conditiile si, mai ales, esantionul este mic, se recomanda alegerea unui test neparametric (în acest caz valorile vor fi transformate pe o scala nminala sau ordinala, în functie de caracteristicile lor si optiunea cercetatorului)
  737n132h ; Se precizeaza obiectivul cercetarii care poate fi, cel mai adesea:
a)   737n132h ; Diferenta dintre grupuri dependente sau independente (ca în exemplul nostru). Acest model este mai potrivit în urmatoarele situatii:
i)   737n132h ;   737n132h ; atunci când variabila independenta, prin natura ei, se exprima în categorii naturale (de ex., categorii de vârsta, familii divortate/nedivortate, sexul, etc.)
ii)   737n132h ;   737n132h ; atunci când variabila independenta exprima valori care nu evolueaza într-o maniera liniara (de ex., prezenta/absenta, diagnostice psihiatrice, tipuri temperamentale)
iii)   737n132h ; atunci când variabila independenta este manipulata
În acelasi timp, este de retinut ca nu este recomandabil sa se transforme o variabila de interval/raport, care are o distributie acceptabila, într-o variabila categoriala, deoarece se pierde din puterea statistica a testelor.
b)   737n132h ; Gradul de asociere. Acest model de cercetare este recomandabil atunci când avem de a face cu variabile masurate simultan sau succesiv pe aceiasi subiecti (modele de tip "înainte-dupa", "intrasubiect"), sau pe subiecti apartinând unor esantioane perechi.
Câteva recomandari utile pentru acest aspect:
  737n132h ; Atunci când, atât v. independenta cât si v. dependenta sunt de acelasi tip (cantitative sau calitative), obiectivul obisnuit este "gradul de asociere"
  737n132h ; Atunci când v. independenta este de tip categorial (nominal sau ordinal), iar v. dependenta este de tip cantitativ, obiectivul obisnuit este "diferenta dintre grupuri (categorii)"
  737n132h ; Se alege testul statistic adecvat
Ce este de preferat, test parametric sau test neparametric?
  737n132h ;   737n132h ;   737n132h ; Daca variabila dependenta este masurata pe scala nominala sau ordinala, problema alegerii nu se pune, singurele teste aplicabile fiind cele neparametrice. Atunci când variabila dependenta este exprimata pe o scala cantitativa (interval/raport), daca întruneste conditiile impuse de statistica parametrica, este recomandabil sa se utilizeze teste parametrice. În acest caz însa trebuie avute în vedere doua aspecte:
  737n132h ;   737n132h ; Situatia în care variabila dependenta cantitativa nu respecta conditiile testelor parametrice, în raport cu care exista doua solutii:
o   737n132h ;   737n132h ; se vor efectua verificari pentru eventuala corectie de valori, tratarea valorilor lipsa, transformari parametrice, urmate de utilizarea testelor parametrice
o   737n132h ;   737n132h ; se transforma variabila dependenta pe o scala de tip nominal sau ordinal, urmata de aplicarea unor teste neparametrice adecvate
  737n132h ;   737n132h ; Luarea în considerare a marimii esantionului. Teorema limitei centrale ne asigura cu privire la normalitatea distributiei de esantionare pentru esantioane care depasesc N=30. Pentru esantioane de volum mediu (apropiat de 30 de valori), testele parametrice sunt mai sensibile la respectarea conditiilor impuse si, de aceea, utilizarea testelor neparametrice pare a fi o solutie mai buna. În practica, se va avea în vedere faptul ca testele statistice, atât cele parametrice cât si cele neparametrice, efectuate pe esantioane reduse, sub N=20, nu ofera rezultate robuste iar credibilitatea lor este îndoielnica. Esantioanele mici nu contin suficienta informatie care sa permita fundamentarea unei inferente statistice suficient de sigure si cu putere de generalizare. Studiile pe esantioane de acest gen pot avea o valoare de "studii pilot" în vederea deciziei de a lansa sau nu studii de amploare pe o anumita tema.
Etapele analizei statistice a datelor
În principiu, orice analiza statistica dintr-un proiect de cercetare cuprinde doua etape: (1) analiza statistica descriptiva si (2) testarea ipotezelor.
Analiza statistica descriptiva
Tabelul urmator prezinta în mod sintetic algoritmul de alegere a procedurii descriptive adecvate, în functie de obiectivul analizei si de tipul de variabila:
Obiectivul descrierii |
Scala de masurare |
Conditie |
Solutie |
reprezentarea întregii distributii |
nominala |
tabela de frecvente |
|
grafic de tip bara |
|||
ordinala |
distributie de frecvente |
||
grafic de tip bara |
|||
I/R |
distributie de frecvente |
||
Histograma |
|||
Poligon |
|||
Masura tendintei centrale |
nominala |
Mod |
|
ordinala |
Mediana |
||
I/R |
Simetrica |
Medie |
|
Asimetrica |
Mediana |
||
Masura variabilitatii |
nominala |
numar categorii |
|
ordinala |
Amplitudinea |
||
I/R |
Simetrica |
abaterea standard |
|
Asimetrica |
Amplitudinea |
Testarea ipotezelor
În faza urmatoare analizei statistice descriptive se va proceda la initierea testarii ipotezelor cu ajutorul unui test statistic adecvat. Pentru a usura alegerea testului statistic, exista diverse modele ajutatoare, de tip algoritmic sub forma tabelara sau grafica. În acest sens exista numeroase posibilitati de informare. Dintre acestea, sugeram utilizarea optiunii Statistic Coach, pusa la dispozitie de programul SPSS (din meniul Help). De asemenea, se poate apela la pagina de internet "Selecting Satistics" a Universitatii Cornell (https://trochim.human.cornell.edu/selstat/ssstart.htm).
Mai jos prezentam mai jos un algoritm sintetic ale carui pasi sunt: obiectivul cercetarii si scalele de masurare pentru variabila independenta si variabila dependenta (în cazul în care avem câte o singura variabila din fiecare tip).
Am cuprins în tabel, cu o singura exceptie, doar testele statistice tratate în acest volum. Desigur, numarul testelor statistice este mult mai mare, fapt care poate face necesara dezvoltarea algoritmului de alegere a testelor.
Obiectivul cercetarii |
Variabila independenta |
Variabila dependenta |
Testul statistic aplicabil |
||
Diferenta dintre grupuri |
Categoriala (nr. categ.) |
una |
I/R |
z/t pentru un esantion |
|
Nominala |
z pentru o proportie |
||||
doua |
independente |
I/R |
t pt. esant. independente |
||
Nominala |
z pentru doua proportii |
||||
Ordinala |
Mann-Whitney U |
||||
dependente |
I/R |
t pt. esant. dependente |
|||
Nominala |
testul semnului |
||||
Ordinala |
Wilcoxon |
||||
trei+ |
independente |
I/R |
ANOVA unifactoriala |
||
Ordinala |
Kruskal-Wallis |
||||
dependente |
I/R |
ANOVA pt. masurari repetate (netratat aici) |
|||
Ordinala |
Friedman |
||||
Asocierea variabilelor |
Interaval/Raport |
I/R |
r Pearson |
||
Ordinala |
Ordinala |
rs Spearman |
|||
Categorial (Nominala sau Ordinala) |
Categoriala (N/O) |
Chi-patrat Testul exact Fischer |
În cele ce urmeaza, vom trece în revista principalele "capitole" ale unui raport de cercetare (studiu, articol) si modul în care elementele analizei statistice trebuie sa fie abordate în cadrul fiecaria dintre ele. Respectarea aceste recomandari, uzuale în mediul stiintific, are rolul de a asigura un anumit nivel de standardizare a redactarii, pe de o parte, iar pe de alta parte, acela de a facilita controlul calitatii cercetarii si comparabilitatea rezultatelor obtinute de cercetatori diferiti.
Asa cum a reiesit pe parcursul tematicii abordate, metodologia statistica este subordonata unui anumit demers stiintific. Materializarea sa într-un document de analiza si concluzii (care poate fi un raport de cercetare, un articol stiintific sau o comunicare, etc.) se face dupa un model care are, în linii generale, o anumita structura. În cele ce urmeaza, vom trece în revista o serie de recomandari generale cu privire la modul în care trebuie abordata analiza statistica în cuprinsul unui material de cercetare, pentru fiecare sectiune în parte:
Ipotezele. Se va urmari exprimarea cu claritate a tipului de studiu statistic care a fost efectuat, si a scopurilor care au fost urmarite. În cazul în care acestea sunt mai multe, vor trebui prezentate toate, de la bun început, inclusiv ordinea de prioritate a fiecaruia.
Prezentarea paralela a ipotezelor de nul pare logica dar, de regula, îngreuiaza lectura si produce confuzie. În mod obisnuit, se emite ipoteza cercetarii, ipoteza de nul fiind considerata, implicit, opusul ei, fara a mai fi necesara enuntarea acesteia. Se face referire explicita la ipoteza de nul în momentul deciziei statistice, când se afirma acceptarea sau respingerea acesteia.
Populatia. Interpretarea rezultatelor unui studiu depinde de caracteristicile populatiei pentru care se intentioneaza analiza. Populatia trebuie definita cu claritate, în sensul elementelor care o compun. Nu trebuie uitat sensul statistic al conceptului de populatie, care se refera nu atât la indivizi umani, cât la totalitatea valorilor unei caracteristici care îi defineste si care face obiectul analizei. Cu alte cuvinte, populatia nu trebuie privita ca o clasa de obiecte ci ca o colectie de date care descriu o anumita caracteristica a respectivelor obiecte. Desigur, în cele din urma rezultatele statistice se vor extrapola la nivelul unei populatii constituita din indivizii pentru care respectiva caracteristica a fost masurata.
Esantionul. Se va descrie modul de constituire a esantionului, insistându-se pe criteriile de includere si, eventual, de excludere a unor indivizi (sau valori). Daca esantionul este stratificat (dupa provenienta, sex, etc.), se vor descrie criteriile de stratificare si volumul de subiecti pentru fiecare subgrup.
Variabilele. Variabilele analizate vor fi descrise în mod explicit, indicându-se denumirea si semnificatia fiecareia, modul în care au fost masurate si unitatea de masura. Atunci când declaram o variabila, precizam implicit si domeniul valorilor valide. Daca, de exemplu, definim o variabila care poate lua valori pe o scala de la 1 la 7 (pe o scala cu raspunsuri predefinite), orice valoare dincolo de domeniul respectiv va fi eronata. Modul de denumire al variabilelor este important. Astfel, în loc de "inteligenta" este de preferat denumirea de "rezultat la testul de inteligenta". Aceasta, pentru ca inteligenta este o realitate oricum mai complexa decât ceea ce masuram printr-o anumita variabila. Cu alte cuvinte, excesiva generalizare a variabilelor trebuie evitata.
Instrumentele de masurare. Este recomandabil sa fie prezentate cu o descriere (cel putin) sumara, inclusiv cu caracteristicile lor psihometrice (validitate, consistenta interna). Daca este vorba de un aparat sau de un program de calculator, se vor indica tipul si, eventual, sursa, pentru a putea fi cautate si de alti cercetatori care vor dori sa efectueze o replicare a respectivului studiu.
Procedura Prezentarea modului în care a decurs procedura de investigare, descrierea conditiilor, a duratei, locului, si a personalului care a contribuit la aceasta.
Se va începe cu eventualele complicatii care au survenit pe parcursul studiului. Aici se includ datele lipsa (care nu au putut fi recoltate, din diverse motive), modul de rezolvare a valorilor excesive din cadrul distributiilor, dificultatile de organizare care au putut influenta calitatea informatiilor recoltate, etc. În general, orice aspect relevant care se refera la abaterea de la conditiile prevazute pentru desfasurarea studiului trebuie prezentate.
Analiza primara. Analiza statistica va începe întotdeauna cu o inspectie a valorilor obtinute. Aceasta înseamna analiza distributiilor sub aspectul formei, indicatorilor tendintei centrale, valorilor excesive, etc. Ignorarea acestui aspect poate conduce la grave erori de interpretare, sau la un volum mai mare de munca, ulterior, daca se constata prea târziu imperfectiuni care trebuiau fi eliminate de la bun început. Reprezentarea grafica a datelor (histograma) poate fi o metoda foarte eficienta de identificare a distributiilor anormale sau valori improprii.
Scopul acestei analizei primare a variabilelor este dublu:
  737n132h ;   737n132h ; Obtinerea unei imagini de ansamblu a variabilelor de interes (frecvente, tendinta centrala, împrastierea, grafice)
  737n132h ;   737n132h ; Fundamentarea alegerii testelor statistice adecvate datelor pe care le analizam
Desigur, în documentul de cercetare nu se vor include toate rezultate analizei primare, ci numai acelea strict necesare pentru descrierea variabilelor analizate. De exemplu, nu este necesar ca raportul sa fie "împanat" cu histogramele fiecarei variabile cantitative, fapt care încarca nejustificat textul cu imagini putin relevante pentru cititor. De asemenea, nu se va descrie si nu se va justifica alegerea testului statistic, în functie de natura variabilelor. Acest lucru se considera implicit.
Verificarea ipotezelor statistice. Acesta este momentul cel mai important al unei cercetari, acela în care se concretizeaza întregul efort depus. Primul lucru care trebuie înteles este acela ca rezultatele care se vor obtine depind în mod decisiv de calitatea si minutiozitatea cu care au fost parcurse etapele anterior descrise. Un studiu bine fundamentat teoretic, bazat pe ipoteze consistente, utilizând instrumente adecvate si beneficiind de o procedura sigura de recoltare a datelor, va conduce întotdeauna la rezultate utile. Aceasta nu înseamna neaparat ca ele trebuie sa confirme ipotezele. Uneori, chiar si infirmarea unei ipoteze poate fi semnificativa.
Un aspect important aici este alegerea aparatului statistic (teste de semnificatie). Aparitia numeroaselor programe de prelucrare statistica computerizata a condus la orientarea multor cercetatori, mai ales tineri sau începatori, spre proceduri sofisticate si complicate. Cea mai buna solutie este alegerea procedurilor statistice minim necesare pentru evidentierea ideilor urmarite. Abundenta de calcule si de teste statistice nu contribuie la o mai buna întelegere ci arata, mai degraba, nesiguranta cercetatorului. Una dintre prejudecatile raspândite, mai ales printre studenti, este aceea ca exista teste statistice "importante" (de ex., analiza factoriala, analiza de clusteri, etc., despre care nu a fost vorba în acest manual introductiv în statistica) si altele "mai putin importante" (testul diferentelor între medii, etc.). Complet fals! Alegerea unei proceduri statistice mai "sofisticate" putea face o anumita impresie în epoca de dinaintea programelor de calcul statistic. În prezent, orice procedura, oricât de complicata, nu mai reprezinta o problema sub aspectul calculelor, pentru nimeni. Singurul lucru care conteaza cu adevarat este alegerea procedurii potrivite cu natura datelor si cu obiectivele cercetarii, precum si interpretarea ei corecta. Daca o procedura "simpla" serveste exact ideea care trebuie scoasa în evidenta, aceasta trebuie folosita si nu alta, cu un nume mai "sonor". Sa ne gândim si la faptul ca avem mai multe sanse ca procedurile "simple", uzuale, sa fie întelese mai usor, si de catre mai multi cititori.
În ceea ce priveste testarea ipotezelor, nu este suficienta expresia "acceptam" sau "respingem" ipoteza. Întotdeauna se va indica si valoarea obtinuta pentru nivelul de semnificatie (p, sau Sig., cum este prezentat în unele programe statistice). De retinut ca, inclusiv atunci când rezultatul obtinut nu îndreptateste respingerea ipotezei de nul, ipoteza cercetarii va fi considerata doar neconfirmata si nu respinsa. Aceasta atitudine este mai potrivita, pe de o parte, cu modelul probabilistic de testare statistica a ipotezelor si, pe de alta parte, cu faptul ca nimic nu ne împiedica sa pastram ipoteza si sa încercam confirmarea ei într-un alt studiu.
Problema variabilelor multiple. Daca în exemplele din manualele de statistica sunt luate în discutie, de regula, situatii simple, cu minimum de variabile posibile, cel mai adesea, doua. În realitate, cel mai adesea, studiile de psihologie trebuie sa faca fata unei "avalanse" de variabile a caror relatie trebuie testata nu doar una câte una ci si în interdependenta lor. Acest fapt ridica, pe de o parte, probleme de procedura statistica si, pe de alta parte, probleme de prezentare a rezultatelor. Alegerea procedurii astfel încât sa surprinda exact relatiile care intereseaza, cu excluderea influentelor colaterale, este, din pacate, greu de explicitat la nivelul unui manual introductiv. În ceea ce priveste forma de prezentare, trebuie avuta în vedere necesitatea de a fi, în egala masura, sintetici si expliciti. Sintetici, pentru a nu îngreuna textul cu o abundenta excesiva de tabele de date, expliciti, pentru ca nu pot fi eludate informatiile esentiale care sunt necesare pentru interpretarea rezultatelor.
Retinere fata de declararea relatiei cauzale. Aprecierea pe baza unui test de semnificatie statistica a unei relatii de cauzalitate între variabile este cel putin hazardata. Acest lucru poate fi sustinut numai daca se respecta anumite conditii experimentale, care sa ne asigure ca între cele doua variabile este o relatie cauza-efect.
Tabele si figuri. Tabelele sunt cel mai des utilizate pentru includerea în textul rapoartelor de cercetare a rezultatelor obtinute. Ele prezinta avantajul indicarii cu exactitate a valorilor si sustinerii cu precizie a concluziilor. Figurile au însa avantajul de a prezenta informatia într-o forma intuitiva si accesibila, atragând atentia cititorului. Nu se poate face o recomandare de preferinta pentru una sau alta dintre cele doua forme. Oricum, este de retinut ca figurile ocupa mult spatiu tipografic si sunt mai "pretentioase" din punctul de vedere al editarii si al tehnoredactarii textelor. În orice caz, se vor evita figurile prea complexe. Este recomandabil ca fiecare grafic sa prezinte o singura idee, pe care sa o sustina cât mai simplu si mai explicit.
Adevarata încercare într-un demers de cercetare nu este, asa cum s-ar putea crede, prelucrarea efectiva a datelor. Daca sunt corect recoltate si înregistrate, prelucrarea lor se face destul de usor cu ajutorul programelor computerizate existente astazi. Interpretarea, însa, este o proba pentru oricine se afla în faza de finalizare a unei cercetari.
Premisa fundamentala a unei interpretari consistente este suportul teoretic, claritatea si consistenta ipotezei sau ipotezelor cercetarii. Este imposibil sa tragi concluzii daca nu esti constient de obiectivele urmarite. Adesea se cade prada iluziei ca, indiferent de ce date dispunem, se poate sustine un demers de cercetare doar cu ajutorul unui program de calcul statistic sofisticat si a unui set de date oarecare. Din pacate, se întâmpla destul de des ca un student sa vina si sa spuna: "am aceste date, ce teste statistice pot face cu ele?". Obiectivul cercetarii trebuie sa fie clar precizat de la bun început ân timp ce alegerea procedurii statistice tine de natura scalei de masurare, caracteristicile variabilelor si ipotezei pe care trebuie sa o testam. Daca fiecare dintre aceste aspecte sunt clare în mintea cercetatorului, atunci raspunsul la întrebarea demai sus este foarte usor de dat.
Se va urmari, pe de o parte, coerenta dintre concluzii si datele pe care se sprijina, iar pe de alta parte, dintre concluzii si conditiile specifice cercetarii (esantion, model de investigare). Cu alte cuvinte, fiecare aspect al concluziilor trebuie sa aiba un suport robust în datele si rezultatele obtinute prin prelucrarea lor. Se va evita generalizarea necritica. Transpunerea anumitor rezultate dincolo de limitele populatiei cercetarii este adesea hazardata. Rezultatele obtinute nu sunt mai putin importante daca pastram prudenta în generalizarea lor. Studii ulterioare pot confirma sau nu datele obtinute si, pe aceasta baza, se poate extinde generalizarea semnificatiilor.
  737n132h ;   737n132h ;   737n132h ; În alta ordine de idei, relevanta rezultatelor nu depinde doar de atingerea nivelului de semnificatie statistica ci si de marimea esantionului. În principiu, aceste doua marimi contribuie împreuna la fundamentarea concluziilor, astfel:
rezultat semnificativ statistic |
esantion |
concluzia cercetarii |
Da |
mic |
rezultat important |
Da |
mare |
importanta practica posibila dar incerta |
Nu |
mic |
rezultat neconcludent |
Nu |
mare |
ipoteza cercetarii este, probabil, falsa |
  737n132h ;
Un alt aspect important este interpretarea semnificatiei statistice. Obiectivul legitim al testelor statistice este atingerea pragului de semnificatie. De aceea, valoarea lui p este prima care trebuie sa ne atraga atentia la capatul prelucrarilor, simtimtindu-ne rasplatiti pentru eforturile facute, daca se afla sub pragul de 0.05. Cu toate acestea, nu trebuie sa uitam nici un moment ca "statistic semnificativ" nu este echivalent cu "stiintific important". Dincolo de valoarea lui p se impune luarea în considerare si marimea în sine a diferentei sau legaturii puse în evidenta de respectivul test statistic. Desigur, o valoare ridicata a testului, fara atingerea pragului de semnificatie, nu este relevanta. Dar nici valoare prea mica, chiar daca este semnificativa statistic. Cât de mica sau cât de mare trebuie sa fie valoarea testului, pentru a o considera "importanta" sau "relevanta"? Din pacate, pentru aceasta întrebare nu exista un raspuns riguros. Se recomanda apelul la spiritul stiintific si la simtul comun, concomitent cu raportarea la natura specifica a fiecarei situatii în parte. Cu alte cuvinte, raspunsul depinde de contextul fiecarei cercetari în parte.
O alta problema de discutat este în legatura cu valoarea în sine a lui p. Dupa cum stim, nivelul minim pentru acceptarea semnificatiei statistice este 0.05, corespunzator valorii conventionale minim acceptabile pentru pragul alfa. Vorbind în sens strict, un p=0.049 este considerat semnificativ, în timp ce un p=0.051 trebuie sa fie considerat nesemnificativ. Având în vedere ca pragul alfa=0.05 este unul arbitrar, nu se poate evita un astfel de rationament rigid. Cu toate acestea, exista cercetatori care raporteaza rezultate ale lui p usor mai mari decât 0.05 ca fiind "marginal semnificative" sau "aproape semnificative". Sa mentionam, totusi, ca o astfel de atitudine este destul de rar întâlnita si poate determina reactii negative, justificate, din partea cercetatorilor mai "rigurosi", aflati în majoritate.
În mod intuitiv, suntem tentati sa interpretam nivelul de semnificatie în functie de valoarea calculata a lui p. Astfel, un p=0.001 ni se pare mai semnificativ decât un p=0.05, de exemplu. Daca utilizam definitia stricta a termenului de semnificatie din rationamentul deciziei statistice, o astfel de atitudine nu este justificata. O data ce a fost fixat un anumit nivel al lui alfa, orice p mai mic sau egal cu acesta este semnificativ, iar orice p mai mare este nesemnificativ. Cei mai multi statisticieni împartasesc aceasta opinie. Cu toate acestea, exista si cercetatori mai putin "rigizi" care sunt dispusi sa asocieze valorii lui p anumite adjective, astfel:
>0.05   737n132h ;   737n132h ;   737n132h ;   737n132h ;   737n132h ; nesemnificativ |
0.01 - 0.05   737n132h ;   737n132h ; semnificativ |
0.001 - 0.01   737n132h ; foarte semnificativ |
<0.001   737n132h ;   737n132h ;   737n132h ;   737n132h ; extrem de semnificativ |
  737n132h ;
Fara a fi gresite, astfel de formulari nu aduc, totusi, o interpretare relevanta pentru decizia statistica. Este util sa adaugam ca programele de prelucrari statistice afiseaza "0.000" pentru valori ale lui p mai mici de 0.001, Acest fapt nu va fi interpretat în nici un caz ca exprimând probabilitate "zero", ci doar în sensul ca valoarea lui p este mai mica de 0.001. De altfel, la raportarea semnificatiei, se poate opta fie pentru înscrierea valorii exacte a lui p, asa cum este calculata de program, fie doar pentru mentionarea plasarii valorii testului sub nivelul alfa stabilit.
Studiul trebuie sa se încheie cu concluzii adecvate cu rezultatele obtinute, formulate sintetic si explicit. Nu se vor evita aspectele mai putin reusite ale cercetarii, eventualele nereusite, chiar. Rostul acestora este acela de a ajuta la evitarea repetarea unor greseli de catre cei care vor dori sa reia acelasi tip de investigatie, mai târziu. Se pot face chiar recomandari explicite în acest sens. Oricât de semnificative ar fi rezultatele unui anumit studiu, ele nu vor schimba modul de a gândi o anumita realitate psihologic. Acest efect nu îl pot avea decât rezultate obtinute de mai multe studii concordante pe aceeasi tema.
Nu se va uita niciodata faptul ca semnificatia statistica nu tine loc si de semnificatie teoretica, cu sensul de consistenta a unui anumit model teoretic explicativ. Procedurile statistice nu sunt altceva decât instrumente de evaluare probabilista ipotezelor. Profunzimea teoretica a unui studiu nu poate rezulta decât din calitatea modelului de investigatie (ipoteze, proceduri de evaluare, subtilitatea analizei rezultatelor, etc.) si nu din datele statistice ca atare.
Statistica trebuie sa fie o modalitate de organizare si disciplinare a gândirii stiintifice, în nici un caz, însa, nu se poate substitui acesteia. Dar nu se poate ajunge la aceasta performanta decât daca statistica este înteleasa atât sub aspecte ei "tari" cât si cu limitele ei.
În trecut, la începuturile utilizarii statisticii în psihologie, prezenta acesteia într-o lucrare avea un caracter de prestigiu, cu atât mai mare cu cât era mai bogat reprezentata. În prezent, omniprezenta calculatoarelor si a programelor specializate au facut ca prelucrarile statistice sa devina o operatiune relativ facila. Tocmai din acest motiv, apare riscul abuzului de statistica, a utilizarii necritice si superficiale a acesteia în elaborarea lucrarilor de cercetare.
În fine, ca o concluzie a celor spuse, se cuvine sa insistam pe respectarea exigentelor procedurale impuse de metoda statistica. Simpla "populare" a unei lucrari cu date statistice, tabele, grafice, sau cu valori ale unor teste de semnificatie, nu asigura în mod necesar acelui document valoarea stiintifica la care aspira. Asigurarea calitatii datelor supuse prelucrarii, respectarea conditiilor de alegere a testelor de semnificatie, interpretarea lor adecvata si publicarea rezultatelor în formatul adecvat, sunt conditii indispensabile pentru calitatea stiintifica a unui studiu bazat pe metoda statistica.
  737n132h ;   737n132h ;   737n132h ; Lectura celor mai multe dintre lucrarile efectuate de studenti scoate în evidenta nerespectarea recomandarilor prezentate mai sus. Efectul consta în consemnarea unor greseli, dintre care cele mai frecvente si mai suparatoare ni se par a fi urmatoarele:   737n132h ;
·   737n132h ;   737n132h ; Absenta coeficientilor de consistenta interna pentru testele care nu fac parte din metodologia profesionala generala, sau, înca si mai grav, pentru cele create de autor, si pe care se bazeaza respectiva cercetare.
·   737n132h ;   737n132h ; Instrumente de lucru (teste) prezentate integral în textul lucrarii. Acestea se descriu la modul general, fiind prezentate integral, eventual, doar la sfârsitul lucrarii, în caz ca se doreste difuzarea lor.
|