TESTE STATITSTICE PENTRU DESIGNURILE CU UN SINGUR SUBIECT
Conditii generale
Recent, in analiza statistica pentru designurile cu un singur subiect au intrat tot mai mult in centrul atentiei (Kazdin, 1984). Principala focalizare insa s-a realizat asupra designurilor cu serii temporale multiple. Alte statistici bazate pe principiile randomizarii au fost de asemenea aplicate.
Vom prezenta o serie de teste simple care se pot servi fie de inspectarea graficelor, fie prin realizarea unor calcule numerice simple. Majoritatea testelor prezentate aici sunt extrase din activitatea lui Kendall (1976). Scopul principal al acestor teste este de a descrie seriile de date mai degraba decat sa fie potrivite pentru a testa eficienta interventiei. Ele insa sunt foarte utile in practica clinica deoarece: in primul rand clinicienii au nevoie sa descrie datele mivelului de baza, o buna descriere a nivelului de baza releva tendintele ascunse sau dependentele seriale, surse ce ar trebui sa fie investigate, analiza datelor niveluilui de baza este o parte integrala a formularii problemei clinice; in al doile rand determinarea daca datele nivelului de baza sunt stabile este de asemenea un criteriu pentru a decide daca interventia experimentalaar trebui sa fie introdusa, aceste teste pot fi folosite pentru a facilita astfel de decizie; in al treilea rand testele pot fi folosite ca un ajutor pentru interpretarea grafica a datelor, ele pot fi aplicate fiecarei faze pentru a verifica inferenta realizata vizual; in final testele pot fi folosite in analize preliminare inainte de a decide daca vor fi necesare alte statistici mai complete.
Kendall sugereaza 4 aspecte care vor trebui luate in considerare in selectarea testelor ce vor fi utilizate in examinarea seriilor de date:
1. Testul nu ar trebui sa faca asumtii restricitve despre distributia din care se presupune ca apar observatiile. Seturile de date, tipic sunt mici si prin urmare sun sanse mici sa identificam distributiile ce stau la baza cu multa siguranta. Mai mult, multe date sunt colectate pe scale ordinale care sun mai bine examinate cu ajutorul unor teste nu prea restricitve.
2. Calculul este minim (sa se mentina la minimum)
3. Calculul ar trebui sa fie usor de reactualizat (adus la zi). Astfel, daca se adauga noi observatii seriilor existente sa fie usor de continuat calculul, astefl nu se mai necesita repetarea lui din nou.
4. Alegerea testelor depinde de ipotezele alternative valabile. Exista mai multe ipoteze alternative pe care un experimentator ar trebui sa le ia in considerare:
a) Ipotaza nula ca seriile sunt randomizate
b) Seriile contin variatii cilcice
c) Ca exista o tendinta in media seriilor
d) Ca exista o tendinta in variabilitatea seriilor.
Vor fi prezentate teste pentru fiecare dintre aceste ipoteze:
Teste pentru randomizare
1. Testul punctelor de turnura . Este un test foarte usor de aplicat in special datelor reprezentate grafic. In esenta, daca datele ar fi rendomizate ar trebu sa ne alsteptam ca numarul varfurilor si punctelor joase in serie sa fie distribuite intr+un mod predictibil. Punctele varf si punctele joase sunt definite ca fiind valorile mai mari sau mai mici decat valorile vcecine lor. De exemplu in seria 67435 exista doua puncte de turnura: 7 este varf si 3 este punctul jos. In seriile randomizate probabilitatea de a gasi punctul de turnura din oricare trei observatii succesive este 2/3 (0.666).
Intr-o serie de n puncte exista (n-2) puncte de turnura pentru secvente de trei observfatii succesive. In exemplul de mai sus exista deci trei secvente succesive posibile: 674, 743, 435. Putem spune ca numarul expectat al punctelor de turnura in serii randomizate de lungimea n este:
E(T)= 2/3 (n-2)
Pe masura ce posibilele combinari a datelor cresc, punctele de turnura cresc si ele.
Bradley (1968) ofera o formula pentru calcularea distributiei probabilitatii si un tabel al acestei distributii. Kendall (1976) arata ca deviatia standard a numerelor de turnura este:
1/2
[(16n - 29) / 90]
Tabelul 2a ofera exact o distributie cumulativa a T pentru 3<n<10 si o comparatie cu aproximarea normala pentru n < 10. Tabelul 2b prezinta media, deviatia standard si limitele intervalului de incredere pentru 11 <n<16.
Mai multe puncte de turnura decat cele expectate indica faptul ca seriile oscileaza rapid. Mai putine puncte de turnura indica faptul ca punctele succesive sunt corelate si exista o anume tendinta a datelor.
2. Testul lungimii fazei
O faza este definita ca fiind numarul de intervale dintre doua puncte de turnura. Cea mai mica lungime a unei faze este 1. De exemplu in seria 12, 13, 11, 14 exista doua puncte de turnura la 13 si 11, dand o faza de lungimea 1. Se poate observa ca pentru a defini o faza de lungimea d se cere a fi prezente d+3 puncte. Kendall ofera formula de determinare a totaluzlui expectat de faze de la lungimea l la n-3 intr-o serie de n puncte:
N=1/3 (2n-7).
Numarul expectat al fazelor de lungimea d (Nd) este data de:
2
2(n-d-2)(d + 3d +1)
Nd=-------- ----- ------ --
(d+3)
Pentru a compara frecventele observate si cele expectate se calculeaza c2 asa cum se calculeaza de obicei.
3. Testul semnului diferentei
Seriile sunt inspectate pentru incremente: se numara 1 daca un punct in t este mai mare decat punctul precedent. Deci pentru seria A secventei de 0 si 1este: 0,1,0,0,1,0,1,0, pentru seria B: 0,0,1,0,0,1,0,1. Se face apoi totalul lui 1 (T) si se compara cu numarul expectat ce este dat de formula:
E(T)= 1/2 (n-1) unde n este numarul punctelor din serie. Varianta lui T este data de 1/2(n+1). Distributia lui T a fost calculata de Moore & Wallis (1943) si este prezentata in tabelul 5.
TESTE PENTRU DEPENDENTA SERIALA
1.Testul Dufour - impune mai putine restrictii privitoare la date. Nu se asuma ca toate observatiile provin din distributii identice cu varainta egala. Este de asemenea util pentru detectarea veriantei ciclice.
Dufour (1981) afirma ca testul semnelor sau Wilcoxon pentru ranguri poate fi aplicat in caest caz.
Pasi in calcularea acestui test:
Pasul1 Aranjam seriile temporare intr-o ordine temporala unde I este timpul iar x observatiile. Calculam mediana (in cazul serieiB ea este 5).
Pasul 2 Scadem mediana din toate valorile x pentru a forma oserie redusa.
Pasul 3 Pentru a calcula seriile derivate z pentru lag 1 valorile succesive sunt inmultite (11x 1, 1x-3, -3x9). Seriile care rezulta sunt ordonate in functie de semn (modululele valorilor z sunt ordonate, exemplu 5, 1, 9, 4 etc).
Pasul 4 Pentru a calcula S statistic se aduna numerele pozitive sau negative (care este mai mic) pentru seriile derivate zi. Pentru a calcula T statistic pentru zi care contribuie la S statistic.
Pasul 5 Pentru a gasi seriile derivate pentru lag 2 inmultim fiecare a doua valoare a seriilor reduse (11x-3, 1x9, -3x1, 9x-5) Aceste valori sunt ordonate si se repeta pasul 4 pentru a determina T si S.
In prezentul exemplu, Ssi T sunt ambele semnificative la lag 3, fapt ce confirma ideea data de inspectia vizuala. Willcoxon este mai puternic decat testul semnelor deoarece se utilizeaza magnitudinea observatiilor la fel ca si semnul.
TESTE PENTRU TENDINTA MEDIEI
1. Tau al lui Kendall
Testul semnelor este relativ slab, nu ia in considerara diferentele de magnitudine in calcul. Sa luma ca si exemplu seriile: 6,5,8,7,10,9,12,11,13,. Testele diferentei si a punctelor de turnura vor indica ca ipoteza randomizarii va fi infirmata.Dar seriile sunt in crestere cu toate ca oscileaza . In acest caz, Kendall sugereaza utilizatrea testului de corelatie a rangurilor - testul tau. Pentru seria C Tau= 0.69, p<0.01 indicand o tendinta semnificativa.
Testul tau are prorpietatea de a fi usor adus la zi odata cu introducerea de noi date. Avand o serie de ui.un daca P este numarul de cazuri in care uj>ui avem:
4P
Tau=----- ----- ----- - 1
n(n-1)
TESTE PENTRU TENDINTA MEDIEI SI VARIANTEI
1. Testul Records
Testul Tau va fi ineficient daca varianta sertiei se schimba ca si in seria D. Foster si Stuart (1954) descrie un test ce poate fi aplicat la serii mici, n<15. Incepand cu punctul al doile dam scoruri inrehgidstrarilor celor mai mari si celor mai mici. (Ur) - inregistrarea cea mai de sus este punctul cel mai mare, cel mai indepartat al seriei. (Lr) - este punctul cel mai mic. Deci seriile 5 6* 7* -4 5 6 8* , valorile * sunt inregistrarile de sus, iar cele marcate cu - sunt inregistrarile de valori minime. Totalul inregistrarilor ridicate si scazute se aduna pentru testul statistic s, si se scad pentru calculul lui d.
s= Ur + Lr, d=Ur-Lr.
Daca seriile au tendinta pozitiva vor fi relativ mai multi Ur decat Lr si d va fi pozitiv. Pentru tendinta negativa, d va fi negativ. Distributia va avea prin urmare doua jumatati simetrice si ofera un test impotriva mediei.
Tabelul 8a ofera o probabilitate exacta a d pentru n cuprins inre 3 si 6 si eroarea standard a d pentru n= 10 la n=40 in 5 pasi prezentate in tabelul 8b. Abaterea de la valorile expectate a d=0 daca nu exista tendinte ce pot fi testate cu distributia normala.
Sa luam in condirerare cazul in care seriile sunt in crestere ca si in cazul seirei D. In acest caz, d va fi apropiat de 0, dar s va fi mai marepe masura ce inregistrarile devin extereme. Distributia exacta a s pentru serile cu n cuprinse intre3 3 si 15 este prezentat in Tb. 9a. Media si deviatia standard sunt prezente in Tab 9b.
Bibliografie:
1.Bordens, S.K., Abbott, B.(1995) Research Design and Methods: A Process Approach, Mayfield Publising Company, Mountain View, California
2.Cozby, C. P. (1993) Methods Behavior Research, Mayfield Publishing Company, Mountain View, California
3.Franklin R.D., Allison D.B., Gorman B.S. (1996) Design and Analysis of Single -Case Research, Lawrece Erlbaum Associates, Mahwah, New Jersey
4.Graziano A.M., Raulin M.L.(1993) Research Methods, Harper Collins College Publishers, New-York
Morley S., Adams M.(1989) Some simple statistical tests for exploring single-case time-series data, British Journal of Clinical Psychology:28, 1-18 Printed in Great Britain
5.Spence T.J., Cotton W.J., Underwod J. B., Duncan P.C.(1995) Elementary Statistics, Prentice Hall, Enlewood Cliffs, New Jersey