Documente online.
Zona de administrare documente. Fisierele tale
Am uitat parola x Creaza cont nou
 HomeExploreaza
upload
Upload




Teste neparametrice de comparare

Matematica


Teste neparametrice de comparare

Testul W al lui Wilcoxon de comparare a doua medii

Daca avem de comparat doua esantioane despre distributiile carora nu avem nici o informatie, iar esantioanele sunt mici si dispersiile sunt diferite, folosirea testelor de comparare prezentate īn subcapitolul 8.2 nu este indicata, deoarece rezultatele sunt nesigure. Īn aceste cazuri, se poate face o comparare nu dupa marimea efectiva a datelor ci dupa rangul lor. Daca ordonam crescator valorile din cele doua serii si daca valorile dintr-o serie sunt majoritatea mai mici ca cele din seria a doua, atunci ele vor ocupa mai ales locurile de la īnceputul sirului astfel format. Daca nu exista o tendinta clara ca una din serii sa aiba valori mai mici, atunci rangurile valorilor din serii vor alterna. Evident, daca valorile unei serii ocupa ranguri de īnceput suma rangurilor valorilor este mica si invers.



Ipotezele pentru acest test sunt ipotezele standard:

H0: Mediile populatiilor din care provin loturile sunt egale.

H1: Mediile populatiilor din care provin loturile difera.

Fie seriile statistice:

,si

  • Se ordoneaza valorile din serii fara sa tinem cont de seria din care provin, fiecare va avea asociat un rang care este chiar locul ocupat īn noua serie.
  • Se calculeaza suma rangurilor elementelor seriei X, prin adunarea rangurilor individuale ale elementelor ei. Fie Wx, aceasta suma.
  • Se calculeaza statistica

  • Se refera valoarea obtinuta la ta 525c28f belul distributiei normale standard pentru n1 si n2 mai mari ca 12 sau la tabele speciale pentru volume mai mici.

Pentru o mai buna īntelegere sa luam un exemplu:

X : 58, 74, 70, 71, 56, 68.

Y : 75, 69, 72, 57, 67, 59, 75, 73.

Acestea sunt greutatile pacientilor din doua loturi si vom īncerca sa testam daca al doilea esantion are greutati semnificativ mai mari.

Seria ordonata va fi:

Rang

Valoare

Seria

X

Y

X

Y

Y

X

Y

X

X

Y

Y

X

Y

Y

Valoarea lui Wx, suma rangurilor elementelor seriei X este Wx = 1 + 3 + 6 + 8 + 9 + 12 = 39, iar statistica testului va fi:

valoare care nu este semnificativa, fiind mai mica decāt valoarea prag data de tabelele speciale pentru acest test. Diferenta īntre medii este nesemnificativa la un prag de semnificatie acceptabil.

8.3.2 Testul U al lui Mann si Whitney

Fie seriile statistice:

,si

Principiul testului este urmatorul:

  • Se compara toate perechile (x,y), de valori din cele doua serii, astfel īncāt x este din prima serie si y este din cea de-a doua serie.
  • Se numara cāte perechi (x,y) cu y<x avem. Fie acest numar Uxy.
  • Se calculeaza statistica

care are o ditributie aproximativ normala de medie 0 si abatere standard 1.

  • Daca atunci mediile difera semnificativ la pragul de semnificatie de 95% (sau 99%).

Calculul lui Uxy se realizeaza astfel:

  • Se ordoneaza valorile din cele doua serii īn ordine crescatoare, retināndu-se nu valorile īn sine ci seria din care provin.
  • Se numara pentru fiecare simbol x, numarul de simboluri y din stānga.
  • Se aduna valorile obtinute pentru toate simbolurile x, rezultatul fiind Uxy.

Statistica Uxy nu este distribuita normal, dar ea tinde rapid catre o distributie normala. Din punct de vedere practic, este de ajuns ca cele doua esantioane sa aiba cel putin 12 indivizi, ca aproximatia sa fie suficient de buna. Se poate demonstra ca daca īn locul lui Uxy se foloseste Uyx prin adunarea similara a numarului de simboluri x la stānga unor simboluri y, statistica testului nu se schimba. Aceasta deoarece

adica:

si deci cele doua valori ale statisticii sunt egale si de semn opus, ceea ce din punctul de vedere al semnificatiei statistice este exact acelasi lucru.

Ca exemplu, sa luam valorile din exemplul de mai sus, completate pentru a fi cel putin 12 īn fiecare esantion:

X : 58, 74, 70, 71, 56, 68, 66, 69, 72, 65, 59, 67, 73, 60, 61.

Y : 75, 79, 85, 57, 76, 84, 62, 63, 77, 78, 64, 80, 81, 83, 82.

care se ordoneaza astfel:

Rang

Valoare

Seria

X

Y

X

X

X

X

Y

Y

Y

X

X

X

X

X

X

Nr y<x

Rang

Valoare

Seria

X

X

X

X

Y

Y

Y

Y

Y

Y

Y

Y

Y

Y

Y

Nr y<x

Deci, Uxy=0 + 1 + 1 + 1 + 1 + 4 + 4 + 4 + 4 + 4 + 4 + 4 + 4 + 4 + 4=44

Statistica testului va fi deci:

valoare care este semnificativa si la nivelul de semnificatie de 95% si la nivelul de semnificatie de 99% (z=1,96, respectiv z=2,57). Deci, diferenta īntre mediile celor doua esantioane este semnificativa.

Principiul acestui test se bazeaza de fapt pe urmatoarele observatii:

  • Valoarea lui Uxy este foarte mica sau foarte mare dupa cum valorile din seria X sunt majoritatea mai mici sau mai mari ca valorile din seria Y
  • Uxy poate lua orice valoare īntre 0 si , īn cazul de mai sus īntre 0 si 225.
  • Daca toate valorile din seria X sunt mai mici decāt valorile din seria Y, atunci Uxy este 0.
  • Invers, daca valorile din seria Y sunt toate mai mici ca cele din seria X, atunci Uxy are valoarea 225.
  • Daca valorile din cele doua serii sunt amestecate, valoarea lui Uxy este īntre 0 si 255, avānd clar tendinta de a fi la mijloc, ceea ce ar face ca numaratorul statisticii sa tinda la 0.

Document Info


Accesari: 2580
Apreciat: hand-up

Comenteaza documentul:

Nu esti inregistrat
Trebuie sa fii utilizator inregistrat pentru a putea comenta


Creaza cont nou

A fost util?

Daca documentul a fost util si crezi ca merita
sa adaugi un link catre el la tine in site


in pagina web a site-ului tau.




eCoduri.com - coduri postale, contabile, CAEN sau bancare

Politica de confidentialitate | Termenii si conditii de utilizare




Copyright © Contact (SCRIGROUP Int. 2024 )