VARIABILE ALEATOARE. FUNCŢII DE REPARTIŢIE. INDICATORI STATISTICI
realizeaza niciodata în cadrul unui experiment dat.
Evenimentele
ce apar ca rezultat al unor experimente le vom nota
, etc. Evenimentul
complementar unui eveniment
este acel eveniment care se
realizeaza atunci si numai atunci când nu se realizeaza
Evenimentul
care consta în realizarea simultana a evenimentelor
se
noteaza cu
(se
citeste evenimentul
si
Probabilitatea unui eveniment este o masura a sanselor de realizare a acelui eveniment. Daca un eveniment se desfasoara astfel încât producerea oricarui eveniment legat de acesta are un numar finit de sanse egal-posibile, probabilitatea evenimentului este raportul dintre numarul rezultatelor favorabile producerii evenimentului si numarul tuturor rezultatelor posibile.
Se considera exemplul
cunoscut al urnei care contine bile de aceeasi marime,
dintre care
sunt albe si
sunt negre. Probabilitatea de a extrage
o bila alba sau neagra va fi
, (2.1)
respectiv
. (2.2)
Din relatia (2.1) se vede
imediat ca probabilitatea unui eveniment este cu 535h79f prinsa între zero
si unitate, adica
Evident, când în urna sunt numai bile
negre, iar
când în urna sunt numai bile
albe etc.
Teorema probabilitatii totale
Sa presupunem ca
pentru producerea unui eveniment din
cazuri posibile, egal probabile,
sunt cazuri favorabile, adica
(2.3)
De asemenea, pentru producerea
evenimentului , pentru care avem
cazuri favorabile, putem scrie
(2.4)
Se mai considera ca
cele doua evenimente se exclud reciproc, adica când se produce , nu se produce
Probabilitatea ca în cele cazuri posibile sa se produca
sau
, va fi
(2.5)
relatie care reprezinta principiul probabilitatii totale, si anume:
Când un eveniment se poate realiza în mai multe moduri posibile care se exclud reciproc, probabilitatea producerii lui este egala cu suma probabilitatilor care corespund diferitelor moduri de producere.
Teorema probabilitatii compuse
Se considera cazul unui
eveniment mai complex care rezulta din realizarea succesiva a doua
evenimente dependente si
. Pentru examinarea acestei situatii mai presupunem:
- în cazuri se produce atât evenimenul
cât si
- în cazuri se produce evenimenul
dar nu se produce
- în cazuri se produce evenimenul
dar nu se produce
- în cazuri nu se produce nici
nici
Fie numarul de cazuri total
posibile.
Pentru producerea evenimentelor
si
probabilitatea este
si
(2.6)
Pentru a se produce , probabilitatea este
(2.7)
deoarece are
, cazuri favorabile,
fiind acelasi.
Dupa ce s-a produs
evenimentul , ramâne sa examinam probabilitatea lui
. Evident, acesta are numai
cazuri favorabile. Deoarece
producerea lui
este conditionata de aceea
a lui
(numai acele cazuri vor fi
favorabile când are loc
), numarul cazurilor posibile pentru
va fi
. Prin urmare,
Pentru probabilitatea definita de (2.8), se
foloseste notatia
ceea ce înseamna probabilitatea
ca
sa se produca dupa ce
s-a produs
(probabilitate conditionata).
Din compararea relatiilor (2.6), (2.7) si (2.8) rezulta principiul probabilitatii compuse
si
(2.9)
care arata ca: Daca producerea unui eveniment presupune
realizarea altor evenimente si
, atunci probabilitatea producerii lui este egala cu produsul dintre
probabilitatea producerii lui
si probabilitatea lui
, dupa ce s-a produs
În conditiile de mai sus, numarul cazurilor posibile este limitat. De aceea, definitiile si probabilitatile de mai sus se refera la asa numita teorie a probabilitatilor discontinue, care se apropie de teoria probabilitatilor continue daca numarul cazurilor favorabile este destul de mare.
Probabilitatea evenimentului se noteaza
si este un numar cuprins
între 0 si 1, valoarea 0 corespunzând unui eveniment imposibil, iar 1 unui
eveniment sigur.
Daca
masurarea unei marimi se
efectueaza, în conditii identice, de un numar mare de ori
, obtinându-se siruri de valori
aleatorii
, iar din acestea,
valori se
afla în intervalul
, probabilitatea
(2.10)
este o caracteristica a intervalului si se
numeste frecventa relativa a variabilei
în
intervalul considerat.
Variabile aleatoare
Se numeste variabila aleatoare o marime reala care, în raport cu rezultatul unui experiment, poate lua orice valoare dintr-o multime bine definita de valori reale (domeniul de definitie al variabilei).
Variabilele aleatoare se clasifica dupa multimea pe care sunt definite. Astfel, se deosebesc variabile aleatoare de tip discret si de tip continuu.
Variabilele aleatoare discrete sunt definite pe o multime cel mult numarabila de evenimente. Numarul valorilor posibile ale unei variabile aleatoare discrete poate fi finit sau infinit.
Variabila aleatoare continua este definita pe o multime continua. Variabila aleatoare continua poate lua orice valoare între doua numere. Numarul valorilor posibile ale unei variabile aleatoare continua este infinit.
Functia de repartitie
Functia de repartitie
a variabilei aleatoare se noteaza cu
si este definita ca
probabilitatea evenimentului
(2.11)
Din punct de vedere probabilistic, functia de repartitie caracterizeaza complet o variabila aleatoare, indiferent daca este vorba de o variabila aleatoare discreta sau continua.
Functia
de repartitie (sau functia cumulativa a probabilitatilor) a unei variabile
aleatoare discrete este suma probabilitatilor de la stânga punctului
de abscisa (Fig. 2.1)
(2.12)
Se numeste repartitie a unei variabile aleatoare legea de probabilitate dupa care ea se produce. Repartitia unei variabile aleatoare discrete se scrie sub forma
sau
Fig. 2.1. Repartitia unei variabile discrete
Daca este o variabila
aleatoare continua, functia de repartitie se defineste
astfel (Fig. 2.2):
. (2.14)
Fig. 2.2. Repartitia unei variabile continue
Functia de repartitie are urmatoarele proprietati:
1. Functia de repartitie este o functie monoton nedescrescatoare
, daca
; (2.15)
2. Pentru cea mai mica
valoare posibila a variabilei aleatoare
, functia de repartitie este egala cu zero
; (2.16)
3. Pentru cea mai mare valoare posibila a variabiei aleatoare
, functia de repartitie este egala cu 1
; (2.17)
4. Functia de repartitie fiind o probabilitate, satisface dubla inegalitate
; (2.18)
5. Probabilitatea ca variabila aleatoare sa fie cuprinsa
între
si
este egala cu
diferenta dintre valorile functiei de repartitie la extremitatile
intervalului, adica cu cresterea functiei în intervalul
considerat
. (2.19)
Functia de repartitie
a unei variabile discrete este o functie discontinua, în scara, admite
salturi, salturile de la o treapta la treapta curenta sunt egale cu , suma tuturor salturilor fiind egala cu 1 (Fig. 2.3.a).
a) b)
Fig. 2.3. Functia de repartitie
Functia de
repartitie a unei variabile aleatoare continue este, de asemenea o
functie continua (Fig. 2.3.b, în care functia are drept
asimptote dreptele si
Densitatea de repartitie
Se numeste densitate de
repartitie (sau densitate de probabilitate) prima derivata - daca
exista - a functiei de repartitie
.(2.20)
Densitatea de repartitie exista numai pentru variabile de tip continuu.
Probabilitatea ca variabila aleatoare continua
sa ia valoare în
intervalul
este egala cu
integrala densitatii de repartitie pe intervalul
, (2.21)
adica evenimentul este imposibil, iar
este sigur.
Operatii cu variabile aleatoare
Fie si
doua variabile aleatoare având
repartitiile
si
(2.22)
Daca este o
constanta reala, atunci
este o
variabila aleatoare având repartitia
(2.23)
Suma a doua variabile aleatoare si
este o
variabila aleatoare având repartitia
(2.24)
în care este probabilitatea
realizarii simultane a evenimentelor
si
adica
si
Produsul a doua
variabile aleatoare si
este o
variabila aleatoare având repartitia
(2.25)
în care
si
(2.26)
Densitatea de repartitie are proprietatile:
1. Densitatea de repartitie
este nenegativa si aceasta rezulta din proprietatea functiei
de repartitie de a fi nedescrescatoare,
2. Integrala densitatii de repartitie, în cadrul limitelor de variatie infinite, a variabilei aleatoare continue, este egala cu unitatea,
(2.27)
Valorile tipice ale variabilei aleatoare
O variabila aleatoare este caracterizata prin repartitia sa. Daca repartitia unei variabile nu este cunoscuta, pentru caracterizarea variabilei aleatoare se pot folosi anumite marimi numite valori tipice, asociate variabilei aleatoare.
Media
Prin definitie,
valoarea medie (speranta matematica) a unei variabile aleatoare
discrete cu repartitia (2.13) este
egala cu suma produselor dintre valorile pe care le poate lua
si probabilitatile
corespunzatoare
(2.28)
Fie o variabila aleatoare de tip
continuu si
densitatea sa de repartitie.
Media unei variabile aleatoare continue
este definita de relatia
(2.29)
Daca variabila aleatoare
este definita pe intervalul , atunci valoarea medie este
(2.30)
Mediana
Se numeste mediana
a variabilei aleatoare , numarul care satisface ecuatia
(2.31)
sau
. (2.32)
Rezulta din ecuatia (2.32) ca mediana este solutia ecuatiei
(2.33)
Pentru o variabila aleatoare continua, mediana este data de ecuatia
(2.34)
Dispersia
Dispersia unei variabile
aleatoare discrete reprezinta valoarea medie a patratului
abaterii
(2.35)
sau
(2.36)
adica, diferenta dintre media patratului variabilei aleatoare si patratul mediei variabilei aleatoare.
Dispersia unei variabile
aleatoare continue este media patratului abaterii
lui
(2.37)
Abaterea medie patratica
Abaterea medie patratica a
unei variabile aleatoare este radacina patrata
a dispersiei acestei variabile aleatoare
. (2.38)
Dispersia si abaterea medie patratica sunt indicatorii cei mai utilizati pentru a caracteriza împrastierea valorilor unei variabile aleatoare.
Momente
Momentul simplu
(initial) de ordinul k al unei
variabile aleatoare discrete , calculat în raport cu originea abaterilor, care este zero,
are expresia
(2.39)
Momentul simplu (initial) de ordinul 1 reprezinta media aritmetica
(2.40)
Folosind momentele simple, dispersia se poate exprima dupa cum urmeaza:
(2.41)
în
care reprezinta momentul simplu
de ordinul 2.
Momentul
centrat de ordinul k al
unei variabile aleatoare discrete , calculat în raport
cu media aritmetica a variabilei aleatoare, este
(2.42)
Momentul centrat de ordinul 1 este zero, datorita proprietatii mediei aritmetice conform careia
(2.43)
Momentul centrat de ordinul 2 în raport cu media aritmetica este dispersia
(2.44)
Momentul ordinar de ordinul k,
calculat în raport cu o valoare arbitrara , este media variabilei aleatoare
(2.45)
Momentul initial de
ordinul al unei variabile aleatoare continue
este
(2.46)
În particular, pentru se obtine valoarea medie a
variabilei aleatoare continue
Momentul centrat de ordinul al unei variabile aleatoare continue
este
(2.48)
În particular, pentru rezulta dispersia variabilei
aleatoare continue
Momentul ordinar (conventional
de ordinul este
(2.50)
Între momentele initiale si momentele centrate exista urmatoarele relatii:
(2.51)
(2.52)
Coeficientul de covarianta
Covarianta
a doua variabile aleatoare si
reprezinta momentul centrat mixt al celor
doua variabile
(2.54)
Dezvoltând (2.54) se obtine formula echivalenta de calcul
(2.55)
Se numeste coeficient de covarianta raportul
(2.56)
în care sunt
elementele matricei de covarianta, iar
sunt
numite corelatii.
Daca variabilele si
sunt independente atunci
, reciproca nefiind adevarata. Daca
exista, atunci
. Inegalitatea este o consecinta a inegalitatii lui
Schwarz [ ].
Proprietatile valorilor tipice ale variabilei aleatoare
Proprietatile mediei
Media unei variabile aleatoare are proprietatile:
1.
Daca este o
constanta
, atunci
(2.57)
2. Daca este o
variabila aleatoare si
si
doua
constante, atunci valoarea medie a variabilei aleatoare
este
egala cu
(2.58)
3. Daca si
sunt
doua variabile aleatoare independente având valorile medii
si respectiv,
, atunci valoarea medie a variabilei aleatoare
exista
si este egala cu
(2.59)
4. Daca si
sunt
doua variabile aleatoare independente pentru care exista valorile
medii
si respectiv
, atunci valoarea medie a variabilei aleatoare
exista
si este egala cu
(2.60)
5. Daca este o
variabila aleatoare a carei valoare medie
exista, atunci variabila aleatoare
se numeste
abatere de la valoarea medie.
Proprietatile dispersiei
Dispersia unei variabile aleatoare are proprietatile:
1.
Fie o variabila aleatoare cu
dispersia
; atunci oricare ar fi numerele reale
si
, dispersia variabilei aleatoare
este
(2.61)
2.
Daca si
sunt doua
variabile aleatoare independente având dispersiile
, respectiv
, atunci pentru oricare doua constante
, dispersia variabilei
este
(2.62)
3. Daca este o
variabila aleatoare având dispersia
si
o
constanta reala, atunci
(2.63)
egalitatea
având loc doar pentru
4. Pentru orice variabila aleatoare are loc inegalitatea Cebîsev [ ]
arbitrar. (2.64)
Functii derivate
Se numeste functie
caracteristica a variabilei aleatoare , valoarea medie a unei noi variabile aleatoare, obtinute din
, înlocuind argumentul
prin
, unde
este unitatea imaginara, iar
- un parametru real.
Daca variabila este distribuita discret
atunci functia caracteristica este data de relatia
(2.65)
Daca variabila are distributie
continua cu desinatea
atunci functia
caracteristica este
(2.66)
Daca repartitia
variabilei este de tip continuu, densitatea
sa de repartitie
este data de relatia
(2.67)
Functia de
supravietuire sau de fiabilitate reprezinta probabilitatea ca o
variabila aleatoare sa ia o valoare mai mare
decât
(2.68)
Functia
hazard sau rata cedarii a unei variabile este
definita ca raportul dintre densitatea de repartitie si functia
de supravietuire:
(2.69)
(2.70)
sau
(2.71)
Functia generatoare a
unei variabile aleatoare care ia numai valori întregi pozitive
este definita de relatia
(2.72)
Între funtia caracteristica si functia generatoare exista relatia
(2.73)
Functia caracteristica se utilizeaza pentru calculul mometelor factoriale, obisnuite si centrate de diferite ordine.
Indicatori statistici
Indicatorul statistic reprezinta expresia numerica a unei trasaturi observate pe o colectivitate definita în timp si spatiu.
În functie de metoda obtinerii indicatorilor si de rolul jucat în cercetarea statistica, indicatorii pot fi împartiti în doua categorii: (a) indicatori absoluti (primari); (b) indicatori derivati (secundari).
Indicatorii absoluti sunt rezultatul observarii si sistematizarii datelor; în consecinta acestia reflecta dimensiunea, marimea, amplitudinea fenomenului în unitati concrete, specifice, de masura.
Indicatorii derivati se obtin în procesul de calcul statistic si reflecta într-o maniera abstracta, aspecte calitative, evolutive ale colectivitatii cercetate. Dintre indicatorii derivati amintim: marimile relative si marimile medii, indicatorii variatiei si ai asimetriei, indicii statistici, parametrii functiilor de regresie si ajustare analitica etc.
Functiile indicatorilor statistici sunt: de masurare, de comparare, de sinteza, de estimare, de verificare a ipotezelor statistice, de testare a semnificatiilor parametrilor statistici utilizati.
Orice indicator statistic trebuie sa îndeplineasca doua conditii: (a) sa aiba un continut stiintific bine determinat, o definitie sau o formula a sa; (b) sa indeplineasca conditia de compatibilitate.
Indicatorii tendintei centrale
Principali indicatori ai tendintei centrale sunt: (a) indicatorii medii de control: media aritmetica, media geometrica, media armonica etc; (b) indicatorii medii de pozitie: modul, mediana, cuartilele si decilele.
Media este expresia sintetizarii într-un singur nivel reprezentativ a tot ce este esential, tipic si obiectiv în aparitia, manifestarea si dezvoltarea unei variabile (caracteristici) [1].
Functie de natura datelor înregistrate si de natura variatiei, media poate fi: media aritmetica (simpla), media armonica, media geometrica, media patratica, media cubica, media parabolica, media cronologica etc.
Media
aritmetica simpla de sondaj (sau de selectie) a unui sir de valori
se calculeaza cu relatia
(2.74)
Media aritmetica ponderata
a unui sir de valori
se calculeaza cu relatia
(2.75)
în care reprezinta frecventa sau
numarul de aparitii al variabilei
Media aritmetica ponderata este influentata atât de nivelul caracteristicii cât si de nivelul frecventei.
Media
aritmetica este o valoare interna a seriei din care a fost
calculata (trebuie sa fie mai mare decât valoarea minima si
mai mica decât valoarea maxima),
Principiul pe care se bazeaza media este cel al compensatiei abaterilor (+ sau -); suma abaterilor nivelurilor individuale ale variabilei aleatoare fata de media lor diind egala cu zero.
Media armonica
Media armonica reprezinta acea valoare care înlocuid termenii reali din colectivitate nu modifica suma inverselor. Media armonica este o valoare interna seriei din care a fost calculata. Se disting doua cazuri:
- Media armonica simpla
; (2.76)
. (2.78)
Când nu se cunosc frecventele se foloseste
media armonica special ponderata. Ponderarea nu se face cu
ci cu
. În acest caz, media armonica este un artificiu de
calcul pentru a determina media aritmetica când datele nu permit aflarea
directa a acesteia
(2.79)
Media geometrica
Media geometrica este acea valoare care înlocuid termenii reali din colectivitate nu modifica produsul acestora. În cazul mediei geometrice functia determinanta este de tip multiplicativ si se disting doua cazuri:
- Media geometrica simpla (neponderata)
sau
, (2.80)
- Media geometrica ponderata
. (2.81)
Media geometrica nu este influentata nici de valorile cele mai mici, nici de valorile cele mai mari, dar nu poate fi determinata daca unele valori sunt nule sau negative. Media geometrica se utilizeaza pentru calculul indicelui mediu de crestere sau descrestere.
Media patratica
Se foloseste când nivelul variabilei prezinta cresteri din ce în ce mai mari, modificându-se aproximativ dupa o functie exponentiala. Se disting doua cazuri:
- Media patratica simpla
; (2.82)
.
(2.84)
Mediana este acea valoarea a caracteristicii fata de care frecventa valorilor mai mica decât ea este egala cu frecventa valorilor mai mari decât ea, deci mediana împarte sirul de date în doua parti egale. Din punct de vedere analitic, mediana corespunde valorii abscisei pentru care ordonata împarte suprafata delimitata de curba de repartitie în doua parti egale.
Daca sirul de date
este constituit dintr-un numar impar de valori , mediana este reprezentata de valoarea de rang
. În cazul în care sirul de date este constituit dintr-un numar
par de valori
, mediana se situeaza între doua valori mediane
si
n general, s-a convenit sa
se considere ca mediana media aritmetica a celor doua valori
mediane:
Mediana unei functii de repartitie este valoarea
pentru care valoarea mai mare si
mai mica a lui
au probabilitati egale
(2.89)
În cazul seriilor de distributie, mediana se determina cu formulele:
, unde
este numar par; (2.90)
unde
este numar impar, (2.91)
în care: este
limita inferioara a intervalului median;
-
frecventele caracteristicii
- marimea
intervalului;
- frecventa
intervalului median;
- marimea intervalului.
Modul
Modul este, prin definitie, valoarea caracteristicii cu frecventa cea mai mare de aparitie în colectivitate. Modul mai poate fi definit ca valoarea caracteristicii careia îi corespunde densitatea maxima de repartitie. Minimul densitatii de repartitie este antimod. Daca sirul de masuratori are doua valori maxime, repartitia se numeste bimodala, iar daca sunt mai multe, plurimodala.
Modul unei functii de
repartitie este valoarea lui
pentru care functia are un
maxim. Intervalul modal este intervalul cu frecventa cea mai mare.
În cazul seriilor de distributie, modul se calculeaza cu relatia
(2.92)
unde: este limita inferioara a
intervalului modal;
- diferenta dintre frecventa
intervalului modal si frecventa intervalului premodal (anterior);
- diferenta dintre frecventa intervalului modal si frecventa
intervalului postmodal (urmator);
- marimea intervalului modal.
K. Person [ ] a stabilit o expresie care da valoarea modului în functie de media aritmetica si mediana pentru toate repartitiile unimodale
(2.93)
Media, mediana si modulul caracterizeaza tendinta centrala si forma de variatie a caracteristicii. În cazul unei distributii simetrice ele coincid.
Valoarea centrala a sirului de date este
(2.94)
în care este valoarea cea mai mare dintre
valorile
, iar
, cea mai mica.
Cuantilele sunt valori ale caracteristicii
care împart seria în parti egale. Ele descriu pozitia
anumitor termeni în cadrul seriilor statistice. Functie de valorile lui
, cuantilele se numesc: mediana,
; cuartile,
; decile,
; centile,
Cuartile
Cuartilele sunt marimi de pozitie în seriile statistice. Cuartilele, în numar de trei, împart seria în patru parti de frecvente egale cu 1/4
(2.95)
unde este
limita inferioara a cuartilei
-
frecventa cumulata pâna la intervalul
-
frecventa intervalului
- marimea
intervalului în care se afla cuartila
Cuartila
centrala a seriei se noteaza cu , ea reprezentând valoarea unitatii mediane.
Ordonata corespunzatoare acestei unitati împarte aria
delimitata de curba distributiei în doua parti egale. Cuartila
inferioara
este unitatea
mediana a valorilor situate în partea inferioara a medianei
, iar cuartila superioara
este mediana valorilor
situate în partea superioara a medianei propriu-zise.
Locul
unei cuartile oarecare este dat
de relatia
(2.96)
Decilele
Decilele, în numar de noua, împart seria în zece intervale de frecvente egale cu 1/10
(2.96)
unde este
limita inferioara a decilei
- frecventa
cumulata (suma frecventelor anterioare) pâna la intervalul
- frecventa
intervalului
- marimea
intervalului în care se afla decila
Locul unei decile oarecare este dat de relatia
(2.96)
Centilele
Centilele, în numar de 99, împart seria în 100 de intervale egale
(2.97)
unde este limita inferioara a centilei
- frecventa cumulata pâna
la intervalul
- frecventa intervalului
- marimea intervalului în
care se afla centila
Indicatorii de masura a împrastierii
Dispersia (sau varianta) sirului de date, denumita si dispersie de sondaj (esantion) este indicatorul de baza al împrastierii.
Pentru o serie simpla, dispersia se calculeaza cu formula
(2.98)
Pentru o serie de frecvente variate, dispersia se calculeaza cu formula
(2.99)
Dispersia de sondaj se poate folosi ca estimatie a dispersiei din populatia originara (dispersie de selectie), considerându-se relatia
(2.100)
Abaterea medie patratica
Pentru o serie simpla, abaterea medie patratica (sau deviatia standard de sondaj; abaterea standard) se calculeaza cu formula
(2.101)
Pentru o serie de frecvente variate, abaterea medie patratica se calculeaza cu formula
(2.102)
Abaterea medie patratica a populatiei originara este
Abaterea medie liniara (sau abaterea medie absoluta) se calculeaza ca media aritmetica din valorile absolute ale abaterilor variantelor caracteristicii fata de media acestor variante.
Abaterea medie liniara se foloseste pentru a caracteriza omogenitatea colectivitatii statistice.
Coeficientul de variatie
Coeficientul de variatie al sirului de date se calculeaza ca raportul dintre abaterea medie patratica si media aritmetica a sirului de date
. (2.106)
Coeficientul de variatie
ia valori începând cu 0. Daca este pâna în 35% se
considera ca intensitatea variatiei este redusa, colectivitatea
este omogena si media este reprezentativa. Daca
depaseste 35% se
considera ca intensitatea variatiei creste si
colectivitatea este eterogena iar media tinde sa fie o marime
nereprezentativa.
Abaterea medie intercuartilica
Abaterea medie intercuartilica este definita ca jumatatea intercuartilei
(2.107)
Intercuartila este o masura a
dispersiei exprimata prin diferenta dintre cuartila superioara
si cea inferioara.
Abaterea medie
intercuartilica este folosita în analiza dispersionala si
are avantajul ca poate fi usor calculata. Abaterea medie
intercuartilica reprezinta aproximativ din abaterea standard si este
mai putin exacta decât abaterea medie liniara. Având în vedere
ca se exprima în aceeasi unitate de masura ca si
variabila analizata, abaterea medie intercuartilica nu se poate
utilize pentru comparatii între serii statistice diferite din punct de
vedere al unitatilor de masura.
Coeficientul de variatie intercuartilica
Coeficientul de variatie intercuartilica este rapotrul dintre semiintercuartila si mediana
(2.108)
Coeficientul de variatie intercuartilica prezinta avantajul unei comparabilitati mai largi.
(2.109)
Amplitudinea se poate calcula si ca marime relativa. Amplitudinea relativa este raportul dintre amplitudinea absoluta si media aritmetica a sirului de date
(2.110)
Momentele sunt acele valori care caracterizeaza o repartitie si permit precizarea anumitor caracteristici ale repartitiei. Exista mai multe tipuri de momente:
Pentru
serii simple, momentul simplu de ordinul are
expresia
(2.111)
Pentru serii de distributie, momentul simplu se calculeaza cu relatia
(2.112)
Momentul
centrat de ordinul , pentru serii simple, are expresia
(2.113)
Pentru serii de distributie, momentul centrat are expresia
(2.114)
Pentru
serii simple, momentul ordinar de ordinul , calculat în raport cu o valoare arbitrara
, are expresia
(2.115)
Pentru serii de distributie, momentul ordinar are expresia
(2.116)
Pentru caracterizarea seriilor de distributie unidimensionale si unimodale este necesara cunoasterea gradului de oblicitate, de îndepartare a acestor distributii de la simetrie, aspect denumit asimetrie.
Pentru cuantificarea gradului de asimetrie se foloseste coeficientul de asimetrie definit de relatia
(2.117)
sau în functie de momentele centrate
(2.118)
în care este momentul centrat de ordinul
trei, iar
este momentul centrat de ordinul
doi.
De asemenea, coeficientul de asimetrie poate fi definit ca diferenta dintre medie si mod
. (2.119)
Daca: atunci exista
simetrie perfecta;
exista asimetrie
pozitiva sau de stânga;
exista asimetrie
negativa sau de dreapta.
a) b)
Fig. 2.4. Distributii asimetrice:
a) asimetrie negativa; b) asimetrie pozitiva.
Pentru masurarea asimetriei se foloseste cel mai des coeficientul de asimetrie Pearson [ ] definit de relatia
(2.120)
în care este
modulul;
-
abaterea medie patratica;
- media
aritmetica.
Daca
repartitia prezinta o asimetrie
negativa. Daca
repartitia este simetrica. Daca
repartitia prezinta o asimetrie
pozitiva. Pentru repartitii moderat asimetrice
Coeficientul de asimetrie determinat pe baza metodei Fisher [ ] are expresia
(2.121)
în care reprezinta mediana.
Coeficientul
de asimetrie are
valori între -3 si +3; cu cât se apropie de zero cu atât sirul este
mai simetric.
Coeficientul de asimetrie determinat pe baza cuartilelor are expresia
(2.122)
Coeficientul de asimetrie determinat pe baza centilelor are expresia
(2.123)
Coeficientul de boltire se calculeaza ca raport între momentul centrat de ordinul patru si patratul momentului centrat de ordinul doi
în care:
(2.125)
(2.126)
Coeficientul de boltire este un indicator al pantei curbei densitatii de repartitie, în vecinatatea modului de sondaj.
Curtozisul arata gradul de concentrare al frecventelor în zona centrala a distributiilor unimodale. Pentru determinarea curtozisului se foloseste coeficientul de boltire.
stiind ca pentru
repartitia normala si considerând aceasta
valoare ca nivel standard în masurarea gradului de boltire al
distributiei unimodale, curtozisul este dat de relatia
(2.127)
Daca , curba densitatii de repartitie se numeste leptocurtica
si este mai ascutita la vârf decât curba normala. Daca
repartitia se numeste
platicurtica si are vârful mai plat decât o curba normala.
Daca
repartitia se numeste
normala sau mezocurtica.
Curtozisul se poate determina si cu ajutorul cuartilelor si al centilelor cu relatia
(2.128)
Se pot utiliza urmatoarele functii Excel:
daca CV este sub 10% atunci
populatia poate fi considerata omogena;
daca CV este intre 10%-20%
atunci populatia poate fi considerata relativ omogena;
daca CV este intre 20%-30% atunci
populatia poate fi considerata relativ eterogena;
daca CV este peste 30% atunci
populatia poate fi considerata eterogena.
|