Informatica Medicala si Biostatistica
1 01 Introducere in Informatica Medicala
2 02 - Structura sistemelor de calcul
3 03 - Sisteme de operare
4 04 - Birotica si baze de date
5 05 - Retele de calculatoare, Internet
6 06 - Biostatistica - introducere
7 07 - Statistica descriptiva
8 08 - Calculul probabilitatilor
9 09 - Variabile aleatoare
10 10 - Estimari
11 11 - Corelatii si regresii
12 12 - Teste statistice 1
13 13 - Teste statistice 2
14 14 - Teste statistice 3
Alte surse bibliografice disponibile pe serverele catedrei
Laboratoare - aplicatii
Last modified 23.05.2008 04:58:01
Notes
Slide Show
[Pause/Play Narration]
[Previous Slide]
[Next Slide]
Outline
[Expand/Collapse Outline]
Introducere īn Informatica Medicala
* Conf. Dr. Tudor Drugan
Regulament
* Studentii au obligatia sa depuna la decanat documentele care atesta motivarea absentelor īn cel mult 7 zile calendaristice de la efectuarea acestora si, īn aceeasi perioada, sa depuna la catedre motivarea vizata de decanat pentru programarea recuperarilor.
* Motivarile nedepuse atāt la decanat cāt si la catedre īn timpul sus mentionat nu se vor lua īn considerare.
Regulament
* Pentru a realiza integral numarul de credite aferent unei discipline de studiu, studentii au obligatia sa participe la minim 70 % din urile disciplinei respective
* NU se admit absente nemotivate si nerecuperate. NU se admit schimbari ale programarilor orelor de laborator.
Regulament
* Studentii care nu au recuperat absentele de la lucrarile practice sau care nu au frecventat 70% din uri īn semestrul/anul universitar īn care au fost programate vor stabili modalitatea de recuperare (īn semestrul/modulul urmator daca acest lucru mai este posibil īn anul curent, daca nu īn anii urmatori).
Evaluare
* Īn cadrul examenelor teoretice si practice studentii trebuie sa faca dovada ca au par si īnvatat cel putin 70% din materie (de exemplu trebuie sa obtina 50% din punctajul testului) iar nota obtinuta (atāt la practic cāt si la examenul teoretic) sa fie cel putin eg 434i85e ala cu 5.
* Examenul practic are o pondere de 30% īn calculul notei finale
Evaluare
* Studentii au voie sa foloseasca in examen urmatoarele surse de "inspiratie":
o urile proprii luate in deul anului
+ Nu se admit copii
o Scheme, note, transcrieri scrise de mana
+ Nu se admit copii
Bibliografie
* 1. Tigan S., de informatica Medicala si
Biostatistica, Tipografia UMF,
* 2. Tigan S., Achimas A., Drugan T., Mircean A., Aplicatii de birotica cu Microsoft Office, SRIMA, Cluj-Napoca, 1998.
* 3. Tigan S., Achimas A., Drugan T., Biostatistica Medicala,
* SRIMA, Cluj, 1999.
* 4. Tigan S., Achimas A., Drugan T., Ramona Galatus, Dorina Gui, Informatica si statistica aplicate in medicina, Ed. SRIMA, Cluj, 2000.
* 5. Tigan S., Achimas A., Drugan T., de Informatica si statistica medicala, Ed. SRIMA, Cluj, 2001
Diagrama studiilor la catedra noastra
INTRODUCERE
Introducere
I. Informatica generala
+ 1. Obiectivele informaticii
+ 2. Structura calculatoarelor
+ - Hard
+ - Soft
+ - Clase de calculatoare
"3"
+ 3. Structuri de date
+ - Fisiere
+ - Baze de date
+ 4. Sisteme de operare (WINDOWS)
+ 5. Interfete cu utilizatorul
+ Linie de comanda
+ Meniu
+ Grafica
Dispozitive de intrare
tastatura, mouse
Memorii externe
discheta, hard disk,
CD-ROM
Dispozitive de iesire
monitor, imprimanta
Nr. de nascuti
de sex masculin (a) 1927054
Nr. total de nasteri (b) 3760358
Probabilitatea empirica a nasterii
unui copil de sex masculin (a/b)
Desi definitia clasica poate fi adesea utila ea nu este satisfacatoare pentru ca, pe de o parte, cere probe (īncercari) echiprobabile, ceea ce presupune ca aceasta notiune a fost deja definita. Pe de alta parte aceasta cerinta limiteaza utilizarea sa
9Definitia clasica a probabilitatii
Astfel, daca īncercarile constau īn determinarea grupei sangvine, rezultatele posibile fiind: A, B, AB, O, acestea nu sunt echiprobabile.
Grupa Sangvina Probabilitatea
O
A
B
AB
Acesta este motivul pentru care este necesara o abordare mai generala a notiunii de probabilitate printr-o introducere axiomatica a acestei notiuni
10Spatiul fundamental de evenimente
* Fie H un experiment aleator dat pentru care E reprezinta multimea tuturor rezultatelor posibile. E se numeste multime fundamentala sau spatiu fundamental (spatiul evenimentelor elementare). Spatiul fundamental poate sa fie finit sau infinit.
* Astfel ca, o submultime A a lui E se numeste eveniment, iar daca A are un singur element din E el este un eveniment elementar.
* Orice eveniment a carui realizare depinde de cel putin doua evenimente elementare este un eveniment compus.
* Multimea vida Ę si multimea fundamentala E sunt si ele evenimente, si anume, evenimentul imposibil (Ę) si respectiv evenimentul cert (E). Evenimentul sigur se produce cu certitudine la orice efectuare a experimentului, iar evenimentul imposibil este nerealizabil īn urma efectuarii experimentului.
11Spatiul fundamental de evenimente
* In mod asemanator cu operatiile de reuniune si intersectie cu multimi se definesc operatii similare cu evenimente. Astfel fiind date doua evenimente A si B, reuniunea lor C=AČB este un eveniment care are loc daca cel putin unul dintre evenimentele A sau B are loc, si intersectia D=AĒB este evenimentul care are loc numai cānd A si B au loc simultan.
* Prin contrarul (complementarul) unui eveniment A se īntelege un eveniment care se realizeaza ori de cāte ori nu se realizeaza A. Acesta se noteaza prin non A (sau C(A) ori ).
* Daca doua evenimente A si B sunt disjuncte ( A Ē B = Ę), adica daca nu se pot realiza simultan, se spune ca ele sunt incompatibile. Doua evenimente A si B care se pot realiza simultan se numesc compatibile.
* Evenimentul A implica evenimentul B si se noteaza prin AĢB, daca evenimentul B se produce ori de cāte ori se produce A.
12Spatiul fundamental este finit
* Experimentul H consta īn aruncarea unui zar.
o Spatiul fundamental īn acest caz este multimea tuturor rezultatelor posibile la aruncarea zarului: E = . In acest caz spatiul fundamental E este finit.
o Printre evenimentele posibile (submultimi ale lui E) se pot considera:
+ A = (obtinerea unei fete pare)
+ B = (obtinerea unei fete impare)
+ C = ( eveniment elementar).
o In acest caz, evenimentele A si B sunt incompatibile. Evenimentele elementare sunt echiprobabile.
13Spatiul fundamental este finit
* Experimentul H consta īn determinarea grupei sangvine.
o In acest caz spatiul fundamental este E = . E este evident finit īnsa spre deosebire de exemplul 1.1, evenimentele elementare , , si nu sunt echiprobabile.
14Spatiul fundamental este infinit si numarabil
* Experimentul H consta īn aruncarea succesiva a unui zar pāna ce se obtine fata 5.
o Spatiul fundamental īn acest caz este alcatuit din numarul aruncarilor necesare, care variaza de la 1 la infinit:
+ E = .
o Spatiul fundamental E este infinit, īnsa elementele sale fiind ordonate īntr-un sir, E este un exemplu de spatiu fundamental numarabil.
15Spatiul fundamental este infinit si numarabil
* Experimentul H consta īn numararea internarilor īntr-un spital īntr-un interval de timp dat (saptamāna, luna, an etc.)
o Spatiul fundamental E variaza de la 0 la infinit, adica
+ E = .
o In acest caz, E este o multime infinita si numarabila.
16Spatiul fundamental este infinit si nenumarabil
* Experimentul H consta īn aruncarea unei bile sferice īntr-o cutie dreptunghiulara.
o In urma unei īncercari dupa oprirea bilei ea are un punct de contact cu baza cutiei.
o Spatiul fundamental E, īn acest caz, este alcatuit din punctele de contact.
o Aici E este o multime infinita si nenumarabila.
17Spatiul fundamental este infinit si nenumarabil
* Experimentul H consta īn masurarea temperaturii corporale.
o Spatiul fundamental E este alcatuit din toate valorile posibile ale temperaturii corporale, astfel putem considera ca īn E intra toate valorile din intervalul [35, 41], sau ca
+ E = [35,41].
o In acest caz, spatiul fundamental este o multime infinita si nenumarabila.
18Spatiul fundamental este infinit si nenumarabil
* Experimentul H consta īn masurarea tensiunii arteriale sistolice (TAS).
o Spatiul fundamental E este alcatuit din toate valorile posibile ale TAS, astfel putem considera ca E este inclus īn intervalul [0, „).
o In acest caz, de asemenea, spatiul fundamental este o multime infinita si nenumarabila.
19Definitia axiomatica
* Fie E un spatiu fundamental asociat unui experiment H si W multimea tuturor evenimentelor, adica multimea partilor lui E:
* W = P(E) .
* Se spune ca functia Pr:W®R este o functie de probabilitate, iar prin Pr(A) se noteaza probabilitatea evenimentului A, daca satisface urmatoarele axiome:
* M1. 0 £ Pr(A) £ 1, " AĪW
* M2. Pr(E) = 1
* M3. Daca A si B sunt incompatibile (adica nu pot avea loc simultan) atunci
* Pr(AČB) = Pr(A) + Pr(B).
20Definitia axiomatica
* Exemplu: (Hipertensiune) Fie A evenimentul ca o persoana sa aiba tensiune arteriala diastolica normala (TAD) adica TAD <90. Fie B evenimentul ca o persoana sa aiba TAD la limita, adica 90 £ TAD < 95. Presupunem ca Pr(A) = 0.7, Pr(B) = 0.1 . Fie C evenimentul ca o persoana are TAD < 95. Evident C=AČB si AĒB=Ę. Atunci, Pr(C) =Pr(A) + Pr(B).
* O modalitate de a defini īn mod concret functia de probabilitate este cu ajutorul unei "masuri" definite pe spatiul fundamental E, adica:
21Definitia axiomatica - proprietati
* T1. Daca A1, A2, ..., An sunt evenimente incompatibile doua cāte doua atunci:
* Proprietatea T1 poate fi demonstrata usor prin inductie prin utilizarea axiomei M3.
22Definitia axiomatica - proprietati
* T2. Pr(Ę) = 0.
o Intr-adevar, deoarece oricare ar fi evenimentul A, el este incompatibil cu Ę, īn baza axiomei M3, rezulta ca
o Pr(A) = Pr(AČĘ) = Pr(A) + Pr(Ę).
* T3. Pr(non A) = 1 - Pr(A).
o Intr-adevar, din M3 rezulta usor ca:
o Pr(AČ non A) = Pr(A) + Pr(non A),
o iar din M2 avem:
o Pr(AČ non A) = Pr(E) = 1.
23Definitia axiomatica - proprietati
* T4. Daca AĶB atunci Pr(A) £ Pr(B).
* Intr-adevar, pentru ca B = A Č (B -A) iar multimile A si B - A sunt disjuncte, aplicānd axiomele M3 si M1 rezulta imediat ca:
* Pr(B) = Pr(A) + Pr(B-A) ³ Pr(A).
* T5. Pentru orice evenimente A si B are loc egalitatea:
* (1) Pr(AČB) = Pr(A) + Pr(B) - Pr(AĒB) .
* Deoarece, AČB = (A-B) Č B, iar multimile A-B si B sunt disjuncte, īn baza axiomei M3, rezulta ca:
* (2) Pr(AČB) = Pr(B-A) + Pr(B).
24Definitia axiomatica - proprietati
* Pe de alta parte, fiindca A= (A-B) Č (A Ē B), iar multimile (A-B) si (A Ē B) sunt disjuncte, prin M3 se obtine egalitatea:
* Pr(A) = Pr(A-B) + Pr(A Ē B)
* de unde rezulta:
* Pr(A-B) = Pr(A) - Pr(A Ē B).
* Insa, īnlocuind Pr(A-B) astfel obtinut īn (2), rezulta egalitatea (1) care trebuia demonstrata.
25PROBABILITĂŢI CONDIŢIONATE
26Probabilitate conditionata
* Daca A si B sunt doua evenimente arbitrare, prin probabilitatea conditionata a lui A de catre B, notata prin Pr(A/B), se īntelege probabilitatea de a se realiza evenimentul A daca īn prealabil s-a realizat evenimentul B.
* Prin definitie:
* sau raportul dintre numarul elementelor din B care sunt si īn A la numarul elementelor lui B.
27Probabilitate conditionata
* Are loc urmatoarea regula de calcul a probabilitatii intersectiei a doua evenimente:
* sau
28Probabilitate conditionata
* Aceste formule sunt cunoscute si sub numele de regula generala de īnmultire a probabilitatilor. Mai general au loc urmatoarele reguli de īnmultire a probabilitatilor:
Testul / Afectiunea T pozitiv non (T) negativ Total
A a b a+b
non (A) c d c+d
Total a+c b+d n
* Pr(A) se numeste prevalenta afectiunii A.
33Sensibilitatea testului
* Probabilitatea, notata cu Se, de a obtine un test pozitiv, stiind ca testul este aplicat unei persoane care poseda afectiunea, se numeste sensibilitatea testului se exprima cu ajutorul unei probabilitati conditionate:
34Specificitatea testului
Pentru caracterizarea unui test diagnostic se utilizeaza si specificitatea testului care se defineste prin probabilitatea de a obtine un test negativ pentru o persoana care nu poseda afectiunea (probabilitate conditionata):
Testul / Afectiunea T pozitiv non (T) negativ Total
A a b a+b
non (A) c d c+d
Total a+c b+d n
35Valoarea pozitiva predictiva VPP
* este probabilitatea ca un test pozitiv sa indice o persoana cu afectiunea A:
36Valoarea predictiva negativa VPN
* este probabilitatea ca un test negativ sa indice o persoana fara afectiune:
37Raportul de asemanare
* Likehood ratio (LR)
* LR = Se / (1-Sp)
* Un semn (test) diagnostic este cu atāt mai bun cu cāt are o Se si Sp mai apropiata de 1
38Exemplu
* Se masoara GOT la 94 de pacienti cu dureri toracice. Ne intereseaza numarul de infarcturi miocardice aparute la acest esantion
* Se=25/48=52,1%
* Sp=42/46=91,3%
Exemplu
lSe masoara GOT la 94 de pacienti cu dureri toracice. Ne intereseaza numarul de infarcturi miocardice aparute la acest esantion
.Se=40/48=83,3% .Sp=43/46=93,5%
GOT=<120 GOT>120
Infarct 40 8
Sanatosi 3 43
Prag=120 U
40Curba ROC
Receiving-Operating Characteristic = reprezentarea grafica a valorii informationale a unui test fata de un diagnostic īn domeniul [Se, 1-Sp] atunci cānd variaza pragul ales
41Curba ROC generalizata
* Un test A este mai bun ca un test B daca:
o Se(A)>Se(B) si Sp(A)>=Sp(B)
o Sau: Sp(A)>Sp(B) si Se(A)>=Se(B)
* Nu se pot clasifica cele doua teste daca
o Se(C)>Se(B) si Sp(C)<Sp(B)
o Se(C)<Se(B) si Sp(C)>Sp(B)
42VPP, VPN
* Valoarea predictiva pozitiva VPP a unui test de screening este probabilitatea ca o persoana sa aiba boala daca testul este pozitiv, adica
* VPP =Pr(boala | test+).
* Valoarea predictiva negativa VPN a unui test de screening este probabilitatea ca o persoana sa nu aiba boala daca testul este negativ, adica
* VPN =Pr(nu boala | test-).
* Un simptom sau un set de simptome poate fi privit ca un test de sreening pentru o anumita boala. Cu cāt mai mari sunt valorile predictive ale testului cu atāt mai valoros este testul respectiv.
43VPP, VPN
* Clinicienii adesea nu pot masura direct valoarea predictiva a unui set de simptome. Totusi ei pot masura cāt de frecvent apar simptomele la persoane bolnave si respectiv normale. Aceste masuri sunt definite astfel:
o Sensibilitatea unui simptom (sau set de simptome sau test de sreening) este probabilitatea ca simptomul sa fie prezent daca persoana are boala.
o Specificitatea unui simptom (sau set de simptome sau test de sreening) este probabilitatea ca simptomul sa nu fie prezent daca persoana nu are boala respectiva.
* Un fals negativ este o persoana pentru care testul este negativ dar care de fapt are boala.
* Un fals pozitiv este o persoana pentru care testul este pozitiv dar care de fapt nu are boala.
* Este important ca atāt senzitivitatea cāt si specificitatea sa fie ridicate pentru ca simptomul sau testul sa fie predictiv pentru o boala.
44Independenta a doua evenimente
* Doua evenimente A si B se numesc independente daca si numai daca
* Pr(AĒB) = Pr(A) × Pr(B).
* Aceasta proprietate se mai numeste si legea de īnmultire a probabilitatilor.
* Doua evenimente A si B sunt dependente daca
* Pr(AĒB) ¹ Pr(A) × Pr(B).
* Au loc urmatoarele proprietati privind probabilitatile conditionate:
o Daca A si B sunt evenimente independente, atunci Pr(B|A) =Pr(B)
o Daca A si B sunt evenimente dependente, atunci Pr(B|A) ¹Pr(B) si Pr(AĒB)¹Pr(A) Pr(B).
45Independenta a doua evenimente
* Intr-adevar, egalitatile Pr(B/A) = Pr(B) si Pr(A/B) = Pr(A), exprima bine independenta celor doua evenimente prin faptul ca probabilitatea evenimentului B (respectiv A) nu depinde de realizarea evenimentului A (respectiv B).
* Urmatoarea proprietate se mai numeste si legea de adunare a evenimentelor independente.
* Daca A si B sunt doua evenimente independente, atunci Pr( A ČB ) = Pr(A) + Pr(B) (1 - Pr(A)).
46Formula lui BAYES
* Sa consideram doua evenimente A si B care nu sunt independente. Atunci din formulele:
* si se deduce formula lui BAYES:
* Dar fiindca
o Pr(B) = Pr((BĒnonA) Č (BĒA)) =Pr(BĒnonA) + Pr(BĒA),
* aplicānd formula probabilitatilor conditionate se obtine:
o Pr(B)=Pr(B|A) Pr(A) + Pr(B|nonA) Pr(nonA).
* De aici rezulta urmatoarea forma a formulei lui Bayes:
47Formula lui BAYES - exemplu
* Se stie
ca 60% din populatia dintr-o
* Fie A evenimentul ca o persoana sa fie alergica, iar U evenimentul ca o persoana sa locuiasca īn mediul urban. Atunci probabilitatea cautata este:
48Formula lui BAYES
* Formula lui Bayes poate fi utila īn stabilirea unui diagnostic medical. Fie D o maladie si S un semn. In acest caz, se pot considera urmatoarele probabilitati:
o Pr(D/S) -
probabilitatea ca maladia D sa fie prezenta atunci cānd la un bolnav
s-a constatat semnul
o Pr(D) - probabilitatea lui D daca nu exista nici o informatie. Este de fapt frecventa maladiei D īn ansamblul populatiei (prevalenta lui D). Aceasta probabilitate se numeste probabilitate a priori.
o
Pr(S/D)/Pr(S) este frecventa semnului S īn cazul maladiei D raportata
la frecventa sa īn ansamblul populatiei (care are sau nu maladia D).
Aceasta probabilitate se numeste valoarea diagnostica a lui S pentru
D (care va fi cu atāt mai buna cu cāt
Notes
Slide Show
[Pause/Play Narration]
[Previous Slide]
[Next Slide]
Outline
[Expand/Collapse Outline]
1Variabile aleatoare * Tudor Drugan* 2006-2007
2Definitie
* Fie E un spatiu fundamental care corespunde unui anumit experiment aleator. Nu este necesar ca rezultatele unui experiment aleator sa fie numere, dar este adesea util ca fiecarui rezultat sa i se atribuie o valoare numerica specifica. Prin aceasta operatie se creeaza o anumita variabila aleatoare.
* Se numeste variabila aleatoare pe un spatiu fundamental E si se noteaza prin X, o functie definita pe E cu valori īn multimea numerelor reale.
* Unei variabile aleatoare X i se pot asocia diferite probabilitati cu care aceasta variabila aleatoare poate lua anumite valori, ca de exemplu:
o Pr( X = a) - probabilitatea ca "X sa ia valoarea a";
o Pr( a £ X £ b ) - probabilitatea ca "X sa ia o valoare īn intervalul [a,b]".
3Definitie
* O variabila aleatoare se numeste discreta daca ea poate lua un numar finit sau cel mult numarabil de valori
4Exemple
* Numarul de internari īntr-un spital īntr-un interval de timp dat X=. Aceasta este o variabila aleatoare discreta infinita.
* Numarul de bacterii īntr-un mililitru de apa X=.
* Numarul de indivizi cu RH-negativ dintr-un grup de n persoane luate la īntāmplare X=. Aceasta este o variabila aleatoare discreta finita
5Definitie
* O variabila aleatoare este continua atunci cānd variaza īn mod continuu īntr-un interval si poate lua o multime nenumarabila de valori.
6Exemple
* temperatura corporala,
* concentratia unei substante īn sānge,
* capacitatea pulmonara, etc.
7LEGEA DE PROBABILITATE A UNEI VARIABILE ALEATOARE FINITE
* Fie X o variabila aleatoare pe un spatiu fundamental E finit, adica
o X =.
* Multimea de probabilitati
o p(x1 ), p(x2 ), ..., p(xi), ..., p(xn )
* asociate valorilor:
* x1 , x2, ..., xi, ..., xn
* se numeste distributia sau legea de probabilitate a variabilei aleatoare X.
8LEGEA DE PROBABILITATE A UNEI VARIABILE ALEATOARE FINITE
* Distributia unei variabile aleatoare finite X se mai noteaza prin urmatorul tabel:
* Probabilitatile care apar īn distributia unei variabile aleatoare finite X verifica urmatoarea conditie:
9Exemple
* Probabilitatea de aparitie a uneia dintre fetele ale unui zar este 1/6. In acest caz avem variabila aleatoare:
* Pentru ca
probabilitatea p(x) este
10Media sau speranta matematica
* Valoarea M(X) se mai numeste si valoarea asteptata a variabilei aleatoare X.
* Observatii:
o Daca legea de probabilitate a lui X este uniforma, adica p(xi) = 1/n , pentru orice i= 1,2,...,n, atunci M(X) este media aritmetica a numerelor x1 , x2, ..., xi, ..., xn.
11Variatia si abaterea standard
* Variatia variabilei aleatoare X se defineste prin
* V(X) = M( [X- M(X)]2)
* Sau
* Prin definitie abaterea standard este:
12Variabile aleatoare centrate reduse
* Unei variabile aleatoare X cu media M(X) si abaterea standard s(X) i se poate asocia o variabila aleatoare Y numita variabila aleatoare centrata redusa definita prin:
* In baza proprietatilor mediei si abaterii standard, se poate arata usor ca variabila aleatoare centrata redusa are media M(Y)=0 si abaterea standard s(Y)=1.
13VARIABILE ALEATOARE DEFINITE PE UN SPAŢIU FUNDAMENTAL INFINIT
14Cazul discret
* Notiunile si proprietatile prezentate anterior pentru variabilele aleatoare finite se pot introduce īn mod analog pentru cazul variabilelor aleatoare discrete avānd o multime infinita de valori, prin īnlocuirea sumei finite cu una infinita
15Cazul continuu
* In cazul unei variabile aleatoare continue X, se considera o functie f:R®R numita densitate de probabilitate, care are proprietatile:
* f(x) ³ 0, " xĪR
16Cazul continuu
* In acest caz functia de repartitie F asociata variabilei aleatoare X este definita prin:
* De asemenea, media lui X este definita prin :
* iar variatia lui X
17Legi de distributie
(principalele distributii de probabilitate)
18Introducere
* In general distributiile variabilelor definite pe o populatie, care face obiectul unui studiu, nu se cunosc.
* Din punct de vedere practic se īncearca īncadrarea acestor distributii īn unele legi teoretice care constituie modele pentru aceste variabile statistice
19Principalele legi de distributie
* legea normala sau legea LAPLACE-GAUSS
o variabile aleatoare continue
* legea BINOMIALĂ (BERNOULLI)
o variabile aleatoare finite
* legea POISSON
o variabile aleatoare discrete infinite
* legea STUDENT (t)
* legea c2 a lui PEARSON
* legea F a lui FISHER.
20LEGEA NORMALĂ
* Aceasta lege de probabilitate a carei functie de probabilitate are o alura tipica de clopot numita curba normala sau curba lui Gauss este un model pentru multe variabile aleatoare continue
* Aceasta distributie depinde de doi parametri:
o media m
o abaterea standard s
* si are densitatea de probabilitate urmatoare:
21LEGEA NORMALĂ
* Daca X satisface o lege normala de medie m si abatere standard s atunci se spune ca X este de tipul N(m, s).
* Pentru variabila normala X au loc:
o M(X) = m
o Var(X) = s.
22LEGEANORMALĂ
23LEGEA NORMALĂ REDUSĂ
* Este evident ca exista o gama infinita de legi normale, care corespund cāte unei perechi de parametri (m, s).
* Toate aceste distributii normale se pot reduce la una singura, avānd media 0 si abaterea standard 1, cu ajutorul unei schimbari de variabila:
24LEGEA NORMALĂ REDUSĂ
* Aceasta este legea normala redusa cu densitatea de probabilitate:
25LEGEA NORMALĂ REDUSĂ
* Acestei legi de probabilitate īi sunt asociate un anumit numar de tabele care permit utilizarea practica a acestei legi.
* Unul dintre aceste tabele este Tabelul p(u) care contine pentru fiecare valoare u probabilitatea ca variabila Z sa fie īn exteriorul intervalului [-u,u].
* De asemenea, un alt tabel asociat legii normale reduse este Tabelul abaterii standard.
* Au loc relatiile
o p(u) =Pr( Z < -u sau Z> u)
o Pr(-u £ Z £ u) =1 - p(u).
* Astfel din tabelul ecartului redus p(1) = 0.32 si deci 1- p(1) = 0.68, iar p(1.96) =0.05 si deci 1- p(1) =0.95
26LEGEA NORMALĂ REDUSĂ
27LEGEA BINOMIALĂ SAU DISTRIBUŢIA LUI BERNOULLI
* Variabile aleatoare finite
* Modelul legii binomiale este urmatorul:
o Un experiment este alcatuit din repetarea unei īncercari elementare de n ori, n fiind un numar natural dat.
o Rezultatele posibile ale fiecarei īncercari elementare sunt doar doua evenimente numite de obicei: succes (S) si esec (E).
o Probabilitatile p de succes si q = 1 - p de esec sunt constante de la o īncercare la alta.
o Cele n īncercari repetate sunt independente una de cealalta
28LEGEA BINOMIALĂ SAU DISTRIBUŢIA LUI BERNOULLI
* Numarul de succese obtinute din cele n īncercari repetate este o variabila aleatoare de tip binomial care depinde de parametrii n si p si este de obicei notata prin Bi(n,p). Aceasta variabila aleatoare X poate sa ia valorile 0, 1, 2, ..., n si are urmatorul tabel de distributie:
29LEGEA BINOMIALĂ SAU DISTRIBUŢIA LUI BERNOULLI
* speranta matematica a legii binomiale este:
* M(X) = n p,
* iar variatia:
* Var(X) =n p q,
* si deci abaterea standard:
30Comportarea la limita a legii binomiale cānd n este mare
* Se poate arata ca atunci cānd np ³ 10 si nq ³ 10, distributia variabilei binomiale X (frecventa absoluta a succeselor) tinde sa se apropie de o lege normala
31Exemple
* Presupunem ca de regula un anumit vaccin contra pojarului produce o reactie (febra) cu o probabilitate p=0.15 . Care este probabilitatea ca din 6 copii vaccinati 4 sa aiba o reactie īn urma vaccinarii?
* Raspuns: In acest caz avem n = 6, k = 4, p =0.15, q = 1-p = 0.85 . Atunci
* Aceasta probabilitate fiind mai mica de 1% se poate considera ca aceasta situatie apare cu o sansa foarte mica.
32Exemple
* Presupunem ca de regula un anumit vaccin contra pojarului produce o reactie (febra) cu o probabilitate p=0.5 . Care este probabilitatea ca din 600 copii vaccinati cel putin 4 sa aiba o reactie īn urma vaccinarii?
33LEGEA LUI POISSON
* Variabila aleatoare POISSON este o variabila discreta care ia o infinitate numarabila de valori: 0,1,2,...,k,... , care reprezinta numarul de realizari īntr-un interval dat de timp sau spatiu ale unui eveniment
* de exemplu
o numarul de internari pe an īntr-un spital,
o numarul de bacterii īntr-un mililitru de apa,
o numarul de dezintegrari ale unei substante radioactive īntr-un interval de timp T dat
34LEGEA LUI POISSON
* Modelul acestei variabile aleatoare presupune ca sunt īndeplinite urmatoarele conditii:
o numarul de realizari ale evenimentului īntr-un interval este independent de numarul de realizari īn orice alt interval (repartitie aleatoare īn timp sau spatiu),
o numarul asteptat de realizari īntr-un interval este proportional cu dimensiunea sa si nu depinde de pozitia sa īn timp sau spatiu,
o īntr-un interval suficient de mic probabilitatea de a observa mai mult de o realizare a evenimentului este neglijabila īn raport cu probabilitatea de a observa una singura (nesimultaneitatea realizarii a doua evenimente īn timp sau spatiu).
35LEGEA LUI POISSON
* Aceasta variabila aleatoare X este caracterizata de un parametru q care reprezinta numarul mediu teoretic (asteptat) de realizari ale evenimentului īn intervalul considerat si are urmatoarea lege de distributie:
36LEGEA LUI POISSON
* Despre variabila
aleatoare de tip Poisson X se mai spune ca este de tipul
* Speranta matematica si variatia īn cazul legii lui Poisson sunt egale ambele cu q, adica :
* M(X) = Var(X) = q.
37Exemple
* Rata de mortalitate pentru o anumita boala este de 7 la 1000 de cazuri. Care este probabilitatea ca īntr-un grup de 400 de persoane aceasta boala sa cauzeze 5 decese?
* Raspuns: Avem p =7/1000=0.007, m = np = 400 x 0.007= 2.8
38Exemple
* Rata de mortalitate pentru o anumita boala este de 10 la 1000 de cazuri. Care este probabilitatea de a avea mai putin de 7 decese īntr-un grup de 500 persoane? Care este probabilitatea de a avea 7 sau mai multe decese īntr-un grup de 500 persoane?
* Raspuns: Avem
* p =10/1000=0.01, m = np = 500 x 0.01= 5
* Probabilitatea de a avea mai putin de 7 decese este:
* Probabilitatea de a avea 7 sau mai multe decese este:
* Pr(X³7) = 1- Pr(X<7) = 0.2378
39LEGEA STUDENT (T)
* Variabila aleatoare Student t este o variabila aleatoare continua care ia valori īn intervalul (-„ , +„ ), a carei functie densitate de probabilitate depinde de un singur parametru, numarul de grade de libertate.
* Fie X0, X1, ., Xn variabile aleatoare independente care toate urmeaza legea normala centrata redusa. Atunci variabila aleatoare
* urmeaza o lege de probabilitate Student cu n grade de libertate.
40LEGEA STUDENT (T)
* Densitatea de probabilitate a variabilei aleatoare Student Tn este:
* unde G este functia Gamma definita astfel:
41LEGEA STUDENT (T)
* Distributia acestei variabile aleatoare este simetrica īn raport cu originea si are o forma de clopot:
o Pr[ Tk < -x ] = Pr[ Tk > x].
* Atunci cānd k tinde la „, distributia Student tinde catre o distributie normala redusa.
* Daca n>30 legea lui Student si legea normala sunt foarte apropiate.
* Aceasta variabila aleatoare este utilizata, īn anumite conditii de normalitate, īn testul de comparatie a mediilor numit si testul Student sau testul t.
42LEGEA HI-PĂTRAT (PEARSON)
* Distributia c2 descrie comportarea unei sume de patrate a unor variabile independente normal distribuite, fiecare avānd o medie egala cu zero si abatere standard egala cu 1. Astfel variabila X, definita prin egalitatea
* Unde Xi2 reprezinta patratul unei observatii selectate aleator dintr-o populatie normal distribuita avānd media zero si deviatia standard 1, este c2 distribuita cu n grade de libertate.
* Densitatea de probabilitate a legii c2 este
43LEGEA HI-PĂTRAT (PEARSON)
* Forma acestei distributii depinde de numarul de termeni Xi2 independenti din suma. Numarul de termeni Xi2 independenti se numeste numarul de grade de libertate .
* Fiecarui nivel d al gradelor de libertate i se asociaza o distributie c2 distincta. Media si variatia unei distributii c2 sunt :
* M(c2) = d, Var(c2 ) = 2 d,
* unde d este numarul de grade de libertate.
44LEGEA F (FISHER)
* Distributia F introdusa de R. A. Fisher, este definita pe intervalul [0,+„) si descrie comportarea cātului a doua variabile cu distributie Hi-patrat fiecare fiind īmpartita prin numarul gradelor sale de libertate.
* Un membru al acestei clase de distributii este determinat prin numarul de grade de libertate ale numaratorului dn si respectiv numarul de grade de libertate ale numitorului dm, distributiile F distincte fiind determinate de perechi (dn, dm) distincte.
45LEGEA F (FISHER)
* In general, pentru dn si dm > 2 distributia F este unimodala si pozitiv asimetrica. Atunci cānd numarul gradelor de libertate creste distributia F se apropie pe domeniul sau de definitie de o distributie normala.
* Aceasta distributie este utilizata īn testele de comparatie a variatiilor si ca aplicatie a acestora īn testele ANOVA.
46DISTRIBUŢII DE EsANTIONARE
47POPULAŢIA DE EsANTIOANE
* Atunci cānd se doreste evaluarea, īntr-o populatie, valoarea medie a unui caracteristici cantitative (talia, greutatea, vārsta, cantitatea de uree din sānge, etc.) sau proportia (frecventa) acelor elemente ale populatiei care prezinta un caracter dat, cel mai frecvent nu dispunem decāt de esantioane (selectii, grupe) extrase din aceasta populatie.
* Chiar daca aceste esantioane au fost extrase fara nici o grija ca sa fie "reprezentative", media sau proportia pe care o furnizeaza se īndeparteaza mai mult sau mai putin de valorile lor exacte (teoretice) datorita hazardului esantionarii.
48POPULAŢIA DE EsANTIOANE
* Astfel, dintr-o populatie data P, se pot extrage īn diferite moduri esantioane de o dimensiune n data.
* Multimea esantioanelor posibil de extras din populatia P constituie o noua populatie numita "populatia de esantioane".
49POPULAŢIA DE EsANTIOANE
* Estimarea caracteristicilor unei populatii pe baza esantioanelor este fundamentata pe ideea ca acestea sunt aleatoare si reprezentative pentru populatia respectiva.
* Īntr-un esantion real, chiar ales aleator, nu putem fi siguri ca o anumita caracteristica va fi identica cu cea a populatiei.
* Chiar si numarul redus de cazuri dintr-un esantion poate perturba o caracteristica.
* Esantionarea aleatoare implica "dreptul" fiecarui membru al populatiei de a fi ales dar nu garanteaza reprezentativitatea proportionala a tuturor partilor unei populatii.
50POPULAŢIA DE EsANTIOANE
* In cele ce urmeaza, utilizānd aceasta populatie de esantioane se vor studia, īn special, proportiile, mediile si variatiile observate (f, m, s2).
* Daca extragerea esantioanelor E1, E2, ..., Ek, ... este īntāmplatoare, acest fapt conduce la valori diferite pentru cantitatile f, m si s2.
* Se spune ca ele au fluctuatii de esantionare. In realitate ele sunt variabile aleatoare a caror distributie se va studia īn cele ce urmeaza.
51DISTRIBUŢIA DE EsANTIONARE A UNEI MEDII OBSERVATE
* Sa consideram o variabila cantitativa X, avānd īn populatia P o medie m si un ecart-tip s. Se extrag la īntāmplare din populatia P esantioanele E1,E2,...,Ek,... care au toate acelasi efectiv n. Fie m = (m1, m2, ..., mk,...) variabila aleatoare care ia ca valori mediile observate ale variabilei X pe esantioanele E1,E2,..., Ek, ... .
* Speranta matematica sau media acestei variabile aleatoare este:
* Insa tinānd seama de proprietatile mediei unei variabile aleatoare rezulta ca:
52DISTRIBUŢIA DE EsANTIONARE A UNEI VARIABILE CALITATIVE
* Se considera o variabila calitativa Y cu proprietatea ca o "valoare" a ei are o frecventa relativa (sau o proportie) p īn populatia P.
* Pentru esantioanele E1, E2, ..., Ek, ... avānd acelasi efectiv si extrase aleator din populatia P se observa frecventele f1, f2, ..., fk, ... pentru valoarea considerata. Datorita fluctuatiilor de esantionare frecventele esantioanelor alcatuiesc o variabila aleatoare de esantionare f = (f1, f2, ..., fk, ...).
* Se poate arata ca pentru aceasta variabila aleatoare de esantionare:
* M(f) = p iar , unde q = 1 -p,
* si deci abaterea ei standard este
53Intervalul de pariu
* Fiind data o variabila aleatoare X, careia i se cunoaste distributia īn populatia P se pune problema determinarii unui interval [a,b] care contine cu o probabilitate data egala cu 1-a orice valoare a lui X obtinuta prin extragere īntāmplatoare din P.
* Acest interval se numeste intervalul de pariu cu riscul a pentru X . Astfel se poate afirma, īnainte de extragerea unei valori a lui X, ca aceasta va fi īn interval cu riscul a de eroare.
54Intervalul de pariu pentru o medie observata
* Intervalul de pariu cu riscul a pentru o medie observata pe esantioane de talie n extrase dintr-o populatie P pentru o variabila aleatoare X de tipul N(m,s) este de forma:
* unde Za este valoarea ecartului tip corespunzatoare probabilitatii a
55Intervalul de pariu pentru o frecventa observata
* La fel ca mai sus, intervalul de pariu cu riscul a pentru o frecventa observata pe esantioane de talie n extrase dintr-o populatie P pentru o variabila aleatoare X calitativa, care are un caracter ce apare cu frecventa teoretica p īn populatia P, este de forma:
* unde Za este valoarea ecartului tip corespunzatoare probabilitatii a , iar q = 1 - p.
Notes
Slide Show
[Pause/Play Narration]
[Previous Slide]
[Next Slide]
Outline
[Expand/Collapse Outline]
1ESTIMAREA PARAMETRILOR STATISTICI
2Probabilitati
* = sansa ca un eveniment sa aiba loc considerānd toate rezultatele posibile
* Valoarea predictiva a probabilitatii:
o Reflecta ce "ar trebui" sa se īntāmple si nu ce o sa se īntāmple efectiv
o Pentru un pacient supus unei operatii cu o rata de succes de 75% rezultatul nu poate fi 75% succes
* Probabilitatea poate fi privita ca o masura a capacitatii esantionului analizat de a estima caracteristica unei populatii
3Exemplu: distributia greutatii
* Media = 69, s = 3
o p=0,68
* Mai mare de 78 (198)
o P=0,0013
4Principii generale
* In studiul īntr-o populatie P a parametrilor a unei caracteristici oarecare (cantitative sau calitative) adesea este necesar sa se urmeze procedeul:
o Se extrage un esantion reprezentativ al acestei populatii.
o Prin mijloacele statisticii descriptive se descrie distributia caracteristicii pe esantionul extras la etapa 1, fiindca talia acestuia permite o investigare exhaustiva a sa. Astfel se poate determina frecventa observata, daca este vorba de o caracteristica calitativa, sau se calculeaza media si variatia, īn cazul unei caracteristici cantitative.
o Prin mijloacele statisticii inferentiale sau inductive se extind la īntreaga populatie rezultatele observate pe esantion. Adica, pornind de la parametrii observati (frecventa, media, variatia, etc) pe esantion se īncearca sa se estimeze parametrii "teoretici" ai īntregii populatii.
5Principii generale-(desen, cele de la pct.4)
6Principii generale
* Cazul unei variabile X calitative
* Frecventa teoretica p a variabilei X īn populatia P este necunoscuta.
* Din populatia P se extrage la īntāmplare esantionul E reprezentativ.
* In esantionul E pentru variabila X se observa o frecventa f.
* Se īncearca sa se estimeze valoarea necunoscuta a lui p cu ajutorul lui f observat.
7Principii generale
* Cazul unei variabile X cantitative
o Media teoretica m a variabilei X ca si variatia sa teoretica s2 īn populatia P sunt necunoscute.
+ Din populatia P se extrage la īntāmplare esantionul E reprezentativ.
+ In esantionul E pentru variabila X se observa o medie m si o variatie s2.
+ Se īncearca sa se estimeze valorile necunoscute ale lui m si s2 cu ajutorul lui m si s2 observate.
8Principii generale(desen-cele de la pct.7)
9ESTIMAREA PUNCTUALĂ
* Definitia unui estimator
o Estimatorul unui parametru este o functie depinzānd de observatiile efectuate pe un esantion extras la īntāmplare care furnizeaza o valoare aleatoare numita estimarea punctuala a parametrului.
+ Daca esantionul E are valorile x1,...,xn pentru caracteristica studiata, estimatorul mediei aritmetice m a unei populatii P este m = (x1+x2+...+xn)/n
10ESTIMAREA PUNCTUALĂ
* Calitatile unui estimator
o Calitatile unui estimator:
o corectitudinea estimarii obtinute,
o precizia acesteia.
o Cele doua notiuni sunt distincte cum va rezulta si din prezentarea care urmeaza.
11Principii generale
12ESTIMAREA PUNCTUALĂ
* Estimator fara bias
o Fie T estimarea punctuala a unui parametru teoretic q al unei populatii.
o T este o variabila aleatoare valorile ei variīnd īntāmplator odata cu esantionul pe baza caruia se calculeaza.
o Estimatorul T se spune ca este fara bias daca speranta matematica a lui T este egala cu valoarea adevarata (teoretica) a parametrului estimat adica M(T) = q.
o Se spune īn acest caz ca estimarea data de T este corecta.
13ESTIMAREA PUNCTUALĂ
* Proprietati ale estimatorilor medie si frecventa:
+ P1. Speranta matematica a mediilor observate, m, pe esantioane extrase aleator este egala cu media teoretica m a populatiei din care sau extras esantioanele, medie considerata pentru valorile unei variabile cantitative luata īn studiu: M(m) = m.
+ P2. Speranta matematica a frecventelor observate, f, pe esantioane extrase aleator este egala cu frecventa teoretica p a populatiei din care sau extras esantioanele, frecventa considerata pentru valorile unei variabile calitative luata īn studiu: M(f) = p
+ Din P1 si P2 rezulta ca m si f sunt estimatori fara bias si ca estimarile realizate cu ajutorul lor sunt corecte.
14ESTIMAREA PUNCTUALĂ
* P3. Speranta matematica a variatiilor descriptive observate s2 pe esantioane de talie n, extrase aleator este diferita de variatia teoretica s2 a populatiei din care sau extras esantioanele, variatie considerata pentru valorile unei variabile cantitative luata īn studiu:
* P4. Variatia punctuala de esantionare este un estimator fara bias pentru s2:
15Concluzie
* Media, frecventa si variatia de esantionare observate pe esantioane corect extrase (reprezentative) dintr-o populatie P sunt estimatori fara bias ale mediei, frecventei si respectiv variatiei teoretice ale populatiei P
16ESTIMAREA CU INTERVALE DE INCREDERE
* Se spune despre un estimator ca este cu atāt mai eficace cu cāt variatia sa este mai mica, sau ca precizia sa depinde marimea variatiei sale.
* Estimarea punctuala a unui parametru teoretic furnizeaza o valoare pentru parametrul teoretic estimat.
* Valoarea sa este tributara fluctuatiilor de esantionare si poate fi la o mare distanta de valoarea reala a parametrului estimat.
* Este recomandabil sa se estimeze un parametru teoretic nu printr-o singura valoare ci printr-un interval, numit interval de īncredere, īn care sa se poata afirma ca parametrul estimat se gaseste cu o probabilitate ridicata.
17ESTIMAREA CU AJUTORUL INTERVALULUI DE INCREDERE
* Intervalul de īncredere este un interval marginit de valori (limitele poarta numele de limite de īncredere) care include media caracteristicii studiate.
* Cu cāt intervalul este mai larg cu atāt suntem mai siguri ca media caracteristicii studiate se va regasi īn acel interval.
* Marimea īncrederii, confidenta, este data de probabilitatea ca valoarea (valorile) studiate sa se gaseasca īn acel interval.
18ESTIMAREA UNEI MEDII
* Fie P o populatie īn care variabila X are o media teoretica m necunoscuta. Din populatia P se extrage la īntāmplare esantionul E reprezentativ. In esantionul E pentru variabila X se observa o medie m si se calculeaza o variatie punctuala estimata
* Se īncearca sa se determine pentru valoarea necunoscuta a mediei teoretice m un interval de īncredere cu pragul a, (cu ajutorul lui m si S2 observate), adica sa se determine un interval [a,b] īn care probabilitatea ca media teoretica m sa se afle este 1-a:
* Pr(a£ m £b) = 1 - a.
19ESTIMAREA UNEI MEDII: ESANTIOANE MARI
* N>=30
* media de esantionare m este o variabila aleatoare normala
* Atunci variabila aleatoare centrata redusa este o variabila aleatoare N(0,1).
* Pentru un prag de semnificatie a se determina (de exemplu, din tabela ecartului redus) valoarea Za pentru care probabilitatea ca variabila aleatoare Z sa fie īn intervalul [-Za,Za] este 1-a, adica:
* Pr(-Za £ Z £ Za) = 1 - a.
20ESTIMAREA UNEI MEDII: ESANTIOANE MARI
* Deci cu o probabilitate 1-a se poate afirma ca are loc:
* de unde rezulta :
21ESTIMAREA UNEI MEDII: ESANTIOANE MARI
* Prin urmare, intervalul de īncredere pentru media m cu pragul de semnificatie a este
* Atunci cānd s nu se cunoaste, el poate fi estimat corect prin si īn acest caz intervalul de īncredere cu pragul de semnificatie a pentru media m este
22ESTIMAREA UNEI MEDII: ESANTIOANE MARI
* Cel mai frecvent se utilizeaza un prag de semnificatie a = 0.05. Atunci Za=1.96 si deci intervalul de īncredere cel mai utilizat īn cazul esantioanelor mari este
23Exemplu
* Īntr-o populatie cunoastem media greutatii la nastere a noilor nascuti: 3400g si abaterea standard: 142
* Pe un esantion aleator de 10 nou nascuti:
o media=3275g, abaterea standard=854
o Esantionul este sau nu caracteristic pentru populatie?
* Esantionarea aleatoare implica "dreptul" fiecarui membru al populatiei de a fi ales dar nu garanteaza reprezentativitatea proportionala a tuturor partilor unei populatii
* Alt esantion ą alta medie, alta abatere
24Exemplu
* A - distributia de esantionare a mediei pentru n=10
* B - distributia de esantionare a mediei pentru n=50
* Pe masura ce creste n eroarea de esantionare scade si esantioanele devin mai reprezentative, media lor este mai apropiata de cea a populatiei
25Exemplu (continuare)
* Deviatia standard a distributiei de esantionare este un indicator al erorii de esantionare
26Deviatia standard a distributiei de esantionare
* Īn practica este imposibil sa construim distributia de esantionare ą estimarea deviatiei standard a mediei pe baza deviatiei standard si a dimensiunii esantionului:
27Exemplu (continuare)
* A = media=115, abaterea standard=30
o Sx=9,5
* B = media=115, abaterea standard=30
o Sx=4,2
* Pe masura ce creste n scade eroarea standard a mediei
* Aproximarea distributiei populatiei
28ESTIMAREA UNEI MEDII: ESANTIOANE MICI
* se poate determina intervalul de īncredere al mediei m doar daca variabila studiata X este o variabila aleatoare normala.
* Daca se cunoaste variatia:
* Nu se cunosate variatia si n<30
29ESTIMAREA UNEI FRECVENTE
* Esantioane mari np, nq>=10
* F este frecventa observata
30Eroarea de esantionare a mediei
* = diferenta dintre media valorilor esantionului si media caracteristici populatiei din care a fost extras esantionul
* Cresterea erorii de esantionare =>
o Scaderea acuratetii mediei esantionului de a estima caracteristica unei populatii
* Scaderea erorii de esantionare =>
o Cresterea acuratetii mediei esantionului de a estima caracteristica unei populatii
31Exemplu
* Studiul Fitzgerald al mobilitatii prin extensie a coloanei lombare la indivizi de vārste cuprinse īntre 30 si 39 de ani
* n=42, media=40° si s=8,8 °
* Media populatiei poate fi estimata la 40 °
o Care este acuratetea acestei estimari?
o Cum estimam intervalul de īncredere?
32Intervale de īncredere
* = este un interval marginit de valori (limitele poarta numele de limite de īncredere) care include media caracteristicii studiate
* Cu cāt intervalul este mai larg cu atāt suntem mai siguri ca media caracteristicii studiate se va regasi īn acel interval
o Marimea īncrederii ą probabilitate
* Īncrederea (confidenta) 95%
33Exemplu (continuare)
* n=42, media=40°, s=8,8° ą Sx=1,36
* 95,45% din distributie este cuprinsa īntre ±2Sx sau ±2Z
34Exemplu (continuare)
* Estimarea zonei de 95%
* Este marginita de un scor Z de ± 1,96
* Interval de īncredere de 95%
35Intervale de īncredere
* Formula de determinare a limitelor intervalului de īncredere:
36Exemplu (continuare)
* 95% II = 40,0± (1,96)(1,36)
* 95% II = 40,0±2,67
* 95% II = 37,33 pāna la 42,67
37Exemplu 99%
* Z = ± 2,576
* 99% II = 40,0± (2,576)(1,36)
* 99% II = 40,0±3,50
* 99% II = 36,5 pāna la 43,5
38Intervale de īncredere cu esantioane mici
* n<30
* Cu cāt esantioanele sunt mai mici cu atāt distributia de esantionare este mai dispersata fata de distributia normala
* Se foloseste o alta distributie: distributia t sau Student
* Diferenta majora dintre distributia t si cea normala consta īn faptul ca prima īsi schimba forma odata cu schimbarea dimensiunii esantionului
39Calculul intervalului de īncredere
* df = n+1
* df = grade de libertate
40Grade de libertate
* df
* Directiile disponibile pentru miscare īntr-un spatiu dat
* Numarul de componente care pot varia īntr-un set de date
* n-1
41Grade de libertate - Exemplu
* 5 masuratori, avem o suma de 30 si o medie de 6
* Dupa ce face primele 4: 8,9,10,11 a cincea poate fi calculata si setul de date are numai 4 grade de libertate
42Calculul intervalului de īncredere
* n=6 ą df = 5
o II95% ą t= ±2,571
* n=10 ą df = 9
o II95% ą t= ±2,262
* n=30
o II95% ą t= ±2,042
* Cresterea lui n determina ca valoarea lui t sa se apropie de 1,96 ą curba tinde spre distributia normala
43Aplicatii ale intervalelor de īncredere
* Studiul Fitzgerald a stabilit cu o precizie de 95% intervalul de īncredere pentru extensia lombara la diferite grupe de vārsta
44Aplicatii ale intervalelor de īncredere
* Interpretare:
o 1. Intervalul de īncredere al extensiei lombare scade cu vārsta
o 2. Variabilitatea este mai scazuta la tineri
o 3. Intervalele de īncredere se īntrepatrund
Notes
Slide Show
[Pause/Play Narration]
[Previous Slide]
[Next Slide]
Outline
[Expand/Collapse Outline]
1REGRESII
* LEGATURA INTRE MAI MULTE VARIABILE CANTITATIVE
2Statistici descriptive īn doua dimensiuni
* Varsta X: X1, X2,..., Xn
* TAS Y: Y1, Y2,..., Yn.
* Sa se stabileasca daca exista o legatura īntre variabilele X si Y si sa se determine o modalitate de a masura intensitatea acestei legaturi.
o Coeficientul de corelatie
3Statistici descriptive īn doua dimensiuni
* Sa se stabileasca daca Y depinde de X si daca da īn ce forma se realizeaza aceasta dependenta.
o Functia de regresie
4DIAGRAMA DE DISPERSIE
* Diagrama de dispersie asociata unei tabel de date bidimensional:
o X: X1, X2,..., Xn
o Y: Y1, Y2,..., Yn
* se obtine reprezentānd grafic punctele de coordonate (Xi,Yi) i=1,2,...,n.
5Diagrama de dispersie
* Orientarea si dispersia norului de puncte poate da o prima idee despre relatia īntre cele doua variabile aflate īn studiu.
* In acest sens, o idee ceva mai precisa privind relatia īntre cele doua caracteristici se obtine īmpartind diagrama de dispersie īn patru cadrane prin doua drepte perpendiculare care trec prin punctul (Xmediu,Ymediu), avānd coordonatele egale cu mediile celor doua variabile.
6Diagrama de dispersie
7Diagrama de dispersie
8Diagrama de dispersie
9Indici de corelatie - Suma produselor ecart
Pentru a descrie "intensitatea" relatiei dintre cele doua variabile X si Y se utilizeaza observatia ca daca punctul (Xi,Yi) se afla īn cadranele I sau III ale diagramei de dispersie atunci produsul este pozitiv iar atunci cānd este situat īn cadranele II si IV este negativ. Astfel ca o masura a intensitatii relatiei dintre variabilele X si Y este data de suma:
SPE va fi cu atāt mai mare īn valoare absoluta cu cāt norul de puncte este mai apropiat de o alura generala crescatoare (SPE > 0 ) sau descrescatoare (SPE < 0). Un dezavantaj evident al SPE este faptul ca acest coeficient depinde de numarul de puncte din seria statistica si de unitatile de masura ale variabilelor
10Indici de corelatie -Covarianta COV(X,Y) Pentru a obtine o marime independenta fata de volumul seriei statistice se utilizeaza covarianta seriilor X si Y, calculata prin:
11Coeficientul de corelatie Pearson
Pentru a obtine un indicator independent si de unitatile de masura ale celor doua variabile se utilizeaza coeficientul de corelatie sau coeficientul Bravais-Pearson unde SX si SY reprezinta abaterile standard pentru seriile X si respectiv Y:
Unde s este variatia
12Interpretarea coeficientului de corelatie
* Coeficientul de corelatie masoara intensitatea relatiei dintre variabilele X si Y si valoarea sa r este totodata cuprinsa īntre -1 si 1.
* Daca r=1 punctele sunt situate pe o dreapta de panta pozitiva (crescatoare).
* Daca 0 < r < 1, norul de puncte poate fi īnlocuit (ajustat) printr-o dreapta de panta pozitiva .
* Dispersia punctelor īn jurul dreptei de regresie va fi cu atāt mai mare cu cāt r se apropie de 0 si cu atāt mai mica cu cāt r se apropie de 1.
* Daca -1 < r < 0 atunci norul de puncte poate fi aproximat cu o dreapta de panta negativa. Dispersia punctelor fata de dreapta va fi cu atāt mai mica cu cāt r este mai apropiat de -1.
* Daca r=-1 atunci toate punctele sunt situate pe o dreapta de panta negativa.
13Alura norului de puncte
* Cānd r este pozitiv relatia īntre variabilele X si Y este "pozitiva", adica o crestere a lui X determina īn general o crestere a lui X.
* Cānd r < 0 relatia īntre cele doua variabile este "negativa" adica o crestere a lui X are īn general ca si consecinta o diminuare a lui Y.
14Regulile empirice
* un coeficient de corelatie de la -0.25 la 0,25 īnseamna o corelatie slaba sau nula,
* un coeficient de corelatie de la 0.25 la 0.50 (sau de la -0.25 la -0.50) īnseamna un grad de asociere acceptabil
* un coeficient de corelatie de la 0.5 la 0.75 (sau de la -0.5 la -0.75) īnseamna o corelatie moderata spre buna
* un coeficient de corelatie mai mare decāt 0.75 (sau mai mic decāt -0.75) īnseamna o foarte buna asociere sau corelatie
15Testul de semnificatie pentru coeficientul de corelatie Pearson
* Semnificatia coeficientului de corelatie Pearson poate fi evaluata daca valoarea observata a aparut datorita īntāmplarii (daca este semnificativ diferita de zero). Valorile critice ale lui r pot fi regasite īn Anexa 6 pentru n-2 grade de libertate īn cazul aplicarii testului unilateral sau bilateral.
* De exemplu obtinerea unei valori mai mici a lui r decāt cea corespunzatoare din tabelul din anexa 6 denota ca valoarea este mai mica decāt valoarea critica obtinuta din tabel si ipoteza nula nu poate fi rejectata. Interpretarea este ca datele experimentale nu ne permit enuntarea existentei unei relatii īntre variabilele luate īn calcul
16Corelarea rangurilor: coeficientul de corelatie Spearman
* Coeficientul de corelatie Spearman, notat rs, este analogul nonparametric al coeficientul de corelatie Pearson, calculat pentru a fi utilizat cu date ordinale.
* Unde n este numarul de perechi de variabile
17Testul de semnificatie pentru coeficientul de corelatie Spearman
* Semnificatia coeficientului de corelatie Spearman poate fi evaluata daca valoarea observata a aparut datorita īntāmplarii (daca este semnificativ diferita de zero). Valorile critice ale lui r pot fi regasite īn Anexa 7 pentru n grade de libertate īn cazul aplicarii testului unilateral sau bilateral.
* Valorile obtinute pentru rs trebuie sa fie mai mari sau egale decāt valorile critice din tabel pentru ca sa fie semnificative
18Coeficientul de determinare
* este patratul coeficientului de corelatie r, adica d = r*r.
* Prin definitie, coeficientul de determinare reprezinta partea din variatia totala a lui Y explicata prin relatia liniara existenta īntre X si Y.
* In caz extrem, daca toate punctele se afla pe o dreapta care nu e paralela cu axa Ox (adica nu are panta nula), orice variatie a lui Y este exprimata prin relatia liniara si coeficientul de determinare este 1. Din contra, daca X si Y sunt independente, adica īntre cele doua variabile nu exista o relatie liniara, coeficientul de determinare va fi zero.
* Acest coeficient, īn procente (adica īnmultit cu 100) exprima procentajul īn care variatia lui Y este data prin relatia liniara īntre cele doua variabile.
NotesSlide Show [Pause/Play Narration]
[Previous Slide][Next Slide]Outline[Expand/Collapse Outline]
1Teste statistice* Tudor Drugan* 2007-2008
2Notiuni
* Testarea ipotezelor statistice
o Ipoteza nula
o Concepte
* Erori īn testarea ipotezelor statistice
* Regiunea critica, directional-nondirectional, grade de libertate, o coada-doua cozi
* Teste parametrice-nonparametrice
3Testarea ipotezelor statistice
* Formularea de noi ipoteze (sau model sau teorie) este una dintre cele mai importante aspecte ale cercetarii stiintifice.
* Aceste ipoteze experimentale īncerca sa descrie sau sa explice anumite fenomene reale.
* In multe cazuri exista ipoteze anterioare (descrieri sau explicatii) pe care oamenii de stiinta doresc sa le īnlocuiasca cu altele noi.
* Este īnsa insuficient sa se formuleze sau sa fie prezentata numai o noua ipoteza.
* O ipoteza noua trebuie testata pentru a vedea ca are temei (īn concordanta cu observatiile) si pentru a justifica ca este "mai buna" decāt alte ipoteze alternative.
* Aceasta conduce la scheme de experimente, esantioane si de observatii īn scopul obtinerii dovezii pentru sustinerea (sau respingerea) unei noi ipoteze.
4Metode pentru testarea ipotezelor
* Compararea a doua ipoteze sau teorii concurente
* Aceste doua teorii trebuie prima data formulate ca modele.
* Aceste doua modele īn continuare vor fi denumite prin ipoteza nula si ipoteza alternativa.
o Ipoteza nula H0, reprezinta modelul pe care experimentatorul ar dori sa-l īnlocuiasca.
o Ipoteza alternativa H1 este noul model care de regula reprezinta o negatie a ipotezei nule.
5Metode pentru testarea ipotezelor
poteza alternativa H1 este noul model care de regula reprezinta o negatie a ipotezei nule.
* Indiferent cum este formulat protocolul experimentului scopul cercetatorului este de a testa ipoteza nula (de cele mai multe ori pentru a o rejecta)
* Ca īn justitie: inculpatul este inocent pāna se dovedeste vinovat
* Ipoteza nula nu trebuie probata ci anulata
* Inferenta negativa
6Metode pentru testarea ipotezelor
* Inferenta negativa
* Scopul testului statistic este de a dovedi ca ipoteza nula H0 este falsa
o ą nu putem niciodata afirma acceptam ipoteza nula
o O putem nega sau nu o putem nega
* Ca la un proces, rezultatul este vinovat sau nevinovat si nu inocent
o Nevinovat = nu suficient de vinovat pentru a fi acuzat
7Metode pentru testarea ipotezelor
* Prin respingerea ipotezei nule cercetatorul afirma ca rezultatele observate nu sunt datorate īntāmplarii
* = efect semnificativ
* Cānd ipoteza nula nu este rejectata cercetatorul afirma ca diferentele observate sunt datorate īntāmplarii si rezultatele nu sunt semnificativ
8Pasii unui test statistic (1)
* Formularea problemei īn termenii ipotezelor statistice.
* Pentru aceasta se stabilesc: ipoteza nula H0 si respectiv ipoteza alternativa H1, reprezentānd o negare a ipotezei nule.
* Ipoteza nula H0, este ipoteza care trebuie testata, testul efectuāndu-se sub prezumtia ca ipoteza nula ar fi adevarata.
* Ipoteza alternativa H1, este acea ipoteza care īntr-un sens sau altul contrazice ipoteza nula. Aceasta ipoteza se mai numeste si ipoteza de lucru.
9Pasii unui test statistic (1)
* Ipoteza alternativa
* Media valorilor īn populatia A este diferita de media valorilor īn populatia B
10Pasii unui test statistic (1)
* Ipoteze directionale
11Pasii unui test statistic (2)
* Alegerea si calcularea parametrului statistic al testului.
* Parametrul statistic al testului exprima īntr-o anumita forma, diferenta dintre elementele comparate, dintre care cel putin unul intervine sub forma unei statistici a unui esantion. Ţinānd seama de faptul ca esantionul sau esantioanele utilizate sunt aleator extrase din populatiile care fac obiectul testului, parametrul statistic este o variabila aleatoare de selectie, care urmeaza o anumita lege de probabilitate. Un parametru statistic al testului bun trebuie sa īndeplineasca doua conditii:
o a. Trebuie sa se comporte diferit atunci cānd ipoteza nula H0 este adevarata fata de situatia īn care ipoteza alternativa H1 este adevarata.
o b. Distributia de probabilitate a parametrului statistic al testului sub prezumtia ca H0 este adevarata, este cunoscuta.
12Pasii unui test statistic (3)
* Alegerea regiunii critice.
* Trebuie sa fim capabili sa decidem īn functie de valoarea parametrului statistic calculat care dintre ipoteze, cea nula sau cea alternativa, este adevarata.
* Daca valoarea parametrului statistic apartine regiunii critice, ipoteza nula H0 va fi respinsa si va fi acceptata ipoteza alternativa H1.
* Daca valoarea parametrului statistic nu apartine regiunii critice, ipoteza nula H0 va fi acceptata.
13Pasii unui test statistic (4)
* Alegerea dimensiunii regiunii critice.
* Pentru aceasta trebuie sa specificam marimea riscului de eroare pe care īl acceptam.
* Pe scurt, definim nivelul de semnificatie, notat cu a, sau marimea riscului pe care suntem dispusi sa ni-l asumam īn respingerea ipotezei nule H0 īn cazul īn care aceasta este adevarata.
* De obicei se alege un nivel de semnificatie īntre 1% si 5%.
14Pasii unui test statistic (5)
* Concluzia testului.
* Ipoteza nula H0 este respinsa daca valoarea parametrului statistic apartine regiunii critice. Regiunea critica trebuie astfel aleasa īncāt daca ipoteza alternativa H1 este adevarata, probabilitatea de respingere a ipotezei nule H0 este mai mare decāt īn cazul īn care ipoteza nula H0 ar fi adevarata.
* Īn realitate, probabilitatea unei respingeri adevarate a ipotezei nule H0 trebuie sa fie mai mare decāt probabilitatea unei respingeri false.
15Pasii unui test statistic (5)
* Depinzānd de ipoteza alternativa, se poate alege una din urmatoarele trei regiuni critice:
o Regiunea critica unilaterala la dreapta - valoarea parametrului statistic al testului este mai mare sau egala cu valoarea din dreapta a intervalului critic;
o Regiunea critica unilaterala la stānga - valoarea parametrului statistic al testului este mai mica sau egala cu valoarea din stānga a intervalului critic;
o Regiunea critica bilaterala - valoarea parametrului statistic al testului este mai mica sau egala cu valoarea extrema din stānga regiunii critice sau mai mare sau egala cu valoarea extrema din dreapta regiunii critice, valorile extreme ale regiunii critice avānd nivele egale de semnificatie.
16Decizia
* Stabilirea semnificatiei testului pe baza valorii lui p se face frecvent cu urmatoarea regula empirica:
o 1. Daca 0,01 <= p<0,05 , rezultatele sunt considerate semnificative.
o 2. Daca 0,001 <= p<0,01, rezultatele sunt considerate īnalt semnificative.
o 3. Daca p<0,001, rezultatele sunt considerate foarte īnalt semnificative.
o 4. Daca p>=0,05, rezultatele sunt considerate nesemnificative statistic.
o 5. Daca 0,05 <= p<0,1, se noteaza o oarecare tendinta spre considerarea unei semnificatii statistice.
* Valoarea p nu este probabilitatea ca ipoteza nula sa fie falsa. O valoare mica a lui p nu īnseamna ca exista o probabilitate mica ca ipoteza nula sa fie adevarata.
* Ipoteza de lucru nu poate fi inversata si de exemplu pentru un p = 0,02 nu se poate spune ca avem o probabilitate de 98% ca diferenta sa existe.
* Valoare lui p nu este un indicator al validitatii ipotezei statistice. P se utilizeaza doar pentru a face decizia semnificativa sau nu.
17Erori īn testarea ipotezelor statistice
18Eroarea de tip I
* = H0 este respinsa desi este adevarata
* Am concluzionat ca exista reale diferente desi acestea sunt datorate sansei
* Concluzionam ca un tratament este eficient pe baza unei interpretari gresite
19Eroarea de tip II
* = H0 este nu este respinsa desi este falsa
* Am concluzionat ca exista diferentele observate sunt datorate sansei atunci cānd acestea apar datorita diferentelor dintre esantioane
* Am putea abandona un tratament pe care tocmai īl testam sau o directie de cercetare
20Eroarea de tip I si nivelul de semnificatie
* Probabilitatea comiterii unei erori de tip I = nivelul de semnificatie, α (alfa)
* Probabilitatea este de determinata prin teste statistice
* Nivelul alfa (riscul maxim acceptabil) 5% ą exista o sansa de 5% de a respinge incorect ipoteza nula
* p= 0,18 ipoteza nula nu se poate respinge
* p= 0,04 ipoteza nula se poate respinge cu un risc acceptabil de 4% de a comite o eroare de tipul I
21Eroarea de tip II
* = H0 este nu este respinsa desi este falsa
* Am concluzionat ca diferentele observate sunt datorate sansei atunci cānd acestea apar datorita diferentelor obiective dintre esantioane
* Probabilitatea de a nu rejecta o ipoteza nula falsa = β, probabilitatea de a face o eroare de tipul II
* 1- β = complementul lui β, puterea unui test
* Puterea = probabilitatea ca un test sa respinga ipoteza nula sau sa obtina semnificatie statistica
22Ce determina puterea unui test
* Criteriul de semnificatie
* Varianta
* Dimensiunea esantionului
* Dimensiunea efectului
23Regiunea critica
* = regiunea de respingere, aria marginita de Z=±1,96
24Regiunea critica - exemplu
* Media esantionului=105
* s=16
* n=30
* Sx=2,9
* Z=1.72
* Testul nu este semnificativ si nu se poate respinge ipoteza nula
25Test non-directional (cu doua cozi)
* Nu s-a evaluat directia diferentei dintre cele doua medii
* Un test cu un nivel de semnificatie α are o probabilitate de α/2 pentru fiecare coada
26Test directional (cu o coada)
* Nu mai īncercam localizarea regiunii critice īn ambele cozi
* Media esantionului=105
* s=16
* n=30
* Sx=2,9
* Z=1,645
* Testul este semnificativ se respinge ipoteza nula
27Statistici parametrice si non-parametrice
* Statisticile utilizate pentru a estima parametrii unei populatii sunt statistici parametrice
o Sunt bazate pe extragerea randomizata de esantioane dintr-o populatie normal distribuita
o Esantioanele reprezinta parametrii populatiei
* Daca nu se respecta aceste conditii sunt necesare altfel de teste statistice: teste nonparametrice:
o Nu fac supozitii asupra populatiei
o Pot fi folosite atunci cānd criteriile de normalitate si omogenitate nu sunt īndeplinite
1
* Conf.Dr. Tudor Drugan* 2007-2008
* Cea mai simpla comparatie statistica este cea īntre doua grupuri aleator alese
* Acest mod de distribuire permite cercetatorului sa presupuna ca diferentele individuale sunt egal distribuite īntre grupuri la īnceputul experimentului si ca cele doua grupuri sunt echivalente
* D.p.d.v statistic cele doua grupuri sunt esantioane extrase din aceiasi populatie deci diferentele dintre ele sunt rezultatul erorii de esantionare sau al īntāmplarii
3"Dupa aplicarea unui tratament cercetatorul..."
* Dupa aplicarea unui tratament cercetatorul verifica daca cele doua esantioane mai fac sau nu parte din aceiasi populatie
* Pentru aceasta se aplica un test statistic
4"Compararea mediilor esantioanelor pentru determinarea..."
* Compararea mediilor esantioanelor pentru determinarea statistica a diferentelor se face prin doua caracteristici:
o Media - diferenta mediilor īntre grupuri caracterizeaza nivelul de separare īntre grupuri
o Varianta - caracterizeaza variabilitatea īn interiorul grupurilor
* Ambele caracteristici sunt o sursa de variabilitate utilizabila pentru a descrie efectele tratamentului
5"Se considera doua esantioane aleator..."
* Se considera doua esantioane aleator extrase, unul experimental si unul de control
* Daca tratamentul a fost eficient tot grupul supus experimentului va atinge acelasi nivel al parametrului studiat
* Exista diferente īntre grupuri
* Nu exista diferente īn interiorul grupurilor
6"Situatia reala"
* Situatia reala
o Exista diferente īntre grupuri
o Exista diferente īn interiorul grupurilor
* Trebuie demonstrat daca diferentele observate īntre mediile parametrului studiat sunt datorate experimentului si nu īntāmplarii
8"W.S"
* W.S. Gossett, 1908 - Student
* Testul t
* Subtipuri:
o Testul t pentru esantioane independente:
+ Variante egale
# O coada
# Doua cozi
+ Variante inegale
o Testul t pentru esantioane perechi
9"Utilizat pentru compararea a doua..."
* Utilizat pentru compararea a doua esantioane independente
* Esantioanele sunt considerate independente deoarece sunt compuse din seturi independente de subiecti īntre care nu exista nici o relatie derivata din studiu
10"Testul t pentru esantioane independente..."
* Testul t pentru esantioane independente se bazeaza pe aceasta prezumtie
* Se mai numeste si omogenitatea variantelor
* Īn mod normal omogenitatea variantelor se testeaza statistic
o Testul Levene sau testul Barlett
o Bazate pe statistica F
* Daca variantele nu sunt semnificativ statistic diferite (p>0,05) atunci pot fi considerate egale
* Daca sunt diferite se aplica alta formula de calcul a lui t
11"Numaratorul - diferenta mediilor esantioanelor"
* Numaratorul - diferenta mediilor esantioanelor
* Numitorul - eroarea standard a diferentei dintre medii, o masura a variabilitatii īn interiorul esantioanelor
* Estimarea SX1+X2 se face prin variabila Sp, (varianta comuna) care utilizeaza variantele si dimensiunile esantioanelor
12"Eroarea standard a diferentei mediilor..."
* Eroarea standard a diferentei mediilor esantioanelor este:
13"Testam ipoteza ca un nou..."
* Testam ipoteza ca un nou model de atela īmbunatateste functia de prindere a māinii la pacientii cu artrita reumatoida
* Ne intereseaza doar testarea ipotezei directionale, deoarece dorim obtinerea unei ameliorari:
o H1=μ1 > μ2
* Avem un esantion aleator selectat de 20 de pacienti cu artrita reumatoida avānd niveluri similare de diformitate la nivelul māinii si la nivelul articulatiilor māinii
14"Aleator pacientii sunt īmpartiti īn..."
* Aleator pacientii sunt īmpartiti īn doua grupuri:
o n1 - 10 persoane sunt grupul pentru experiment
o n2 - 10 persoane sunt grupul de control
* La cei din grupul experimental se monteaza atela
* Toti pacientii au un program motor similar timp de o saptamāna
* Se masoara puterea de strāngere cu māna īn zilele 1 si 8 ale testului iar diferenta este cea care se foloseste īn continuare la calcule
15
16
17
19Testul T
* Pentru ca valoarea calculata a lui t sa implice o diferenta semnificativa, ea trebuie sa fie mai mare sau egala cu valoarea critica
* Daca testul este unidirectional atunci si semnul lui t trebuie sa fie corespunzator
* Deoarece t=2,718 si este mai mare decāt valoarea critica pentru α =0,05 - 1,734 si este pozitiv atunci media valorilor diferentei fortei māinii a celor din grupul experimental este mai mare decāt la cei din grupul de control
* Putem rejecta H0
* Tratamentul are un rol pozitiv
* Literatura de specialitate arata ca atunci cīnd esantioanele comparate au un numar egal de cazuri violarea regulii egalitatii variantelor nu duce la compromiterea testului Student
* Daca numarul de cazuri difera īntre esantioane atunci statistica t trebuie calculata conform formulei, iar gradele de libertate se ajusteaza īn functie de varianta:
* Daca esantioanele mai mari au si varianta mai mare testul t devine mai putin puternic
o Se obtin mai putine diferente semnificative statistic
* daca esantionul mai mic are varianta mai mare (de peste 2 ori) creste sansa unei erori de tipul I
23
24
* Se foloseste īn protocoale de cercetare care implica masuratori repetate asupra acelorasi indivizi sau asupra unor indivizi cu caracteristici asemanatoare (chiar gemeni)
* Datele sunt considerate īmperecheate deoarece pentru fiecare valoare exista o valoare pereche
* Testul evalueaza scorul de diferenta din cadrul fiecarei perechi astfel īncāt subiectii sunt comparati numai cu ei īnsisi sau cu perechea lor
* D este diferenta dintre scoruri
* Se testeaza utilizarea unei perne de suport lombar pentru īmbunatatirea unghiului de repaus al pelvisului
* Analiza frecventelor pentru variabile masurabile pe o scara nominala sau ordinala
* Test neparametric care verifica daca distributia observata difera de cea asteptata (teoretica)
29
* Īn aplicare testului Chi-patrat īntotdeauna:
o Frecventele sunt date de numarul de cazuri si nu reprezinta procente sau ranguri
o Categoriile sunt exhaustive si mutual exclusive: orice subiect poate apartine unei categorii dar numai uneia
* O - frecventa observata si E - frecventa asteptata
30* Aruncam o moneda de 100 de ori si obtinem de 47 de ori stema desi teoretic ar fi trebuit sa obtinem stema de 50 de ori
* Nu putem rejecta ipoteza nula, aruncarea cu banul a fost corecta
1Teste statistice III * Tudor Drugan* 2007-2008
2
3Obiectivul testului
* Obiectivul testului este de a compara media unei variabile cantitative continue pe un esantion reprezentativ extras dintr-o populatie cu media µ cu o medie cunoscuta µ0 a unei populatii standard. Se presupune ca cele doua populatii au aceiasi variatie s2 care se cunoaste.
4"Conditii de aplicare"
* Conditii de aplicare
o Este necesar sa cunoastem variatia populatiei (daca nu o cunoastem, aplicam testul Student pentru compararea mediei unui esantion cu media unei populatii).
o Testul este corect aplicat daca populatia este normal distribuita. Daca populatia nu este normal distribuita sau talia esantionului este mica (<30) testul da o valoare orientativa.
o Testul este, de asemenea, corect aplicat atunci cānd talia esantionului este mare ( ≥ 30).
5"Ipotezele testului"
* Ipotezele testului
o 1. Test bilateral: H0: m = m0 versus H1: m m0
o 2. Test unilateral: H0: m = m0 versus H1: m > m0
* unde m = media popolatiei din care este extras esantionul si m0 = media populatiei standard.
* Intr-o alta forma ipotezele testului se pot formula īn modul urmator:
o Ipoteza nula: nu exista diferenta semnificativa īntre media esantionului si media populatiei.
o Ipoteza alternativa pentru testul bilateral: exista diferenta semnificativa īntre media esantionului si media populatiei.
o Ipoteza nula pentru testul unilateral: media esantionului este semnificativ mai mare decāt media populatiei.
6Pragul de semnificatie a
7Regiunea critica pentru testul unilateral este [1.645,
8"O arie actuala de interes..."
* O arie actuala de interes este studierea agregarii familiale a bolilor cardiovasculare (prevalenta bolii printre membrii unei familii este mai mare decāt īn rāndul populatiei generale), prin studiul legaturii dintre nivelul lipidic sanguin si aceste boli.
* Se stie ca nivelul mediu al colesterolului sanguin la copii este de 175 mg/dL.
* La un esantion de 10 copii, proveniti din familii īn care tatal a decedat īn urma unei boli cardiovasculare, media colesterolului sanguin este de 200 mg/dL iar deviatia standard este de 50 mg/dL.
* Nivelul mediu al colesterolului la aceasta populatie de copii este mai mare decāt cel al populatiei generale?
* Este nivelul colesterolului obtinut la acest esantion semnificativ diferit fata de cel al populatiei generale?
9"Datele problemei"
* Datele problemei: m0 = 175, m = 200, n = 10, s = 50.
* Ipotezele testului sunt:
o 1. Test bilateral: H0: m = m0 = 175 versus H1: m <>m0<>175
o 2. Test unilateral: H0: m = m0 = 175 versus H1: m > m0 > 175
* De asemenea, avem:
o Ipoteza nula: nu exista diferenta semnificativa īntre media colesterolului pentru esantion fata de media populatiei.
o Ipoteza alternativa pentru testul bilateral: exista diferenta semnificativa īntre media colesterolului la esantion si respectiv la populatia generala.
o Ipoteza alternativa pentru testul unilateral: media colesterolului pentru esantion este mai mare decāt media colesterolului la populatia generala.
* Prag de semnificatie a = 0,05
10* 1. Regiunea critica pentru testul bilateral este: (-„ , -1,96 ] Č [1,96 , „) (vezi anexa 1).
* 2. Regiunea critica pentru testul unilateral este: [1.645, „) ( vezi anexa 1).
* Parametrul statistic calculat al testului:
11* 1. Pentru testul bilateral: Deoarece parametrul statistic calculat al testului nu apartine regiunii critice respingem ipoteza nula; exista o diferenta semnificativa īntre media colesterolului la esantionul ales si populatia generala.
* 2. Pentru testul unilateral: Deoarece parametrul statistic calculat al testului z este mai mic decāt 1,645 nu putem nega ipoteza nula, adica nu exista diferenta semnificativa īntre media colesterolului la esantion si media colesterolului populatiei generale.
12"Obiectivul testului este de a..."
* Obiectivul testului este de a compara mediile unei variabile cantitative continue īntre doua populatii, care satisfac conditia au aceeasi variatie s2 si ca ea este cunoscuta.
* Pentru aplicarea testului se utilizeaza doua esantioane reprezentative independente extrase din cele doua populatii
13"Conditii de aplicare"
* Conditii de aplicare
* 1. Populatiile trebuie sa aiba variatii cunoscute si egale. Daca variatiile nu sunt cunoscute, se aplica testul Student pentru compararea mediilor a doua populatii.
* 2. Testul este corect aplicat daca populatiile sunt normal distribuite sau daca esantioanele utilizate au talie mare (³30). Daca populatiile nu sunt normal distribuite sau daca cel putin un esantion are talie mica (<30), testul da o valoare orientativa.
14"Algoritm"
* Algoritm
* Consideram doua populatii cu mediile si respectiv .
* Ipotezele testului:
o 1. Test bilateral: H0: m = m0 versus H1: m m0
o 2. Test unilateral: H0: m = m0 versus H1: m > m0
15"Sub prezumtia ca ipoteza nula..." * Sub prezumtia ca ipoteza nula este adevarata (m1 - m2 = 0), parametrul statistic al testului este dat de formula:
16"Dorim sa studiem daca exista..."
* Dorim sa studiem daca exista diferenta semnificativa īntre cantitatea de acid uric sangvin la barbatii din mediul urban fata de cei din mediul rural, cunoscāndu-se ca variatia acidului uric este egala cu 2,1 mg/100ml.
* Din prima populatie (mediul urban) s-a extras un esantion de 10 persoane cu vārste cuprinse īntre 45 si 60 de ani si s-a obtinut o medie a acidului uric de 5,6 mg/100ml.
* S-a determinat media acidului uric la un esantion de 16 barbati, extras din a doua populatie (mediul rural), cu vārste cuprinse īntre 45 si 60 de ani din mediul rural si s-a constata o valoare medie de 4,1 mg/100ml.
17"Ipoteza testului"
* Ipoteza testului:
o 1. Test bilateral: H0: m = m0 versus H1: m m0
o 2. Test unilateral: H0: m = m0 versus H1: m > m0
* Ipoteza nula: Media acidului uric la prima populatie nu difera semnificativ fata de media acidului uric la cea de-a doua populatie.
* Ipoteza alternativa, test bilateral: Media acidului uric la cei din mediul urban difera semnificativ fata de media acidului uric la cei din mediul rural.
* Ipoteza alternativa, test unilateral: Media acidului uric la cei din mediul urban este semnificativ mai mare fata de media acidului uric la cei din mediul rural.
18 * Parametrul statistic calculat al testului:
* Pragul de semnificatie: a = 0,05.
* Regiunea critica:
* 1. Regiunea critica pentru testul bilateral: (-„ , -1,96 ] Č [1,96 , „) (vezi anexa 1).
* 2. Regiunea critica pentru testul unilateral: [1.645, „) ( vezi anexa 1).
19* Concluzie:
* 1. Test bilateral: Deoarece statistica calculata a testului nu apartine regiunii critice nu se poate nega ipoteza nula. Media acidului uric la prima populatie nu difera semnificativ fata de media acidului uric la cea de-a doua populatie.
* 2. Test unilateral: Deoarece statistica calculata a testului apartine regiunii critice, se accepta ipoteza alternativa ca media acidului uric īn prima populatie este mai mare decāt media īn cea de a doua populatie.
20* Scopul acestui test este investigarea semnificatiei diferentei īntre o frecventa teoretica p (īntr-o populatie) si o frecventa observata f pe un esantion reprezentativ a unei valori a unei variabile calitative (binare).
21* Conditii de aplicare:
* Testul este corect aplicat daca numarul n al observatiilor esantionului este suficient de mare (np, n(1-p)>10), pentru a justifica utilizarea unei aproximari cu o distributie normala redusa (a distributiei frecventei de selectie).
* Algoritm
* Un esantion randomizat de volum n este extras dintr-o populatie pentru care cunoastem frecventa teoretica p a unei variabile calitative. Pentru aceeasi variabila se calculeaza frecventa ei īn esantion f. Parametrul testului este:
22* Suntem interesati de investigarea prevalentei hepatitei B la personalul care lucreaza īn laboratoarele unor clinici de boli infectioase din Transilvania.
* Se stie din studii anterioare ca prevalenta hepatitei B īn populatia generala din Transilvania este de 9%.
* Un esantion de 100 de persoane care lucreaza īn laboratoarele unor spitale de boli infectioase din Transilvania s-a luat īn studiu si s-a obtinut o prevalenta a hepatitei B de 6%.
* Exista diferenta semnificativa īntre frecventa hepatitei B la personalul care lucreaza īn laboratoarele unor spitale de boli infectioase din Transilvania fata de populatia generala?
23* Solutie
* Datele problemei: f = 0,06, p = 0,09, . Fie p0 prevalenta (necunoscuta) a hepatitei B īn populatia alcatuita de personalul laboratoarelor spitalelor de boli infectioase.
* Ipotezele testului:
* 1. Test bilateral: H0: p0=p1 versus H1:p0<>p1
* 2. Test unilateral: H0: p0=p1 versus H1:p0>p1
24* Ipoteza nula: Nu exista diferenta semnificativa īntre frecventa hepatitei B la esantionul studiat fata de frecventa hepatitei B īn populatia generala.
* Ipoteza alternativa, test bilateral: Exista diferenta semnificativa īntre frecventa hepatitei B la nivelul esantionului si prevalenta hepatitei B īn populatia generala.
* Ipoteza alternativa, test unilateral: Frecventa hepatitei B la nivelul esantionului studiat este semnificativ mai mare fata de frecventa hepatitei B īn populatia generala.
25* Statistica testului:
* Pragul de semnificatie: a = 0,05.
* Regiunea critica:
* 1. Regiunea critica, test bilateral: (-„ , -1,96 ] Č [1,96 , „) - (vezi anexa 1).
* 2. Regiunea critica, test unilateral: [1.645, „) -( vezi anexa 1).
26* Concluzie
* 1. Test bilateral: Deoarece parametrul statistic calculat al testului nu apartine regiunii critice nu se poate nega ipoteza nula. Nu exista diferenta semnificativa īntre frecventa hepatitei B la esantionul studiat fata de frecventa hepatitei B īn populatia generala.
* 2. Test unilateral: Deoarece parametrul statistic calculat al testului nu apartine regiunii critice, nu se poate nega ipoteza nula. Nu exista diferenta semnificativa īntre frecventa hepatitei B la esantionul studiat fata de frecventa hepatitei B īn populatia generala.
27* serveste la compararea a doua distributii, urmānd doua modele, care constau īn:
o compararea unei distributii observate (sau empirice) pe un esantion cu o distributie teoretica. In acest caz, se cauta sa se determine daca un esantion se aseamana cu un anumit model teoretic, fiind astfel vorba de un test Hi-patrat de ajustare.
o compararea a doua distributii observate īn scopul stabilirii fie a independentei dintre doua criterii sau omogenitatea dintr-un tabel de contingenta. Este vorba īn acest caz de un test Hi-patrat de omogenitate sau de independenta.
28* Astfel vom presupune ca se cauta efectul fumatului asupra aparitiei cancerului buzei inferioare (M). Pentru aceasta se observa un esantion de 400 de subiecti dintre care:
o 160 au afectiunea M prezenta ( si 240 nu au boala prezenta)
o 130 sunt fumatori T ( si 270 nu sunt fumatori).
29* Se cauta sa se stabileasca daca fumatul influenteaza aparitia maladiei M sau daca aparitia acesteia este independenta de fumat.
* Tabelul de contingenta prezentat se numeste tabel de contingenta observat, iar frecventele pe care le contine se numesc frecvente observate.
30* Se face ipoteza de independenta īntre cele doua caractere M si T (adica ipoteza nula H0 , īn acest caz) atunci
* Se calculeaza un tabel de contingenta teoretic care satisface aceasta ipoteza de independenta.
* Se determina apoi abaterea (ecartul) dintre cele doua tabele de contingenta observat si teoretic.
o Daca aceasta abatere este mica atunci ea este explicata doar prin īntāmplare (hazard) si ipoteza de independenta este acceptata.
o Daca aceasta abatere este foarte importanta pentru ca doar īntāmplarea sa o explice atunci ipoteza de independenta trebuie sa fie respinsa.
31* Problema este urmatoarea: dispunānd de un esantion de n = 400 de subiecti dintre care 160 au maladia M iar 130 sunt fumatori, sa se determine cum sunt repartizati subiectii īn functie de cele doua caractere (M si T) daca se presupune ca acestea sunt independente
32
33
* H0: caracterele A si B sunt independente.
* H0: fumatul nu are influenta asupra aparitiei maladiei M.
34
35
* Fie a pragul de semnificatie al testului.
* S-a ales pragul de semnificatie a = 0.05
36
* Regiunea critica este [X2 a ,„).
* Pentru pragul a =0.05 si cu 1 grad de libertate valoarea = 3.84, astfel ca īn acest caz regiunea critica este intervalul [3.84 , „).
37
38
* Daca X2 Ī[3.84, „) se respinge H0 cu un risc de eroare de prima speta £a .
* Daca X2 Ļ[3.84, „) atunci H0 nu se respinge, acceptāndu-se H0 cu un risc de eroare de speta a doua b
* X2 =37,22 >> 3.84 asa ca ipoteza nula H0 se respinge cu un risc inferior lui 5%.In concluzie, fumatul se asociaza cu maladia M favorizānd-o.
39* Testul de ajustare se poate aplica īn solutionarea urmatorului model.
o Se considera un tabel de contingenta observat continānd frecventele a doua caractere (avānd fiecare un numar oarecare de valori).
o Se pune atunci problema daca cele doua caractere sunt legate printr-o anumita lege cunoscuta de probabilitate W.
o Se adopta atunci acelasi procedeu ca īn aplicarea testului de independenta cu singura diferenta ca tabelul de contingenta teoretic se calculeaza pe baza utilizarii legii W
40* Cel mai frecvent testul de ajustare este aplicat la studiul unui singur caracter (avānd k modalitati de realizare) pentru care se īncearca sa se afle daca repartitia sa urmeaza o lege teoretica cunoscuta.
* Numarul de grade de libertate a legii utilizate īn acest caz este k-1.
* Se poate īn acest fel compara cu ajutorul testului de ajustare (cu 1 grad de libertate) o frecventa observata cu o frecventa teoretica.
41
* Este un test destinat analizei cercetarilor multinivel si/sau multifactoriale
* Este utilizat atunci cānd trebuiesc cercetate 3 sau mai multe conditii sau esantioane
* Bazat pe statistica F si pe prezumtia ca esantioanele sunt extrase aleator dintr-o populatie normal distribuita (īn practica se verifica īntotdeauna)
42
* Univariat - analiza se aplica asupra unui experiment cu un singur factor, care produce cel putin trei grupuri independente
* Ipoteza statistica:
o H0: μ1 = μ2 = μ3 ... = μn
* Testul statistic utilizat este testul F (propus de Sir Ronald Fischer
43
* Studiu ipotetic asupra efectului utilizarii bastonului sau cārjelor la persoanele cu amputatie unilaterala, masurāndu-se lungimea pasului
* Varianta totala SSt
* Varianta intergrup SSb
* Varianta intragrup SSe= SSt - SSb
44
* Media patratica intergrup MSb
* Media patratica intragrup MSe
45* Daca nu putem rejecta ipoteza nula, nici un tratament nu este util
Formule
Problema 1. Formule aritmetice simple. Executati īn Excel urmatoarele conversii:
Introduceti urmatoarele date :
Īn celula selectata mai sus : B1 introduceti urmatoarea formula :
=A1*1024*1024 apoi apasati Enter. Īn celula B1 va aparea rezultatul conversiei īn KB, iar pe bara de formule se poate vedea formula dupa care a fost calculata.
!! O formula īncepe īntotdeauna cu =.
Procedati īn mod analog pentru urmatoarele conversii.
Informatii utile:
Pentru a micsora numarul de zecimale apasati pe butonul:
Pentru formatarea celulelor selectati domeniul dorit. Alegeti din meniu comanda Format - Cells - Alignment si selectati optiunea Center din caseta derulanta pentru aliniere īn centrul celulei, selectati optiunea Merge text pentru reuniunea mai multor celule, selectati optiunea Wrap text pentru spargerea textului pe mai multe rānduri.
Pentru formatare selectati domeniul dorit. Alegeti din meniu comanda Format - Cells - Border si selectati tipul de linie dorita pentru īncadrarea celulei sau domeniului selectat, apoi apasati butonul pentru tipul de īncadrare dorita.
Problema 2. Operatori. Se da a,b,c īn celulele A1, A2, A3 ale unui tabel Excel. Sa se calculeze īn Excel urmatoarele formule:
Problema 3. Referinte relative-absolute. Īn coloana A1 se da numarul de zile de spitalizare pentru 10 pacienti. Īn celula D1 se da costul unei zile de spitalizare pentru un pacient:
Problema 4. Utilizarea functiilor. Īn coloana A se da TAD- tensiunea arteriala diastolica la 10 pacienti. Īn coloana B se da TAS - tensiunea arteriala sistolica pentru 10 pacienti. Īn coloana C se da Vārsta celor 10 pacienti.
Calculati utilizānd functiile Excel:
Laborator Word 1
Problema 1
Tema: crearea unui folder (director), a unui fisier si respective stergerea lor.
Creati un nou folder īn My Documents pe care sa īl denumiti Exemplu. Pentru aceasta realizati urmatorii pasi:
dublu clic pe icoana My Documents;
alegeti optiunea File si respectiv Folder.
denumiti acest folder Exemplu.
Īn folder-ul nou creat, creati un fisier Word. Pentru aceasta, deschideti folder-ul Exemplu (dublu clic pe icoana folder-ului). Din meniul File, alegeti optiunea New si ulterior optiunea Microsoft Word Document. Denumiti acest fisier Exemplu.
stergeti folder-ul Exemplu. Pentru aceasta selectati folderul prin clic pe icoana lui si ulterior apasati tasta Delete. Va aparea o casuta de dialog care va va īntreba daca sunteti siguri ca doriti sa stergeti folder-ul Exemplu; alegeti butonul Yes.
Problema 2
Tema: Creati īn partitia dvs. 5 foldere: Word, Excel, PowerPoint, Access si respectiv Biostatistica. Pentru aceasta parcurgeti urmatorii pasi:
Problema 3
Introduceti urmatorul text cu formatarile urmatoare: font Arial de marime 12, pentru titlu font arial de marime 14 boldat si subliniat ca īn figura de mai jos:
10.1. Informatizarea fisei medicale
Fisa medicala sau dosarul medical informatizat este structura īn care sunt consemnate toate datele necesare pentru evidenta si supravegherea pacientilor. Teoretic dosarul unui pacient este distribuit fizic īntre serviciile interesate: spitale, medici generalisti, societatile de asigurare. Functiile dosarului medical informatizat includ:
īmbunatatirea posibilitatilor de comunicare (de exemplu, īntre diferite echipe medicale)
īmbunatatirea algoritmilor de luare a unei decizii
utilizate īn grup permit: evaluarea, cercetarea si planificarea.
Salvati documentul īn folderul Word sub denumirea Word 1a.
roblema 4
Realizati urmatoarea diagrama. Imaginea se va insera cu comanda: Insert Picture From File; imaginea se numeste Computer si o gasiti pe pagina care cuprinde lista cu lucrarile de laborator (dupa Word1).
System unit |
Monitor |
Keyboard |
Mouse |
Floppy disk drive |
CD-ROM drive |
CD-ROM |
Floppy disks |
Hard disk drive |
Salvati documentul īn folderul Word sub denumirea Word 1b.
Īnchideti toate aplicatiile si nu uitati sa iesiti din conturile dvs.
Laborator Word 2
Problema 1
Realizati un fisier Word care sa cuprinda urmatorul text. Pentru acest text. utilizati distanta dubla īntre rānduri. Introduceti si numerotarea paginii la subsol si un antet de pagina cu textul "Informatica si biostatistica medicala".
De asemenea, utilizati si o nota de subsol legata de dosarul medical informatizat "Dosarul medical informatizat este structura īn care sunt consemnate toate datele necesare pentru evidenta si supravegherea pacientilor. Dosarul unui pacient trebuie distribuit fizic īntre serviciile interesate: spitale, medici de familie, societati de asigurare.".
Salvati fisierul cu numele Word 2a īn folder-ul Word.
Problema 2
Tema: Realizati īn Microsoft Word urmatorul tabel. Folositi optiunile Table Merge Cells, Table Split Cells din meniul Table. Folositi fontul Garamond de 11.
Salvati fisierul sub denunirea de Word 2b īn folder-ul Word.
Nr. crt. |
Numele si prenumele |
Diagnostic |
|
Analize |
|||||
Glicemie |
Tensiune arteriala |
||||||||
Dim |
Pranz |
Seara |
TAD |
||||||
Dim |
Pranz |
Seara |
|||||||
|
|
|
|
|
|
|
|
|
|
|
Pop Ana |
Diabet |
Ziua 1 |
|
|
|
|
|
|
Ziua 2 |
|
|
|
|
|
|
|||
Ziua 3 |
|
|
|
|
|
|
|||
Ziua 4 |
|
|
|
|
|
|
|||
Ziua 5 |
|
|
|
|
|
|
|||
|
Popa Ion |
Diabet |
Ziua 1 |
|
|
|
|
|
|
Ziua 2 |
|
|
|
|
|
|
|||
Ziua 3 |
|
|
|
|
|
|
|||
Ziua 4 |
|
|
|
|
|
|
|||
Ziua 5 |
|
|
|
|
|
|
Problema 3 - Introducere de formule īn Word
Sa se editeze Īn Word urmatoarele formule: (pentru editare folositi Insert - Object - Microsoft Equation 3.0)
a.
b.
Problema 4. Optional
Tema: Creati un index pentru un text oarecare de cel putin trei pagini.
Textul il obtineti cautand pe google urmatoarele cuvinte "Doctori si asistente profesionisti complementari". Din pagina de web selectati cateva ecrane de text pe care le copiati in documentul Word.
Instructiuni:
Va aparea fereastra:
Problema 5. Optional
Tema: Creati un Cuprins pentru un text oarecare.
Instructiuni:
1. Creati stilurile de formatare pentru fiecare dintre titlurile care doriti sa apara īn Cuprins cu comanda Styles and Formatting din meniul Format. (Se poate crea un stil nou cu optiunea New Style sau se poate alege stilul dorit dintre stilurile de formatare deja existente: de ex pentru "10.1. Informatizarea datelor medicale" se poate alege stilul Heading 3, la fel si pentru "10.2. Tipuri de date si formate ". Iar pentru "Obiective si beneficii ale dosarului medical informatizat " stilul Heading 2, iar pentru "Stocarea si comunicarea informatiilor" stilul Heding 4.
2. Cu ajutorul comenzii Index and Tables din meniul Insert optiunea Reference creati Cuprinsul astfel:
Se poate alege numarul de nivele afisate, aparitia numarului de pagina etc. Iar folosind optiunea Options se poate fixa īn dreptul fiecarui stil nivelul titlului :
ca īn figura de mai sus.
Apoi, pentru crearea Cuprinsului se va apasa tasta OK din fereastra Index and Tables.
Īnchideti toate aplicatiile si nu uitati sa iesiti din conturile dvs.
Laborator EXCEL
Deschideti aplicatia Microsoft Excel (butonul Start-Programs-Microsoft Excel) si realizati un tabel cu aspectul de mai jos, īn care introduceti date pentru 10 pacienti:
Instructiuni:
Dupa ce introduceti continutul unei celule, validati acest fapt cu [Enter] sau [Tab].
Pentru a edita continutul unei celule folositi tasta [F2] sau dublu clic.
Pentru a introduce o formula īntr-o celula īncepeti īntotdeauna cu = si adresati celulele prin numele celulei (litera care desemneaza coloana si cifra care indica linia); īn cazul nostru formula este Greutate(kg)/Inaltime(m)2, ceea ce se traduce pentru celula G2 īn formula: = E2/(F2^2). Cānd introduceti formula sau daca doriti modificarea ei, puteti face acest lucru scriind īn zona rezervata special, bara de formule:
Pentru a multiplica formula respectiv pentru celelalte celule (G3-G14) selectati G3-G14 si folositi din meniu optiunea Edit-Fill-Down;
Pentru a micsora numarul de zecimale selectati celula cu valoarea pentru care doriti micsorarea numarului de zecimale si din Format-Cells-Number alegeti optiunea Number, iar la caseta cu zecimale scrieti numarul de zecimale dorite. Pentru alta varianta mai rapida apasati pe butonul:
Pentru a realiza graficul distributiei pe sexe a pacientilor:
Realizati un tabel separat sub tabelul dvs. īn care sa treceti numarul total de femei si numarul total de barbati astfel:
Femei |
|
Barbati |
|
Selectati acest tabel, apoi apasati butonul pentru Chart Wizard:
Lucrare EXCEL - WORD
Nr.crt.
Nitrit
Ph
Tabelul 1.1 Tabelul Ph-ului gastric si a concentratiilor de nitrit urinar
Īntreaga dumneavoastra lucrare īn Word va arata astfel:
Instructiuni:
Teme de lucru
Concepeti īn PowerPoint urmǎtoarea prezentare:
(Vezi manualul: "Informatica medicala aplicata" pag.60-69)
Problema 1.
Laborator Access
Problema1: Sa se realizeze o baza de date care sa monitorizeze valorile glicemiei si colesterolului unui grup de pacienti.
Solutie propusa: Realizarea unei baze de date folosind Microsoft Access: Start - Programs - Microsoft Access. Se va deschide aplicatia Access. Īn partea din dreapta a aplicatiei, New File, veti selecta butonul corespunzator unei aplicatii noi, respectiv . Se va deschide o casuta de dialog īn care trebuie sa completati numele bazei de date, respectiv Cabinet.
Atentie!!! Baza de date trebuie sa fie realizata īn folder-ul cu numele dvs.
Analiza: Specificatia (textul problemei) fiind foarte vaga se opteaza pentru folosirea urmatoarelor entitati:
Realizati 2 tabele, Pacienti si Consultatii (corespunzatoare entitatilor de mai sus), folosind optiunea Create table in Design View, cu urmatoarea structura :
Alegerea cheii primare
Cheia primara este elementul care defineste unicitatea si consistenta datelor īntr-o baza de date.
Pentru baza noastra de date cheia primara a tabelului Pacienti este formata din cāmpul Id_pacient, iar pentru tabelul Consultatii este formata din cāmpurile NumPac si Data_analizei.
Pentru selectarea cheii primare: dupa selectarea cāmpului sau cāmpurilor dorite se actioneaza butonul:
Dupa relizarea structurii fiecarui tabel, salvati-l cu Save As din meniul File cu denumirile: Pacienti respectiv Consultatii.
Diagrama entitate - relatie este:
|
|
|
Realizati legatura dintre cele doua tabele:
Pentru a realiza legatura dintre cele doua tabele:
Īn tabela Consultatii, īn mod de editare structura (fereastra deschisa prin actionarea butonului Design din baza de date Cabinet), se alege linia continānd NumPac si se modifica tipul cāmpului din "Number" īn "Lookup Wizard". Legatura se face la tabelul Pacienti, cu afisarea cāmpului "Nume". Astfel continutul tabelelor va fi de forma :
si respectiv:
Introduceti cel putin 5 pacienti si pentru fiecare pacient cel putin 2 consultatii
Realizati urmatoarele interogari:
1. Se cere sa se afle care dintre pacienti are glicemia mai mare ca 110.
Realizati o interogare (Queries), utilizānd optiunea Create Query in Design View, de forma:
Salvati interogarea sub numele de Query1. Dupa realizare, deschideti Query-ul cu butonul Open si verificati corectitudinea datelor afisate ( ele trebuie sa īndeplineasca conditia data).
Analog primei interogari, gasiti pacientii care au valoarea colesterolului mai mare decāt 220.
Realizati un raport:
Se cere sa se realizeze un raport cu interogarile realizate anterior.
Pentru aceasta, alegeti din lista de obiecte, obiectul Reports si ulterior optiunea Create report by using wizard. Din fereastra deschisa alegeti la obtiunea Tables/Queries Query1 ca si īn figura urmatoare:
Alegeti toate cāmpurile din Query1 pentru a fi introduse īn raport folosind butonul . Alegeti ca si tip de raport tipul Stepped iar ca si stil Corporate. Raportul se va numi Pacienti si va avea forma:
Analog, realizati raportul si pentru a doua interogare.
Problema2: Se cere realizarea unei baze de date Access care sa gestioneze activitatea unui cabinet de medic de familie cuprinzānd tabelele:
Concepeti īn Excel urmatoarele foi de calcul:
(Vezi manualul: "Aplicatii practice de informatica si statistica medicala" pag.58-59)
Problema 1. Realizati un tabel cu aspectul de mai jos:
1. Determinati costul spitalizǎrii pentru fiecare pacient stiind cǎ o zi de spitalizare este 300000lei.
Dacǎ Cultura bacterianǎ = 1, atunci Infectie bacterianǎ are valoarea "Da",
altfel Infectie bacterianǎ are valoarea "Nu" .
Se va folosi functia IF.
|
Durata spitalizarii |
Varsta |
Leucocite (x103) |
Media aritmetica |
=average(B2:B18) |
=average(C2:C18) |
=average(G2:G18) |
Minim |
=min(B2:B18) |
=min(C2:C18) |
=Min(G2:G18) |
Maxim |
=max(B2:B18) |
=max(C2:C18) |
=Max(G2:G18) |
Instructiuni
Instructiuni:Problema optionalǎ
Pe coloana cu Media pentru celula H3 aveti formula:=(C3+D3+E3+F3+G3)/5
Pe coloana cu Media ponderata pentru celula I3 aveti formula:=((C$1*C3)+(D$1*D3)+(E$1*E3)+(F$1*F3)+(G$1*G3))/H$1
Pe coloana cu Bursa Da/Nu pentru celula J3 aveti formula:=IF(OR(C3<5;D3<5;E3<5;F3<5;G3<5);"Nu";"Da")
Pentru coloanele Medie, Medie ponderata, Bursa formula se poate copia astfel: se selecteaza coloana si se alege optiunea din meniu Edit - Fill Down
|