Documente online.
Zona de administrare documente. Fisierele tale
Am uitat parola x Creaza cont nou
 HomeExploreaza
upload
Upload




TRANSFORMARI DE DATE

Informatica


TRANSFORMĂRI DE DATE

Transformarile de date pe care le efectueaza SPSS sunt de doua feluri:



. se creeaza o variabila, ale carei valori se calculeaza cu ajutorul valorilor unor variabile existente;

. se schimba valorile unei variabile existente.

Se pot transforma valorile tuturor cazurilor din fisier sau doar cele ale unei submultimi indicata prin conditii logice.

6.1. CALCULUL VALORILOR UNEI VARIABILE

Aceasta operatie permite sa se calculeze valorile unei variabile - noi sau existente - folosind o expresie indicata de utilizator. Daca se creeaza o variabila, în tabelul editorului de date se introduce automat o coloana noua.

Expresia cu ajutorul careia se calculeaza valorile variabilei poate contine numele unor variabile cu valori cunoscute, operatori aritmetici (semnele +, - , *, /, **), operatori relationali (<, >, <=, >=, =, ~=, ~), functii etc.

Operatorii relationali < (mai mic), > (mai mare), <= (mai mic sau egal), >= (mai mare sau egal), = (egal) si ~= (neegal) servesc la compararea a doi termeni (aflati la stânga si la dreapta operatorului), furnizând ca rezultat valoarea 1 ("adevarat"), 0 ("fals") sau valoarea absenta.

De exemplu, variabilele numerice a si b fiind deja definite, se poate defini variabi 626c24g la numerica c prin expresia c = a < b. Aceasta variabila va avea doar valorile 1 (când a<b), 0 (când a b) si valoare absenta (când cel putin una dintre variabilele a si b are valoarea absenta).

Daca se compara doua siruri folosind un operator relational, cel mai scurt va fi completat la dreapta cu spatii înainte de a se efectua compararea.

Operatorul ~= ("neegal") are valoarea 1 ("adevarat") atunci când termenii între care se gaseste sunt diferiti si are valoarea 0 ("fals") daca ei sunt egali.

Operatorul ~ ("non") se foloseste urmat de o expresie logica. El furnizeaza valoarea 1 ("adevarat") daca aceasta expresie are valoarea 0 ("fals") si valoarea 0 ("fals") daca expresia are valoarea 1 ("adevarat"). Daca operatorului ~ îi urmeaza un termen numeric, atunci valorile acestuia diferite de 0 si 1 vor fi tratate ca valori absente.

Indicarea modului de calcul al valorilor variabilei se face în cutia de dialog care se deschide dupa ce se alege din meniul Transform optiunea Compute. Se completeaza urmatoarele informatii:

. numele variabilei ale carei valori se calculeaza (în cutia de editare text Target Variable);

. în cazul unei variabile noi: tipul acestei variabile si lungimea sa, daca este o variabila de tip sir, si, optional, eticheta variabilei (efectuând clic pe butonul Type & Label si apoi completând câmpurile corespunzatoare din cutia de dialog care apare);

. expresia cu ajutorul careia se calculeaza valorile (în cutia de editare text Numeric Expression);

. optional, atunci când se doreste ca valorile variabilei sa fie calculate numai pentru o submultime de cazuri din fisier, conditia logica folosita pentru identificarea respectivelor cazuri (efectuând clic pe butonul If).

Expresia cu ajutorul careia se calculeaza valorile variabilei poate fi construita în doua moduri: tastând-o caracter cu caracter sau mutând componentele ei de pe ecran în cutia de editare a expresiei. Pentru a muta un nume de variabila sau un nume de functie se selecteaza acesta si se efectueaza un clic pe butonul cu sageata îndreptata de la lista în care se afla elementul respectiv spre cutia în care se editeaza expresia. Operatorii aritmetici si relationali, precum si cifrele, se muta efectuând un clic asupra lor.

Atunci când expresia contine o functie, iar numele acesteia se muta din lista Functions, în cutia de editare a expresiei vor aparea semne de întrebare pe pozitiile parametrilor care trebuie completati.

Exista o gama larga de functii care pot fi introduse în expresia prin care se calculeaza valorile variabilei: aritmetice, statistice, de tip sir, de tip "data curenta", de tip "timp", de distributie, de tip variabila aleatoare, de tip "valoare absenta" etc. Pentru a cunoaste semnificatia unei functii se indica functia respectiva si se efectueaza un clic cu butonul drept al mouse-ului.

Atunci când în expresia prin care se calculeaza valorile variabilei apare o variabila care pentru un caz are valoarea absenta, în functie de expresie, SPSS procedeaza în doua moduri: îi atribuie rezultatului valoarea absenta sau calculeaza o valoare pe baza variabilelor care au valori cunoscute.

De exemplu, rezultatul expresiei MEAN (a,b,c,d) este valoarea absenta doar daca toate variabilele a, b, c si d au valoarea absenta. În celelalte cazuri se calculeaza media valorilor variabilelor care au valori cunoscute.

Functiile statistice permit sa se specifice numarul minim de variabile ale caror valori trebuie sa fie cunoscute pentru a calcula expresia. În acest scop, dupa numele functiei se tasteaza un punct si numarul acestor variabile. De exemplu, expresia MEAN.3 (a,b,c,d) se calculeaza numai daca cel putin 3 dintre variabilele a, b, c si d au valori cunoscute.

Daca se calculeaza valorile unei variabile noi si aceasta este de tip sir, este obligatoriu sa se indice tipul variabilei (String) si lungimea ei (Width). Aceste informatii se introduc în cutia de dialog care apare dupa ce se efectueaza un clic pe butonul Type & Label.

Eticheta unei variabile poate fi introdusa sub forma unui text, cu lungimea de cel mult 120 de caractere, sau poate fi preluata din expresia prin care se calculeaza valorile variabilei (primele 110 caractere). În cel de-al doilea caz se alege optiunea Use expression as label dintre cele doua butoane de optiuni mutual exclusive referitoare la eticheta din cutia de dialog Compute Variable: Type and Label.

Daca se doreste ca valorile variabilei sa fie calculate numai pentru unele dintre cazurile existente în fisier, în cutia de dialog care apare dupa ce se efectueaza un clic pe butonul If se alege optiunea Include if case satisfies condition si se construieste o expresie conditionala. O asemenea expresie poate sa contina:

. nume de variabile;

. constante;

. operatori aritmetici (+, -, *, /, **);

. operatori relationali (<, >, <=, >=, =, ~=, ~);

. functii;

. variabile logice.

Rezultatul unei asemenea expresii pentru un caz poate fi "adevarat" ("true"), "fals" ("false") sau "valoare absenta" ("missing value"). Calculul valorii variabilei se va face numai daca rezultatul este "adevarat".

6.2. MODIFICAREA VALORII DE PORNIRE PENTRU GENERAREA DE NUMERE PSEUDO-ALEATOARE

SPSS contine un generator de numere pseudo-aleatore care intra în functiune atunci când trebuie sa se aleaga aleator cazuri din fisier, precum si atunci când se folosesc functiile UNIFORM si NORMAL.

Valoarea de pornire pentru generarea sirului de numere pseudo-aleatoare poate fi stabilita de utilizator. În acest scop, se alege din meniul Transform optiunea Random Number Seed. Din cutia de dialog care apare se selecteaza Set seed to si se introduce un numar cuprins între 1 si 2 000 000 000.

Daca utilizatorul nu indica o valoare de pornire, SPSS va genera aleator aceasta valoare ori de câte ori va trebui sa construiasca un sir de numere pseudo-aleatoare.

6.3. NUMĂRAREA APARIŢIILOR UNOR VALORI DATE

Este posibil ca, pentru fiecare caz, sa se numere de câte ori apare o valoare fixata sau o multime de valori fixate, la un grup de variabile, iar rezultatul sa se înregistreze într-o variabila.

De exemplu, sa presupunem ca fiecare caz din fisier corespunde unei persoane, iar variabilele i1, i2,..., i20 au ca valori raspunsurile date de aceasta la cei 20 de itemi ai unui test, pentru care raspunsurile pot fi "da" si "nu". Se defineste o variabila, pe care o numim "NRDA", a carei valoare, pentru fiecare caz, este egala cu numarul de itemi la care persoana respectiva a raspuns "da".

Pentru numararea aparitiilor unor valori date se procedeaza astfel:

. Se alege din meniul Transform optiunea Count.

. În casuta de editare Target variable se introduce un nume pentru variabila care va primi ca valoare rezultatul numararii.

. Se selecteaza din lista de variabile existente variabilele pentru care se numara aparitiile unei valori fixate. Aceste variabile pot fi de tip numeric sau de tip sir.

. Se efectueaza un clic pe optiunea Define Value si se specifica valoarea sau valorile pentru care se numara aparitiile. Valorile pot fi:

. valori ale variabilei respective;

. valori absente;

. valoarea absenta atribuita de sistem;

. intervale de valori, închise la ambele capete;

. semiintervale de valori, închise la unul dintre capete.

Pentru fiecare valoare sau multime de valori indicata de utilizator, SPSS numara de câte ori apare în grupul de variabile selectat. Rezultatele se cumuleaza, iar suma obtinuta constituie valoarea variabilei noi. Datorita acestui procedeu de lucru, pentru a nu aparea erori, trebuie sa se verifice ca fiecare valoare a carei aparitie se contorizeaza sa fie indicata o singura data. De exemplu, nu se va indica atât valoarea 4, cât si intervalul [3,6].

Optional, se poate cere sa se efectueze aceasta prelucrare numai pentru anumite cazuri din fisier. În acest scop se efectueaza un clic pe butonul If si în cutia de dialog care apare se construieste conditia logica folosita pentru identificarea respectivelor cazuri.

6.4. SCHIMBAREA VALORILOR UNEI VARIABILE

Aceasta operatie este utila atunci când se grupeaza valorile unei variabile si tuturor cazurilor care au valori dintr-o aceeasi clasa li se atribuie ca valoare codul clasei respective. Noua valoare poate sa înlocuiasca valoarea originala, adica sa fie atribuita variabilei existente, sau poate fi atribuita unei variabile noi, definita în acest scop.

Variabila a carei valoare se schimba poate fi numerica sau de tip sir.

Se poate cere ca transformarile sa se efectueze asupra tuturor cazurilor din fisier sau numai asupra unora. În cea de-a doua situatie se face un clic pe butonul If din casuta de dialog în care se definesc transformarile si apoi, în casuta de dialog care se deschide, se noteaza conditia pe baza careia se aleg cazurile pentru care se schimba valorile variabilelor.

A. Atunci când se modifica valorile variabilelor existente, se procedeaza astfel:

. Din meniul Transform se alege optiunea Recode si apoi optiunea Into Same Variables.

. Din cutia de dialog care apare se selecteaza variabilele ale caror valori vor fi schimbate în acelaai mod si se muta în lista Numeric Variables, folosind butonul cu sageata. Daca se selecteaza mai multe variabile, ele trebuie sa fie de acelasi tip.

. Se efectueaza un clic pe butonul Old and New Values.

. Apare o cutie de dialog prin intermediul careia se comunica modul de transformare.

Se pot schimba:

. una sau mai multe valori ale variabilelor (pentru fiecare din ele se alege optiunea Value din zona Old value si se tasteaza valoarea care se schimba);

. o valoare absenta (se alege optiunea System -or user missing);

. valoarea absenta atribuita de sistem (numai pentru variabile numerice) (se alege optiunea System missing);

. toate valorile cuprinse într-un interval închis la ambele capete (se alege optiunea Range si se completeaza limitele intervalului ... through ...) ori într-un semiinterval închis la dreapta (se alege optiunea Range si se completeaza limita superioara Lowest throuh ...) sau la stânga (se alege optiunea Range si se completeaza limita inferioara ... through highest);

. toate valorile care nu fac parte din categoriile de mai sus (se alege optiunea All other values).

Valoarea noua, în care se transforma o valoare sau un grup de valori, poate fi:

. o valoare data de utilizator (se efectueaza un clic pe optiunea Value din zona New si se indica aceasta valoare);

sau

. valoarea absenta atribuita de sistem (se face un clic pe optiunea system-missing).

Dupa indicarea unei transformari se face un clic pe butonul Add. Transformarea va aparea în lista Old -> New. Este posibil ca aceasta lista sa fie modificata prin adaugare (butonul Add), schimbare (butonul Change) si stergere (butonul Remove). Pentru a schimba sau a sterge o transformare este necesar ca aceasta sa fie mai întâi selectata în lista Old -> New.

Dupa efectuarea transformarilor cuprinse într-o lista Old -> New nu mai are sens sa se stearga sau sa se schimbe transformarile listei, întrucât valorile variabilei sau a variabilelor la care se refera lista au fost deja schimbate.

Daca pentru o aceeasi variabila se indica mai multe schimbari, ele vor fi efectuate de SPSS în urmatoarea ordine:

. valorile izolate;

. valorile absente;

. valorile cuprinse în intervale sau semiintervale;

. celelalte valori.

B. Atunci când valorile transformate ale unei variabile se înregistreaza într-o variabila noua si nu în locul celor vechi, este posibil ca variabila veche si cea noua sa nu fie de acelasi tip.

Pentru a schimba valorile uneia sau ale mai multor variabile generând variabile noi, se procedeaza astfel:

. Din meniul Transform se alege optiunea Recode si apoi optiunea Into Different Variables.

. Din cutia de dialog care apare se selecteaza variabilele ale caror valori vor fi schimbate în acelasi mod si se muta în lista Numeric Variable -> Old Variable, folosind butonul cu sageata. Daca se selecteaza mai multe variabile, ele trebuie sa fie de acealasi tip.

. Pentru fiecare variabila din lista Numeric Variable -> Old Variable:

. se selecteaza variabila;

. se introduce numele variabilei noi (în cutia de editare text Name si, optional, eticheta acesteia (în cutia de editare text Label);

. se efectueaza un clic pe butonul Change.

. Se face un clic pe butonul Old and New Values si se indica modul în care se schimba valorile.

Procedeul prin care se indica transformarile este asemanator celui urmat atunci când noile valori se înregistreaza în locul celor vechi. Apar doar urmatoarele deosebiri:

. Daca valorile unei variabile numerice se transforma în valori ale unei variabile de tip sir trebuie selectata optiunea Output variables are string.

. Daca se doreste ca unele valori sa nu se schimbe, se efectueaza clic pe optiunile All other values si pe Copy old values.

. Valorile pentru care nu se indica nici o transformare se schimba în valoarea absenta atribuita de sistem.

6.5. CALCULUL RANGURILOR

SPSS poate calcula, pentru variabile numerice, rangurile valorilor si diversi indicatori bazati pe ranguri. Rezultatele se înregistreaza ca valori ale unor variabile noi, pentru care numele si etichetele sunt generate de SPSS pornind de la numele variabilelor asupra carora s-au efectuat prelucrarile si de la transformarile facute. Pentru fiecare variabila si fiecare indicator calculat se genereaza câte o variabila.

Toate calculele care se efectueaza pentru a obtine rangurile sau indicatorii bazati pe ranguri utilizeaza ponderile cazurilor care se iau în considerare. La introducerea cazurilor într-un fisier aceste ponderi sunt egale cu 1, dar ele pot fi modificate de utilizator.

Daca se alege din meniul Transform optiunea Rank Cases apare o cutie de dialog continând lista variabilelor pentru care se pot efectua prelucrarile. Sunt excluse din aceasta lista variabilele de tip sir. Se selecteaza variabilele care intereseaza si se muta, folosind butonul cu sageata, în lista Variables.

Se indica apoi daca stabilirea rangurilor se face în ordinea crescatoare sau descrescatoare a valorilor variabilelor, adica daca rangul 1 se atribuie celei mai mici valori a fiecarei variabile (optiunea Smallest value) sau celei mai mari (optiunea Largest value).

Daca se doreste sa se afiseze un tabel continând, pentru fiecare variabila generata, numele variabilei din care provine, numele si eticheta variabilei noi, se efectueaza un clic pe optiunea Display summary tables.

Exista posibilitatea ca prelucrarile sa nu se faca în întregul fisier, ci pe grupe de cazuri, formate în functie de valorile unor variabile. Acest lucru se realizeaza mutând variabilele care servesc la formarea grupelor, din lista de variabile în lista denumita By, cu ajutorul butonului cu sageata. Se va forma câte o grupa pentru fiecare combinatie de valori ale variabilelor. În fiecare grupa se vor determina rangurile în acelasi mod.

Prelucrarile dorite se indica în cutia de dialog care apare dupa ce se efectueaza un clic pe butonul Rank Types. Se pot calcula:

. rangurile valorilor (optiunea Rank);

. scorurile Savage (optiunea Savage) - se calculeaza pe baza distributiei exponentiale, utilizând sumele ponderilor cazurilor pentru fiecare valoare distincta a variabilei si valorile cumulate ale acestor sume în ordinea crescatoare sau descrescatoare a valorilor variabilei;

. rangurile fractionale (optiunea Fractional Rank) - sunt egale cu rapoartele dintre valorile rangurilor si suma ponderilor tuturor cazurilor pentru care s-au calculat rangurile;

. rangurile fractionale exprimate sub forma procentuala (optiunea Fractional rank as %) - se calculeaza înmultind cu 100 rangurile fractionale;

. suma ponderilor cazurilor (optiunea Sum of case weight) - este aceeasi pentru toate cazurile utilizate în calculul rangurilor, fiind egala cu suma ponderilor acestor cazuri;

. cuantile (optiunea Ntiles, urmata de indicarea numarului de clase) - se împart cazurile, ordonate crescator sau descrescator dupa valorile variabilei, în atâtea clase câte s-a indicat, asa încât aceste clase sa fie de volume aproximativ egale, si fiecarui caz i se atribuie ca valoare numarul clasei din care face parte;

. estimari ale rangurilor fractionale realizate prin diverse metode: Blom, Tukey, Rankit sau Van der Waerden (optiunea Proportion estimates urmata de indicarea metodei folosite);

. scorurile z din distributia normala redusa, corespunzatoare rangurilor fractionale estimate (optiunea Normal scores).

Pentru a indica modul în care se calculeaza rangurile atunci când mai multe cazuri au aceeasi valoare a variabilei se face un clic pe butonul Ties.

Calculul rangurilor se face conform urmatorului algoritm:

. mai întâi li se atribuie ranguri distincte tuturor cazurilor, fara a se tine seama de faptul ca mai multe cazuri au valori egale (cazurile respective fiind luate într-o ordine întâmplatoare);

. se formeaza câte o grupa din toate cazurile care au aceeasi valoare a variabilei (daca o valoare apare la un singur caz, atunci grupa respectiva contine numai acel caz);

. tuturor cazurilor dintr-o grupa li se atribuie acelasi rang, care poate fi egal cu:

. cel mai mic dintre rangurile cazurilor din grupa (optiunea Low);

. cel mai mare dintre rangurile cazurilor din grupa (optiunea High);

. media rangurilor cazurilor din grupa (optiunea Mean);

. numarul de ordine al grupei (optiunea Sequential ranks to unique values).

În urmatorul tabel sunt prezentate rangurile cazurilor pentru fiecare dintre optiunile posibile:

Valoarea variabilei

Optiunea

Low

High

Mean

Sequential ...

3

5

5

5

9

12

1

4

6.6. RECODIFICAREA AUTOMATĂ A VALORILOR VARIABILELOR

Atât pentru variabile numerice, cât si pentru variabile de tip sir este posibila înlocuirea automata a valorilor variabilei cu numere întregi consecutive, începând cu 1. În prealabil, SPSS ordoneaza cazurile dupa valorile variabilei, crescator sau descrescator, în functie de optiunea utilizatorului.

Valorile transformate sunt înregistrate într-o variabila noua, al carei nume este indicat de utilizator. Aceasta variabila preia eticheta de variabila si etichetele de valori de la variabila ale carei valori sunt recodificate. Daca nu exista etichete de valori, valorile vechi devin etichete de valori si atunci coloanele din tabelul de date corespunzatoare variabilei noi si variabilei originale sunt identice.

Cazurile care au valoarea absenta primesc ca valoare transformata numarul care urmeaza celei mai mari dintre valorile transformate (mai mare cu 1 decât cea mai mare dintre noile valori), iar aceasta valoare este recunoscuta ca valoare absenta.

Pentru a realiza recodificarea automata a valorilor unor variabile se procedeaza astfel:

. Se alege optiunea Automatic Recode din meniul Transform.

. Se selecteaza variabilele ale caror valori se transforma si se muta în lista Variable -> New Name.

. Pentru fiecare din variabilele listei Variable -> New Name se selecteaza variabila, se introduce numele variabilei care va primi valorile transformate în cutia de editare text din dreapta butonului New Name si apoi se efectueaza un clic pe butonul New Name.

. Se indica daca valoarea 1 va fi atribuita, pentru fiecare variabila, celei mai mici valori (optiunea Lowest value) sau celei mai mari valori (optiunea Highest value)


Document Info


Accesari: 2332
Apreciat: hand-up

Comenteaza documentul:

Nu esti inregistrat
Trebuie sa fii utilizator inregistrat pentru a putea comenta


Creaza cont nou

A fost util?

Daca documentul a fost util si crezi ca merita
sa adaugi un link catre el la tine in site


in pagina web a site-ului tau.




eCoduri.com - coduri postale, contabile, CAEN sau bancare

Politica de confidentialitate | Termenii si conditii de utilizare




Copyright © Contact (SCRIGROUP Int. 2024 )