Documente online.
Zona de administrare documente. Fisierele tale
Am uitat parola x Creaza cont nou
 HomeExploreaza
upload
Upload




EDITAREA DATELOR IN SPSS

Informatica


EDITAREA DATELOR ÎN SPSS



5.1. EDITORUL DE DATE

Definirea variabilelor utilizate în prelucrari, introducerea, modificarea si afisarea valorilor variabilelor se realizeaza cu ajutorul editorului de date. El creeaza si actualizeaza fisierele de date.

Editorul de date este activat automat la începutul sesiunii de lucru cu 111j93b SPSS si ori de câte ori se solicita crearea unui fisier de date (prin optiunea New a meniului File, urmata de optiunea Data) sau deschiderea unui fisier de date (prin optiunea Open a meniului File).

În zona documentelor a ferestrei editorului de date sunt afisate, într-un tabel, datele asupra carora se pot efectua prelucrarile statistice.

Fiecare linie a tabelului corespunde unui caz (un obiect observat sau un subiect), iar fiecare coloana, unei variabile (o caracteristica observata sau masurata la cazurile care figureaza pe linii ori ale carei valori sunt calculate cu ajutorul valorilor altor caracteristici). La intersectia unei linii cu o coloana se afla o celula în care este înscrisa valoarea variabilei corespunzatoare coloanei pentru cazul corespunzator liniei.

Capul de tabel contine numele variabilelor.

5.2. DEFINIREA VARIABILELOR ÎN SPSS

Definirea unei variabile consta în furnizarea urmatoarelor informatii despre variabila:

. numele (variable name);

. tipul (variable type);

. eticheta (variable label);

. etichetele valorilor variabilei (value labels);

. valorile utilizate atunci când nu se cunoaste valoarea variabilei sau aceasta nu prezint_ interes pentru cercetarea de fata (missing values);

. modul de afisare a valorilor variabilei în tabelul editorului de date (column format).

Numele serveste la identificarea variabilei. Fiecare variabila are un singur nume. La stabilirea numelui trebuie sa se respecte urmatoarele reguli:

. Se compune din 1-8 caractere.

. Primul caracter este litera, urmatoarele pot fi litere, cifre, semnele ".", "@", "#", "_" si "$".

. Nu se poate termina cu punct.

. Pentru a nu se confunda cu variabilele create automat de unele proceduri, este recomandabil sa nu se termine cu semnul "_".

. Literele mici sunt considerate echivalente cu cele mari.

Tipul indica atât tipul valorilor variabilei (numerice, de tip sir etc.), cât si forma de afisare a valorilor în tabelul editorului de date si în listele de iesire.

Pentru variabilele cu valori numerice, SPSS accepta urmatoarele tipuri:

NUMERIC - valorile sunt scrise fara separatori între cifre, iar marca zecimala este semnul pe care îl foloseste în acest scop Windows (fixat prin optiunea Regional Settings din Control Panel);

COMMA - grupe de câte trei cifre, de la dreapta spre stânga, începând de la marca zecimala, sunt separate prin virgula, iar marca zecimala este punctul;

DOT - grupe de câte trei cifre, de la dreapta spre stânga, începând de la marca zecimala, sunt separate prin punct, iar marca zecimala este virgula;

SCIENTIFIC NOTATION - valorile sunt scrise sub forma nEm, unde n este un numar zecimal mai mare sau egal cu 1 si mai mic decât 10 (pentru ca sa aiba o singura cifra în stânga punctului zecimal), iar m este un numar întreg cu semn. Valoarea numarului reprezentat prin nEm este nx10m (de exemplu, 1.23E+01 este reprezentarea numarului 12.3). O valoare a unei variabile de tip SCIENTIFIC NOTATION poate fi introdusa în tabelul Editorului de date ca numar zecimal (de exemplu, 1.234) sau ca numar zecimal urmat de litera E sau D si de exponent, exponentul putând fi precedat de semn (de exemplu, numarul 12.3 poate fi scris 1.23E+1 sau 1.23D1) ori ca numar zecimal urmat de semnul exponentului si de exponent (de exemplu, 12.3 poate fi scris 1.23+1).

Împreuna cu tipul variabilei trebuie indicata si lungimea maxima ocupata de valorile variabilei, precum si numarul de cifre zecimale care vor fi afisate.

Valorile afisate ale variabilelor numerice pot avea maximum 16 cifre zecimale. Daca valoarea unei variabile a fost introdusa cu mai multe cifre zecimale decât s-a indicat la definirea variabilei, în calcule se va utiliza valoarea introdusa si nu cea afisata.

În SPSS mai exista câteva tipuri speciale de variabile numerice:

DOLLAR - numerele sunt precedate de semnul $, marca zecimala este punctul, iar grupe de câte trei cifre începând de la marca zecimala sunt separate prin virgula.

DATE - au ca valori data (ziua, luna si anul sau anul si numarul zilei în an) si/sau timpul (ora, minutul si secunda). Atunci când se alege acest tip pentru o variabila, SPSS propune o lista cu formate de afisare a valorilor, dintre care trebuie ales unul.

CUSTOM CURRENCY - numerele pot fi precedate si/sau urmate de câteva caractere indicate de utilizator. Formatele în care pot fi afisate valorile sunt definite de utilizator. Pentru aceasta se alege optiunea Options din meniul Edit si apoi se efectueaza un clic pe butonul Currency.

Variabilele de tip sir (STRING) sunt cele ale caror valori contin caractere alfanumerice. Utilizatorul trebuie sa indice pentru aceste variabile numarul de caractere, adica lungimea sirului de caractere. Se considera ca variabila este de tip sir scurt daca lungimea sa este de cel mult 8 caractere si este de tip sir lung daca are lungimea mai mare de 8 caractere.

La introducerea în calculator a valorilor variabilelor de tip sir se tine seama de lungimea indicata pentru acestea. Valorile cu lungime mai mica vor fi automat completate la dreapta cu spatii, iar cele cu lungime mai mare, vor pierde ultimele caractere din dreapta, astfel încât toate valorile sa aiba aceeasi lungime.

Eticheta variabilei explica semnificatia variabilei si contine textul care va fi afisat în toate iesirile, în locul numelui variabilei. Ea poate avea cel mult 120 de caractere alfanumerice si indica de obicei semnificatia variabilei.

Etichetele valorilor contin descrierea, prin siruri de cel mult 60 de caractere, a semnificatiei valorilor variabilei. Ele vor fi afisate în listele de iesire, în locul valorilor variabilei. Aceste etichete sunt utile mai ales atunci când valorile unei variabile calitative sunt codificate prin numere sau prin siruri de caractere foarte scurte (de exemplu, atunci când pentru variabila "mediu de domiciliu" se folosesc valorile 1 pentru "rural" si 2 pentru "urban").

Se poate atribui câte o eticheta fiecarei valori posibile a variabilei. Nu se pot defini etichete pentru valorile variabilelor de tip sir lung.

Pentru fiecare variabila se pot stabili valori care sa fie înregistrate în fisierul de date atunci când pentru un caz nu se cunoaste valoarea sau aceasta valoare nu prezinta interes pentru cercetare. De exemplu, daca o variabila ia ca valori notele obtinute de subiecti la proba de "Istoria universala" de la examenul de bacalaureat, se poate conveni ca pentru o persoana care nu a dat aceasta proba sa se înregistreze în fisier valoarea 0 (daca nu s-a prezentat la examen) sau -1 (daca nu a optat pentru aceasta proba).

Asemenea valori, numite "valori absente", vor fi introduse în cutia de dialog a optiunii Missing Values.

Pentru fiecare variabila se pot declara ca valori absente:

. maximum trei valori

sau

. un interval de valori (numai daca variabila are valori numerice)

sau

. un interval de valori si o valoare din afara acestui interval (numai pentru variabile cu valori numerice).

Nu se pot defini valori absente pentru variabile de tip sir lung.

Utilizatorul poate decide cum sa fie afisate valorile variabilei în tabelul editorului de date, respectiv câte caractere sa contina coloana si daca sa fie aliniate la stânga ori la dreapta sau sa fie centrate. Acest lucru se face prin intermediul optiunii Column Format. Daca lungimea unei valori a variabilei depaseste latimea fixata pentru coloana, în locul valorii respective se vor afisa asteriscuri. Latimea stabilita pentru coloana nu influenteaza lungimea de afisare a valorilor variabilei, aleasa de utilizator atunci când a indicat tipul variabilei.

Pentru definirea unei variabile se poate proceda în doua moduri:

. Se efectueaza un dublu clic pe celula care contine numele variabilei respective (în capul de tabel, în coloana corespunzatoare variabilei).

sau

. Se efectueaza un clic în orice celula din coloana variabilei. Apoi, se efectueaza un clic pe DATA din bara de meniu si, din meniul care se deschide, se selecteaza optiunea Define Variable.

Aceste actiuni conduc la deschiderea unei cutii de dialog, care contine:

. o cutiuta de editare text pentru numele variabilei (Variable Name);

. patru butoane de comanda:

. Type, pentru definirea tipului variabilei si a numarului de caractere la afisarea valorilor;

. Labels, pentru definirea etichetei variabilei si a etichetelor valorilor;

. Missing Values, pentru declararea valorilor absente;

. Column Format, pentru indicarea modului de afisare a valorilor în coloana editorului de date.

Efectuarea unui clic pe unul dintre butoanele de comanda este urmata de deschiderea unei cutii de dialog. Pentru închiderea lor se va efectua un clic pe butonul OK (daca se doreste pastrarea informatiilor completate de utilizator în aceste cutii de dialog) sau pe butonul CANCEL (daca se renunta la ceea ce s-a completat acum în cutia de dialog).

Iesirea din cutia de dialog de definire a variabilei se face dupa procedeul descris mai sus, prin efectuarea unui clic pe butonul OK sau pe butonul CANCEL.

Atunci când o variabila nu a fost definita complet de utilizator, pentru câmpurile necompletate de acesta se vor utiliza valorile implicite atribuite de SPSS. Astfel:

. numele variabilei este VARnnnnn, unde nnnnn reprezinta numarul acordat de SPSS, scris cu cinci cifre (de exemplu, VAR00001, VAR00012);

. tipul implicit este NUMERIC, valorile fiind afisate pe 8 caractere, cu doua cifre zecimale;

. nu se utilizeaza etichete nici pentru variabila si nici pentru valorile sale;

. nici una dintre valorile variabilei nu va fi considerata valoare absenta.

5.3. INTRODUCEREA sI MODIFICAREA DATELOR

5.3.1. Introducerea si modificarea valorilor variabilelor pentru cazuri existente

Introducerea datelor în tabelul editorului de date se poate face în orice ordine. Editorul extinde dimensiunea tabelului astfel încât toate celulele care au valori completate de utilizator sa fie incluse în tabel.

Celulele din tabel în care utilizatorul nu a introdus valori vor primi automat o valoare, aflata în concordanta cu tipul variabilei respective, pe care SPSS-ul o va recunoaste ca fiind valoare absenta: valoarea absenta atribuita de sistem (system-missing value) pentru variabilele numerice, respectiv sir vid, pentru variabilele de tip sir.

Pentru a introduce sau a modifica valoarea dintr-o celula se efectueaza un clic în celula. Drept rezultat, celula va fi înconjurata cu un chenar, iar deasupra tabelului se vor afisa urmatoarele informatii:

. numarul cazului (numarul liniei din tabel);

. numele variabilei;

. valoarea existenta în celula.

Editarea datei se va face deasupra tabelului, nu în celula. Daca în timpul editarii datei se tasteaza un caracter care nu este în concordanta cu tipul declarat pentru variabila, se va auzi un sunet (beep), iar caracterul respectiv nu va fi luat în considerare.

Dupa ce s-a editat data, se apasa tasta ENTER sau se efectueaza un clic într-o celula. În acest fel, valoarea editata este scrisa în celula sa.

5.3.2. Inserarea unui caz sau a unei variabile

Pentru a insera un caz între doua cazuri din tabel se procedeaza astfel:

a. Se selecteaza o celula oarecare din linia deasupra careia se va face inserarea.

b. Se efectueaza un clic pe DATA din bara de meniu si se selecteaza optiunea INSERT CASE.

În tabel va aparea o linie în care toate variabilele primesc valoarea absenta atribuita de sistem.

Pentru a insera o variabila între doua variabile din tabel se procedeaza astfel:

. Se selecteaza o celula oarecare din coloana în stânga careia se va face inserarea.

. Se efectueaza un clic pe DATA din bara de meniu si se selecteaza optiunea INSERT VARIABLE.

În tabel va aparea o coloana având numele VARnnnnn, unde nnnnn reprezinta numarul acordat de SPSS, si în care toate cazurile primesc valoarea recunoscuta de SPSS ca fiind valoare absenta.

Adaugarea unei variabile dupa cele existente sau a unui caz la sfârsitul tabelului se face prin introducerea datelor în coloana urmatoare coloanelor completate din tabel, respectiv în linia aflata dupa ultima linie a tabelului. SPSS extinde automat dimensiunile tabelului pentru a include noile valori.

5.3.3. Utilizarea variabilelor sablon pentru definirea variabilelor

Atunci când mai multe variabile au acelasi tip, aceleasi etichete ale valorilor, aceleasi valori absente si/sau acelasi mod de afisare a valorilor în coloanele editorului de date, pentru a nu introduce la fiecare dintre ele informatiile comune se foloseste o variabila sablon. Aceasta contine toate valorile comune.

Definirea unei variabile sablon se face astfel:

. În fereastra editorului de date se alege meniul Data si optiunea Template.

. În cutia de dialog care apare se efectueaza un clic pe optiunea Define.

. Se definesc atributele variabilei sablon (tip, etichete de valori, valori absente, mod de afisare a valorilor), folosind cutiile de dialog ale optiunilor Type, Value Labels, Missing Values si Column Format.

. Se introduce numele variabilei sablon în cutia de editare Name.

. Se efectueaza un clic pe butonul de control Add.

Daca este necesara modificarea atributelor unei variabile sablon se procedeaza astfel:

. În fereastra editorului de date se alege meniul Data si optiunea Template.

. Din lista cu nume de variabile sablon se selecteaza variabila care va fi modificata.

. Se efectueaza un clic pe optiunea Define.

. Se introduc valorile noi pentru atributele care se modifica în cutiile de dialog ale optiunilor Type, Value Labels, Missing Values sau Column Format.

. Se efectueaza un clic pe butonul de control Change.

Schimbarea atributelor unei variabile sablon are ca efect schimbarea atributelor corespunzatoare la toate variabilele care utilizeaza variabila sablon respectiva.

Atunci când se doreste folosirea unei variabile sablon pentru una sau mai multe variabile, dupa ce se selecteaza aceste variabile efectuând clic în celulele tabelului de date care contin numele lor, se actioneaza astfel:

. Se alege din meniul Data optiunea Template.

. Se selecteaza numele variabilei sablon din lista variabilelor sablon definite.

. Se aleg atributele care se vor aplica variabilei/variabilelor efectuând câte un clic în cutiutele de validare corespunzatoare.

. Se efectueaza un clic pe butonul de control OK.

Utilizarea unei variabile sablon pentru o variabila are ca efect schimbarea atributelor definite anterior, cu cele ale variabilei sablon.

5.4. AFI_AREA UNOR DATE

Daca se doreste cunoasterea valorilor unei celule care nu apare pe ecran se pot utiliza barele de defilare. Pentru a nu pierde prea mult timp cu gasirea liniei respective, daca tabelul este mare, se efectueaza un clic pe DATA din bara de meniu si apoi pe optiunea Goto Case. În cutia de dialog care va aparea se va scrie numarul liniei în care se afla celula cautata.

Cu ajutorul editorului de date se pot cunoaste cazurile pentru care o variabila are o anumita valoare. Se procedeaza astfel:

. Se selecteaza o celula oarecare din coloana corespunzatoare variabilei (efectuând un clic pe ea).

. Se efectueaza un clic pe EDIT din bara de meniu si apoi pe optiunea Find.

. În cutia de dialog care va aparea se va completa valoarea cautata. Directia de cautare, fata de pozitia celulei selectate, se va indica prin efectuarea unui clic pe unul din butoanele Search Forward (cautare înainte) sau Search Backward (cautare înapoi) din aceeasi cutie de dialog.


Document Info


Accesari: 2690
Apreciat: hand-up

Comenteaza documentul:

Nu esti inregistrat
Trebuie sa fii utilizator inregistrat pentru a putea comenta


Creaza cont nou

A fost util?

Daca documentul a fost util si crezi ca merita
sa adaugi un link catre el la tine in site


in pagina web a site-ului tau.




eCoduri.com - coduri postale, contabile, CAEN sau bancare

Politica de confidentialitate | Termenii si conditii de utilizare




Copyright © Contact (SCRIGROUP Int. 2025 )