ALTE DOCUMENTE |
Néhány fogalomról röviden[1]
Attribútumok: a tárgyat - jelen esetben a személyt - jellemző tulajdonságok, jellegzetességek (pl.: nő, házas)
Változók: attribútumok logikailag összetartozó csoportjai. (pl.: a férfi és nő attribútumok együtt a nem változót képezik)
Minden változónak rendelkeznie kell két fontos tulajdonsággal:
A változót alkotó attribútumok felsorolásának teljesnek kell lennie (minden elemzési egységet be kell tudni sorolnunk a változó egy attribútuma alá).
A változót alkotó attribútumoknak egymást kölcsönösen kizáróknak kell lenniük (minden elemzési egységet be a változó egy és csakis egy attribútuma alá kell tudnunk sorolni).
Változók mérési szintje: a teljesség és a kölcsönös kizárás tulajdonságokon kívül további kapcsolatok is létezhetnek az attribútumok között, és ezeknek megfelelően különféle mérési szintekről beszélünk.
Nominális mérési szintűek azok a változók, melyek attribútumaira csak a teljesség és a kölcsönös kizárás feltételei állnak fenn. (Például településtípus, a vallási hovatartozás, a hajszín.)
Ordinális mérési szintűek azok a változók, melyek attribútumait ésszerűen rangsorolni tudjuk . Az egyes attribútumok a vizsgált tulajdonsággal relatíve kisebb vagy nagyobb mértékben rendelkeznek. (Például: legmagasabb iskolai végzettség, társadalmi osztályhelyzet.)
Intervallum mérési szintűek azok a változók, melyek attribútumai között távolságról is van értelme beszélni. Ezeknél az attribútumokat elválasztó logikai távolságot értelmesen kifejezhetjük standard (egységes) intervallumokkal.
Arányskála mérési szintű változók attribútumaira az összes fent említett strukturális jegyeken felül még az is igaz, hogy van valódi nulla pontjuk. Az intervallumszint minimális követelményeit kielégítő társadalomtudományi változók többnyire megfelelnek az arányskála feltételeinek is. (Például: az életkor.)
Az elméletalkotás tulajdonképpen annak megállapítását szolgálja, hogy logikusan milyen összefüggések, együttjárások várhatóak különböző változók egyes értékei - attribútumai - között, milyen a különböző változók közötti kapcsolat. Amennyiben az egyik változó szerinti hovatartozás egyértelműen meghatározza a másik változó szerinti hovatartozást, akkor az mondjuk, hogy a két változó között determinisztikus vagy függvényszerű kapcsolat van. A szociológiai elemzésben ténylegesen tapasztalt, nem egyértelműen, csak tendenciaszerűen érvényesülő kapcsolat neve valószínűségi vagy sztochasztikus kapcsolat. A sztochasztikus kapcsolat átmenetet képez a kapcsolat teljes hiánya és a függvényszerű kapcsolat mint két szélsőséges eset között. Ahogyan a felhasználható statisztikai módszerek fajtája is függ változóink mérési szintjétől, így magának a kapcsolatnak is kialakult a változók fajtájától függő elnevezése: a nominális és ordinális mérési szintű változók közötti kapcsolatot asszociációnak, az intervallum, illetve arányskála mérési szintűek közötti kapcsolatot pedig korrelációnak nevezzük.
Elemzéseinkben többnyire szerepel az okság fogalma. Ezekben az elméletekben függő, illetve független változókról beszélünk. A függő változó függ a független változótól. Ok és okozat fogalmaiban a független változó az ok, a függő változó az okozat. Hangsúlyoznunk kell, hogy az ok-okozat fogalmait önkényesen használjuk, ezekkel a tulajdonságokkal mi ruházzuk fel az adatokat és azok nem adataink immanens jellemzői.
Adatmátrix és változók
V1 |
V2 |
V3 |
V4 |
VX |
||
A1 | ||||||
A2 | ||||||
AN |
Mintánkban N db személy és X db változó található. A változók ilyenek lehetnek például:
V1 : NEM 'a kérdezett neme' 1 - 'férfi'
2 - 'nő'
V2 : SZULEV 'a kérdezett születési éve'
V3 : CSALALL 'a
kérdezett családi állapota' 1
- 'nőtlen/hajadon'
2
- 'élettárssal él'
|
4 - 'elvált'
|
![]() |
|||
![]() |
|||
Adatfile behívása
ahhoz, hogy egy adatfile-t megnyithassunk, a 'SPSS for Windows Data Editor' (adatmátrix) ablaknál kell állnunk
ha nem az alapbeállított *.sav kiterjesztésű file-lal szeretnénk dolgozni, akkor az új típust a 'Fájltípus' ablakban állíthatjuk be
az 'Open File' ablakban más Windows alkalmazásokhoz hasonlóan kereshetjük meg és állíthatjuk be azt a könyvtárat, amelyikben a behívandó adatfile-unk található
File Open .
Az adatfile változóinak megtekintése
Itt megnézhetjük a változó nevét, a változó értékeit és annak címkéit is.
Utilities Variables .
Változócímke (Variable Label) és értékcímke (Value Label)
Változók változó-, illetve értékcímkéit a következőképpen változtathatjuk meg, illetve az újonnan létrehozott változóknak így adhatjuk meg ezen jellemzőit.
Data Define Variables Labels .
A 'Labels' ablakon belül beállíthatjuk a következőt:
Variable Label: változócímke
Value Labels (értékcímkék): itt egyenként megadjuk az értékeket és a hozzájuk tartozó címkéket és az 'Add' gomb megnyomásával az ablakba visszük.
Value: érték
Value Label: értékcímke
Az eszköztár (ikonok) használata
Az 'SPSS for Windows' programban - a többi Windows alkalmazáshoz hasonlóan - ikonokkal is sok mindent elérhetünk. Ha ráállunk az egér-nyíllal egy ikonra, akkor a programablak alsó részén olvashatjuk, hogy az adott ikon megnyomásával milyen parancsot végezhetünk el.
A PASTE parancs és a 'Syntax Window' használata
Két eset lehetséges: (1) a program megnyitásával automatikusan egy Syntax ablak is megnyílik; vagy (2) nekünk kell megnyitni a következőképpen:
File New Syntax
Így járhatunk el akkor is, ha a meglévő mellé még egy Syntax ablakot szeretnénk nyitni.
A PASTE parancs segítségével a parancsablakokban 'beklikkelt' parancssort a 'Syntax' ablakban megjeleníthetjük, majd innen futtathatjuk annak az ikonnak a segítségével, amelynél a következő jelenik meg: 'Run current'. Vagy a Run menüpont használatával.
A legjobb minden parancsot a 'Syntax' ablakba küldeni, mert így elemzésünk parancssora elmenthető, ami később akármikor újra lefuttatható. Parancssorunk a szövegszerkesztésből ismert eljárások segítségével szerkeszthető.
Az 'Output Window' szerkezete
Az SPSS fejlettebb verzióiban az Output Window két panelből áll. A bal oldali tulajdonképpen egy tartalomjegyzék, amely a Windows Intézőhöz hasonló logikával működik. Ez megkönnyíti a hosszú outputokban való eligazodást. A jobb oldali tartalmazza az eredményeket. A két oldal méretaránya tetszőlegesen változtatható. Az output különböző részei tetszőlegesen rendezhetőek, szerkeszthetőek és törölhetőek.
Az 'Output Window', illetve a 'Syntax Window' mentése
Arra az 'Output' vagy 'Syntax' ablakra állunk, amelyiket éppen menteni akarunk. Egyszerre természetesen csak egyet tudunk. Annak megfelelően, hogy éppen melyik ablak az aktív, a 'File' menü 'Save' alparancsát kiválasztva más fog megjelenni: File Save .
Változók egyszerű keresése az adat-táblában (Newdata)
Utilities Variables
Itt megkeressük a változót, majd ráklikkelünk a 'Go To' gombra. Ekkor a program automatikusan a kijelölt változóra ugrik a 'Newdata' ablakban.
Adatok súlyozása: a Weight Cases parancs
Data Weight Cases .
Itt beállíthatjuk, hogy egy korábban általunk az adatok súlyának definiált változót a program valóban súlyként használjon.
Do not weight cases: nem használ súlyt
Weight cases by: az ehhez az opcióhoz tartozó ablakba betett változó szerint súlyozza majd a file-t a program
A hiányzó adatok kezelése és definiálása (Missing Values)
Az SPSS kétféle 'missing values'-t ismer. A 'user-missing values'-t és a 'system-missing values'-t. Az adattáblázat bármely üres numerikus cellája 'system-missing value'-ként jelenik meg, amelyet a program egy ponttal jelöl. Ezen kívül különböző okokból magunk is tarthatunk bizonyos információkat hiányzónak (pl. 'nem tudom' válaszok) és azután utasíthatjuk az SPSS-t, hogy ezeket az értékeket hiányzónak tekintse. A 'system-missing' és 'user-missing' értékeket az SPSS a különböző statisztikai eljárások és adat-transzformáló parancsok során különlegesen kezeli.
Data Define Variable Missing Values .
A 'Missing Values' ablakban különbözőképpen adhatjuk meg az értékeket, amelyeket a program ezután 'Missing Values'-ként kezel majd:
No missing values: nincsenek
Discrete missing values: diszkrét értékek megadása. Három ilyen érték megadása lehetséges.
Range of missing values: egy intervallum megadása
Range plus one discrete missing value: egy intervallum és egy diszkrét érték megadása.
Gyakorisági megoszlás kérése
Analyze Descriptive Statistics Frequencies .
Display frequency tables: ha nincs bejelölve, akkor a program nem közli a gyakorisági táblát
A 'Frequencies' ablakon belül lehetőségünk van különböző opciók választására, statisztikák kérésére: Statistics .
Percentile Values.
Quartiles: megadja azokat az értékeket, amelyek az eseteket négy egyenlő nagyságú csoportra osztják.
Cut points for X equal groups: megadja azokat az értékeket, amelyek az eseteket valamely, tetszőleges számú (X) egyenlő nagyságú csoportra osztják.
Percentiles: megadja azokat az értékeket, amely alá az esetek egy általunk meghatározott százaléka esik.
Central Tendency .
Mean (átlag): az értékek számtani közepe
Median (medián): a középső érték. Ha páros az esetek száma, akkor a középső két érték számtani közepe
Mode (módusz): a leggyakrabban előforduló érték. Ha több ilyen érték is van, akkor statisztikailag ezek mindegyike módusz, azonban a 'Frequencies' parancs ezek közül csak a legkisebbet közli.
Sum (összeg): az összes érték valamennyi esetre összegezve
Dispersion (szóródás)
Std. deviation (szórás): az átlag körüli szóródás mérőszáma
Variance (variancia): a szórás négyzete
Range (terjedelem): a legnagyobb és a legkisebb érték különbsége
Minimum (minimum): a legkisebb érték
Maximum (maximum): a legnagyobb érték
A 'Frequencies' ablakon belül lehetőségünk van, hogy grafikon, illetve hisztogram elkészítését kérjük a programtól: Charts .
Chart Type (a grafikon típusa)
None (semmi, egyik sem): nem kérünk semmilyen ábrát
Bar chart(s) (oszlopdiagram)
Pie chart(s) (kördiagram)
Histogram(s) (hisztogram)
With normal curve: ha ezt is választjuk, akkor a program a hisztogramra rárajzolja a normális eloszlás görbéjét
Chart Values
Frequencies: gyakoriságok kijelzése
Percentages: százalékok kijelzése
F SPSS-LINK1)
Leíró statisztikák kérése
Analyze Descriptive Statistics Descriptives .
A 'Descriptives' ablakon belül beállíthatjuk, hogy milyen statisztikákra van szükségünk: Options .
Mean (átlag): az értékek számtani közepe
Sum (összeg): az összes érték valamennyi esetre összegezve
Dispersion (szóródás)
Std. deviation (szórás): az átlag körüli szóródás mérőszáma
Variance (variancia): a szórás négyzete
Range (terjedelem): a legnagyobb és a legkisebb érték különbsége
Minimum (minimum): a legkisebb érték
Maximum (maximum): a legnagyobb érték
Display order: ha több változó leíró statisztikáit kérjük meg egyszerre, akkor eldönthetjük, hogy milyen sorrendben közölje őket:
Ascending means: az átlag szerint növekvő sorrendben
Descending means: az átlag szerint csökkenő sorrendben
Alphabetic (betűrendben)
Variable list (változólista): olyan sorrendben, ahogyan a változólistánkban van
Új változó létrehozása a COMPUTE paranccsal
Transform Compute .
A Compute utasítás általános alakja a következő: compute (cél) változónév = matematikai kifejezés[3]. Az utasítás hatása, a célváltozót - ha még nem létezett, akkor létrehozza és - egyenlővé teszi a jobb oldali kifejezés eredményével.
A 'Compute' ablakon belül beállíthatjuk a következőket:
Target variable (célváltozó): annak a változónak a neve, amelyet létre akarunk hozni vagy amelynek új értéket akarunk adni.
Numeric expression (numerikus kifejezés): ezzel lesz egyenlő a célváltozónk.
A 'Compute' ablakon belül választhatjuk még a következő ablakot: Type & Label .
Label (címke): itt rögtön megcímkézhetjük az új változónkat
Label mi adunk neki egy címkét
Use expression: a matematikai kifejezést használja címkeként
Type (típus): beállíthatjuk új változónk típusát
Numeric numerikus, tehát szám
String[4]: szöveg (maximális hosszúsága 8 karakter)
A 'Compute' ablakon belül választhatjuk még a következő ablakot is: If .
Include all cases: a kijelölt műveletet valamennyi esetet bevonva végzi el
Include if case satisfies condition: a kijelölt műveletet csak azoknál az eseteknél végzi el, amelyek megfelelnek a megadott feltételnek
F SPSS-LINK2)
Változó értékeinek átkódolása
Transform Recode .
A 'Transform' menü csak akkor jelenik meg ha az adatablak aktív. A Recode utasítás általános alakja a következő: recode változólista = (értéklista = érték) [értéklista = érték].
Into Same Variables: akkor választjuk ezt, ha már létezik az a változó, amelynek értékeit át akarjuk kódolni.
A 'Recode into Same Variables' ablakon belül beállíthatjuk a következőt:
Variables (változók): az a változó(k), amelye(eke)t át akarunk kódolni. Több változót igazából csak akkor tudunk átkódolni, ha azok eredeti kódjai megegyeznek, hiszen utasításunk mindegyikkel ugyanazt hajtja majd végre.
A új kódok beállításához válasszuk az 'Old and New Values' ablakot
Old Value: itt jelöljük ki, hogy mely értékek(ek) legyen(ek) egyenlő az új értékkel.
Value: különálló értékek megadása
System-missing: a system-missingeket számolja össze
System- or user-missing: a system- és a user-missingeket számolja össze
Range: az értékek bizonyos terjedelmének megadása
through : mettől-meddig
Lowest through : a
legalacsonyabb értéktől meddig
through highest:
mettől a legmagasabb értékig
New Value: itt jelöljük ki az új értéket. A régi és az új érték kijelölése után az 'Add' gomb megnyomásával helyezhetjük át az Old New panelre.
Value: az új érték megadása
Copy old value(s): a régivel teszi egyenlővé
Into Different Variables[5]: általában ennek a használata az előnyösebb, mert jobb, ha változóink eredeti alakjukban megmaradnak
A 'Recode into Different Variables' ablakon belül beállíthatjuk a következőt:
Numeric Variable Output: itt fog megjelenni, hogy melyik változóból, melyik változót állítjuk elő. Először a bal oldali változólistából válasszunk egy változót.
Output Variable
Name: az új változó neve
Label: az új változó címkéje
Change: ha a fentieket beírtuk, akkor meg kell nyomni ezt a gombot!!!
A új kódok beállításához válasszuk az 'Old and New Values' ablakot. Innen a parancs ugyanaz, mint az előző.
F SPSS-LINK3)
A RANK CASES parancs
Transform Rank Cases .
A Rank Cases utasításban számunkra két fontos opciót választhatunk: létrehozhatunk változókat, amelyekben az esetek rangszámokat kapnak, illetve meglévő változókat egyszerűen egyenlő nagyságú csoportokra kódolhatunk át.
Display summary tables: közli azt az összefoglaló táblázatot, amely a régi változó nevét, az új változó nevét és címkéjét tartalmazza
A 'Rank Cases' ablakon belül beállíthatjuk a következőket:
Assign Rank to 1: az első a sorban a legkisebb, vagy a legnagyobb értéket kapja-e
Smallest value: a legkisebb érték
Largest value: a legnagyobb érték
A 'Rank Cases' ablakon belül beállíthatjuk, hogy milyen típust kérünk: Rank Types .
Rank: egyszerű rangszámok. Az új változón értékként minden eset a saját rangszámát veszi fel.
Ntiles: itt a az esetekhez tartozó rangszám azon alapul, hogy az adott eset hányadik körülbelül egyenlő számú esetet tartalmazó százalékosztályba tartozik. A százalékosztályok számát magunk határozhatjuk meg.
A 'Rank Cases' ablakon belül beállíthatjuk, hogy az ugyanolyan rangszámú esetek végül milyen rangszámot kapjanak: Rank Assigned to Ties .
Mean: az átlagos rangszámot társítja az ugyanolyan értékekhez. Például a 10, 15, 15, 15, 16 számsornál a 15-ös értékkel rendelkezők mindegyike 3-as rangot kap majd.
Low: az legkisebb rangszámot társítja az ugyanolyan értékekhez. Például a 10, 15, 15, 15, 16 számsornál a 15-ös értékkel rendelkezők mindegyike 2-as rangot kap majd.
High: az legnagyobb rangszámot társítja az ugyanolyan értékekhez. Például a 10, 15, 15, 15, 16 számsornál a 15-ös értékkel rendelkezők mindegyike 4-as rangot kap majd.
Sequential ranks to unique values: az esetek 1-től D-ig kapnak rangszámokat, ahol D a különböző értékek száma. Az ugyanolyan értékkel bíró esetek ugyanolyan rangot kapnak. Itt tehát a 10, 15, 15, 15, 16 számsornál a rangok rendre a következőképpen alakulnának: 1 2, 2, 2, 3
F SPSS-LINK4)
A COUNT parancs
Transform Count .
A Count utasítás általános alakja a következő: count változónév = változólista (értéklista). Az utasítás hatása, hogy a változólistában szereplő változókban megszámolja, hogy hányszor szerepel az értéklistában felsorolt értékek bármelyike és az eredményt a baloldali változóba írja (ha még nem létezik ilyen nevű változó, akkor létrehozza).
A 'Count' ablakon belül beállíthatjuk a következőket:
Target variable (célváltozó): a fenti általános alak jobb oldalán szereplő változó.
Target label: a célváltozó címkéje
A 'Count' ablakon belül definiálnunk kell az új változónk értékeit: Define Values .
Value: itt jelöljük ki, hogy mely értékeket számolja le a program, amelyeket az 'Add' gomb megnyomásával helyezhetünk át a jobb oldali panelre. Különféle adatokat adhatunk meg és megadásuk módját is változtathatjuk.
Value: különálló értékek megadása
System-missing: a system-missingeket számolja össze
System- or user-missing: a system- és a user-missingeket számolja össze
Range: az értékek bizonyos terjedelmének megadása
through : mettől-meddig
Lowest through : a
legalacsonyabb értéktől meddig
through highest:
mettől a legmagasabb értékig
Values to Count a megszámlálandó értékek listája
F SPSS-LINK5)
A SELECT CASES parancs használata
Data Select Cases .
A 'Select' ablakon belül beállíthatjuk a következőket:
All cases: valamennyi esetet bevonja az elemzésbe
If condition satisfied: azokat az eseteket vonja be az elemzésbe, amelyek a megadott feltételt teljesítik
Random sample of cases: egy véletlen mintát vesz a mintánkból
Approximately % of all cases az összes
eset valahány százalékát veszi
Exactly from the first cases az első
valamennyi esetből pontosan a megadott mintaelemszámú mintát vesz
Based on time or case range: idő- vagy esetterjedelmen alapuló mintavétel
Use filter variable: filter-változó használata. Azokat az eseteket veszi be az elemzésbe, amelyeknél a filterváltozó értéke nem 0.
Az 'Unselected Cases Are' ablakon belül beállíthatjuk a következőket:
Filtered: a file-ra filtert tesz, ami bármikor visszavonható
Deleted: a ki nem választott eseteket végérvényesen törli az adatfile-ból
F SPSS-LINK6)
A SPLIT FILE parancs használata
Data Split File .
A 'Split File' ablakon belül beállíthatjuk a következőket:
Analyze all cases, do not create groups: ez az alapbeállítás, illetve ennek segítségével kikapcsolhatjuk a Split File beállítást
Compare groups: ha ezt az opciót választjuk, akkor az általunk megadott csoportosító változó szerinti output-ok együtt jelennek meg, hogy összehasonlításuk könnyebb legyen
Organize output by groups: ha ezt az opciót választjuk, akkor az általunk megadott csoportosító változó szerinti output-ok egymás után jelennek meg
Groups Based on: itt adhatjuk meg a csoportosító változót vagy változókat. Ha többet adunk meg, akkor a program az egyes változók kategóriáinak kombinációiban állítja elő az általunk kért output-okat
Sort the file by grouping variables: a csoportosító változó/változók szerint rendezi az adatfile-t.
File is already sorted: akkor választhatjuk ezt az opciót, ha az adatfile a csoportosító változó/változók szerint már rendezve van.
A CORR parancs használata
Pearson-féle korrelációs együttható: két, legalább intervallum szintű, változó lineáris összefüggésének mérésére alkalmas mérőszám. Értéke a zárt intervallumba esik. A negatív értékek negatív (az egyik változó értékének emelkedésével a másik értéke csökken), a pozitívak pozitív összefüggést jelentenek (az egyik változó értékének emelkedésével a másik értéke is nő), ahol a -1 és 1 a teljes lineáris meghatározottságot a 0 pedig azt jelenti, hogy a két változó között nincs lineáris összefüggés vagy más szavakkal a két változó korrelálatlan.
Spearman-féle rangkorrelációs együttható: a Pearson-féle korrelációs együttható nemparaméteres változata, amely egy számsor rangján és nem a tényleges értékeken alapul. Értéke a zárt intervallumba esik. Az 1 érték két rangszám-sorozat tökéletes egyezségét jelzi, míg a -1 esetben a kétféle sorozat pontosan fordítottja egymásnak. Ha értéke 0, az pedig azt jelenti, hogy a két rangsor között nincs kapcsolat.
Statistics Correlate Bivariate .
A 'Bivariate Correlation' ablakon belül beállíthatjuk a következőket:
Correlation Coefficients
Pearson: Pearson-féle korrelációs együttható
Spearman: Spearman-féle rangkorrelációs együttható
A ' Bivariate Correlation' ablakon belül lehetőségünk van különböző opciók választására: Options
Statistics
Means and standard deviation: átlagok és szórások megjelenítése
A MEANS parancs
Analyze Compare Means Means .
A 'Means' ablakon belül beállíthatjuk a következőket:
Dependent list (függő változólista): ezek a változóknak legalább intervallum-szintűeknek kell lenniük, hiszen csak így értelmezhető az átlag fogalma
Independent list (független változólista):
Layers (réteg): a parancs az első réteg valamennyi kategóriájában kiszámolja az átlagokat, illetve a megadott statisztikákat. Amennyiben egy következő réteget is definiálunk, akkor az átlag, illetve a kért statisztikák a két változó értékeinek valamennyi kombinációjában kiszámolásra kerülnek.
A 'Means' ablakon belül lehetőségünk van különböző opciók választására: Options
Statistics: innen kiválaszthatjuk, hogy milyen statisztikák megjelenítését kérjük a programtól. A legfontosabbak a következők:
Mean: átlag
Standard deviation: szórás
Variance: variancia
Count: gyakoriság
Sum : összeg
Statistics for first layer
ANOVA table and eta: szórásfelbontás és megmagyarázott hányad. Az ebben az alparancsban kapott F statisztika segítségével lehet eldönteni, hogy a független változó különböző kategóriáihoz tartozó függőváltozó-átlagok szignifikánsan különböznek-e.
F SPSS-LINK7)
Az itt következő meghatározások és bővebb magyarázatuk megtalálhatóak Babbie, Earl: A társadalomtudományi kutatás gyakorlata (Balassi Kiadó, Budapest, 1995.), illetve Köves Pál - Párniczky Gábor: Általános statisztika I-II. (Közgazdasági és Jogi Könyvkiadó, Budapest, 1981.) című művében.
Ez általában természetesen tartalmaz egy változónevet is, mert általában nem szoktunk egy változónak konstans értéket adni.
|