Bearbeiding av datamaterialet

Dersom dere har gjennomført en kvantitativ undersøkelse må datamaterialet systematiseres i en matrise. En datamatrise er en tabell som inneholder informasjon om hver enkelt enhets verdi på variablene. Dersom man gjennomfører en undersøkelse basert på eksisterende statistikk er ofte datamatrisen utgangspunktet for prosjektet. Har man imidlertid selv gjennomført en spørreundersøkelse så må de besvarte spørreskjemaene bearbeides til en slik matrise.

Vi husker at variablene er de egenskapene man undersøker, i et spørreskjema vil derfor hvert spørsmål være en variabel. Svaralternativene er de mulige verdiene hver enhet kan ha på disse variablene. Når vi lager en datamatrise bruker vi et tall for å beskrive egenskapen (verdien) hver person som har svart på spørreskjemaet har på de ulike variablene. Alle svaralternativ som ikke er et tall (ja/nei,mann/kvinne) blir definert om til et tall. Nedenfor ser vi hvordan et enkelt spørreskjema kan oversettes til en datamatrise.

 

Dette arbeidet kan gjøres i et regneark eller i et statistikkprogram som NSDstat. Vi gjør dette arbeidet for å enklere kunne gjøre analyser av datamaterialet. I eksempelet vårt blir det ved å legge inn de besvarte spørreskjemaene i en matrise for eksempel enkelt å regne ut hva som er gjennomsnittlig månedslønn for alle som har deltidsarbeid og hva som er gjennomsnittet for de ulike skoletrinnene. Dersom dere har valgt å ta utgangspunkt i eksisterende statistikk er gjerne datamaterialet ferdig bearbeidet i en datamatrise. Dere bør da bruke tid på å sette dere inn i dokumentasjonen som skal følge med datasettet. Her skal det fremgå hvilke spørsmål som er stilt, hvordan materialet er samlet inn etc.

For å undersøke problemstillingene er det vanlig at man må kode om enkelte av variablene i datasettet. Dette gjelder både analyser av egne datasett og av eksisterende datasett. Å kode om en variabel betyr at man endrer hvilke verdier enhetene kan ha på variabelen. Variabelen "brutto månedslønn" i eksempelet vårt består i utgangspunktet av det kronebeløpet respondentene har oppgitt i spørreskjemaet. Dersom analysen eller problemstillingen krever det kan vi imidlertid definere alle beløp over f.eks 2000 kroner til verdien "høy lønn", alle beløp mellom 1000 og 1999 kroner kan defineres som "middels lønn" og alle beløp under 1000 kroner til "lav lønn". Ved å kode om variabelen på denne måten kan vi også bruke den i krysstabeller.

I kvalitative forskningsopplegg er bearbeiding og systematisering av datamaterialet i større grad en del av selve analysearbeidet. Vi skal derfor komme nærmere inn på dette i neste kapittel. Blant forskere er det vanlig å transkribere intervjuer, det vil si at man skriver ut ordrett det som blir sagt på lydopptaket. Dette er en ganske tidkrevende prosess fordi det tar mange ganger lenger tid enn opptakets varighet. Vi anbefaler derfor ikke
at dere transkriberer intervjuene. Istedenfor bør dere høre på dem – gjerne flere ganger. Underveis kan dere gjøre notater om særskilt interessante ting som blir sagt. Når dere skal skrive forskningsrapporten kan dere så transkribere de sekvensene som vil siteres.