Midtbø, Tor

(2012). STATA – en entusiastisk innføring

Oslo: Universitetsforlaget ISBN: 978-82-15-01958-1 sider: 159

En god bokanmeldelse bør etter min oppfatning inneholde en overvekt av velbegrunnet og poengtert kritikk, ispedd kommentarer som komplementerer bokens innhold. Dette er dessverre ikke mulig for meg å oppnå i en anmeldelse av STATA – en entusiastisk innføring. Tor Midtbø har rett og slett skrevet en svært god innføringsbok i det statistiske analyseprogrammet STATA. Boken er velskrevet, meget innholdsrik til tross for sitt knappe sideantall (159 s.) og, som tittelen antyder, engasjerende. Boken oppnår det uttalte formålet om å gi en lettfattelig innføring i programvaren, og fordrer heller ikke at leseren har et høyt statistisk kunnskapsnivå.

Jeg er selv en ivrig STATA-bruker, og har hovedsakelig opparbeidet meg kunnskap om STATA ved bruk av programmets fantastiske hjelpefunksjon og nettbaserte ressurser. Det finnes også, som Midtbø skriver, flere gode engelskspråklige bøker om programmet. Jeg vil imidlertid anbefale studenter og andre som ønsker å lære seg STATA å anskaffe Midtbøs innføringsbok, ikke minst fordi de tidlige kapitlene i boken gir den helt elementære kunnskapen om hvordan programmet fungerer og om databehandling i STATA. Slik kunnskap kan være tidkrevende og frustrerende å finne frem til på egen hånd. Kapittel 2 gir en svært oversiktlig presentasjon av programmets oppsett og grunnleggende kommandoer, og kapittel 3 gir en fin oversikt over databehandling. Imidlertid inneholder disse kapitlene mange nyttige kommandoer og tips som kan ha gått mer erfarne brukere av programmet forbi. STATA er et rikt program som tilbyr mange muligheter, og etter å ha lest Midtbøs bok har undertegnede for eksempel blitt bevisst programmets kalkulator og assert-kommandoen som «bekrefter eller avkrefter sannhetsgehalten i et uttrykk» (s. 50).

De gjenværende kapitlene dekker på en god måte univariat analyse (kap. 4); bivariat analyse knyttet til for eksempel krysstabulering og korrelasjonsanalyse (kap. 5); bivariat regresjonsanalyse og regresjonsdiagnostikk (kap. 6); samt multivariat regresjonsanalyse, inkludert samspillsmodeller og kvadratiske modeller (kap. 7). Både sentrale og enkelte mindre sentrale kommandoer er dekket, og Midtbø supplerer gjennomgangen av STATA med kortfattede og presise beskrivelser av statistisk teori der det er nødvendig. Et godt eksempel på dette er kapittel 7.2, som begynner med en kort oppsummering av logikken som ligger under den multivariate regresjonsmodellen. Et annet godt eksempel er kapittel 6.8, som på én side eksemplarisk redegjør for forskjellene mellom «uteliggere», «tunge enheter» og «betydningsfulle enheter».

Fire andre aspekter ved boken bør fremheves. For det første kan dataene og syntaksfilene (do-filene) brukt til eksempelanalysene i STATA – en entusiastisk innføring enkelt lastes ned fra nett. Dette er et flott hjelpemiddel for studenter og andre som ønsker å lære programmet, siden man kan følge analysene skritt for skritt, og eventuelt i forlengelsen forsøke å endre på kommandoer eller skrive egne. Midtbø oppfordrer leseren på det sterkeste til å gjøre nettopp dette, og ikke uten grunn. Visse aktiviteter, som brystsvømming og gjennomføring av analyser i STATA, er enklere å lære seg dersom beskrivelse forenes med praksis. For det andre gir boken mange gode praktiske råd som kan komme leseren til nytte. Spesielt bra i så måte er diskusjonen om hvordan (og hvorfor) benytte do-filer. Her viser Midtbø til alle fordelene ved å gjennomføre analysen ved hjelp av slike filer. Den pragmatiske diskusjonen om hvordan man først kan benytte programmets meny for deretter å lime den resulterende kommandoen inn i do-filen ved generering av figurer, er ett eksempel på hvordan boken gir svært konkrete og gode råd og tips. Det tredje aspektet er at boken på en fin måte vever inn mer generelle diskusjoner om forskningsstrategier og endog forskningsetikk. Diskusjonen knyttet til testing av forutsetningene for regresjonsmodellen i kapittel 1 er et eksempel. Diskusjonen av syntaksfiler og muligheter for replikasjon i kapittel 2 er et annet. Endelig vil jeg fremheve informasjonsrikdommen; selv mangeårige brukere av STATA kan lære noe nytt om programmet fra denne boken.

Jeg har imidlertid én innvending. Boken er som nevnt rik på informasjon, ikke minst med hensyn til antall kommandoer. Både helt sentrale kommandoer og litt mer perifere følger gjerne etter hverandre i sekvens. Dette er uproblematisk for godt motiverte og nysgjerrige lesere som ønsker å lære så mye av programmet som mulig. Imidlertid kan det godt tenkes at mange nybegynnere i STATA ønsker å bruke boken mer som et oppslagsverk, og lete etter de nødvendige kommandoene som trengs for å komme videre med sin bestemte analyse. Dette kunne boken ha løst for eksempel ved å ha en oppsummerende liste over de mest sentrale kommandoene, med korte beskrivelser, etter hvert kapittel. Enkelte mindre sentrale avsnitt kunne også godt ha vært flyttet til appendiks, eller lagt i egne tekstbokser, for bedre å fremheve hvilke kommandoer som er mer og hvilke som er mindre viktige å ha et fast grep om. Bokens sammenhengende tekst gjør den altså fornøyelig å lese fra perm til perm, men gjør den også til et mindre tidseffektivt oppslagsverk. Nå skal det sies at STATAs hjelpefunksjoner på en god måte kan ta seg av det sistnevnte aspektet, men det er ikke store grep som trengs for at også en eventuell revisjon av Midtbøs bok skal kunne fungere på samme måte.

Ikke bare er Midtbøs innføringsbok fornøyelig lesning, den er også viktig: Å lære seg ny programvare er en prosess der kostnadene og frustrasjonen kommer tidlig, mens gevinstene først kommer senere. I tillegg kan det være vanskelig for uinnvidde å skaffe seg en oversikt over hvor store kostnadene ved å lære seg programmet faktisk er. Mange studenter og andre vil dermed – ofte på feilaktig grunnlag – velge å ikke lære seg et program som STATA, til tross for at gevinstene er store. En lettfattelig og engasjerende innføringsbok kan derfor spille en vesentlig rolle ikke bare ved å redusere kostnadene med å lære seg ny programvare, men også ved å sikre at forsøket ikke blir gitt opp i løpet av de første dagene (eller før det har begynt). Konsekvensen av det sistnevnte er at studenter, forskere eller byråkrater ikke tilegner seg det nødvendige verktøyet for å kunne utføre analysene som er best tilpasset problemstillingene og datamaterialet de står ovenfor.

Jeg møter hvert semester studenter som ønsker å lære seg STATA for å kunne gjennomføre bestemte analyser til hjemmeoppgaver eller masteroppgaver. Disse studentene spør ofte om hjelp og råd om hvordan de bør gå frem. Mitt første råd vil fra nå av være: Les STATA – en entusiastisk innføring!