Philip Converse viste i en banebrytende studie - «The Nature of Belief System» fra 1964 - at folk flest ikke evner å sette politiske stridsspørsmål i sammenheng med hverandre: Folks holdninger var nemlig i liten grad konsistente i tid og rom (constrained). På dette området avvek borgerne fundamentalt fra den politiske eliten, hvis holdninger var konsistente i tid og rom. Konklusjonen var at ideologi er forbeholdt eliter, og en lite utviklet egenskap blant folk flest. De fleste velgere forsto politikk ut fra snevre gruppeinteresser, mange la ikke annet enn «tidsånden» til grunn, mens en betydelig andel ikke hadde noen forståelse for politikk i det hele tatt. Dette i sterk kontrast til de politiske elitene, som forsto politikk ut fra abstrakte ideologiske begreper. Stadig ifølge Converse.

Senere har Converse møtt kritikk både når det gjelder teoretisk og teknisk tilnærming til problemstillingen (Pierce & Rose 1974; Achen 1975; Judd & Milburn 1980; Scarbrough 1984). Artikkelen har likevel hatt så stor innflytelse på senere forskning at konklusjonen hans fremdeles lever i beste velgående og brukes særlig for å vise at velgerne ikke tenker ideologisk. Dette inntrykket kommer ikke minst til uttrykk i media, hvor velgerne fremstår som en gruppe individer som ikke er i stand til å tenke stort lenger enn til dagens saker og kandidater.

Det norske valgprosjektet har på sin side lenge tegnet et annet bilde av velgernes evne til å se saker i sammenheng. Med en mer avansert teknikk - en såkalt faktoranalyse - viste Olof Petersson & Henry Valen (1979) tidlig at både norske og svenske velgere hadde konsistente holdninger til politiske stridsspørsmål. I det senere har valgprosjektet imidlertid ikke stolt helt på resultatene fra nevnte teknikk, og har i tillegg begynt å etter-

* Denne artikkelen er en revidert utgave av min selvvalgte prøveforelesning til dr.polit.graden. Mange har blitt rådspurt, men jeg vil særlig takke Arne Kolstad og KnutAndreas Christophersen for gode diskusjoner, samt tidsskriftets to anonyme konsulenter for gode innspill.

prøve resultatene med andre teknikker. Det har særlig vist seg problematisk å bringe resultatene fra faktoranalysen over i andre former for analyse, så fra valget i 1993 har prosjektet gått et skritt videre og konstruert additive indekser på bakgrunn av faktoranalysen (Aardal & Valen 1995; Aardal 1999; Aardal 2003). I tillegg finnes det også kumulative indekser, som jeg tar opp til slutt.1 Alle disse teknikkene bygger på en eller måte videre på fremgangsmåten som Converse i sin tid benyttet.

Det kan altså legges en masse statistisk arbeid bak konstruksjonen av indekser, og et spørsmål som melder seg er: Har det noen hensikt? Gir ulike teknikker forskjellige resultater? I så fall, er noen av dem bedre enn andre slik at man kan begrense seg til en av dem? Dessuten, i hvilken grad bidrar kunnskap om indikatorenes substansielle innhold til å finne frem til gode indekser? Jeg skal belyse disse spørsmålene ved å analysere et datasett som ligner det Converse benyttet seg av - det vil si et sett av identiske spørsmål som er rettet både til en politisk elite og til et representativt utvalg av befolkningen.

Selv om studieobjektet for analysene er begrepet «ideologi», er siktemålet med artikkelen mer generelt; nemlig at betraktninger rundt det substansielle innholdet i indikatorene kanskje er viktigere enn de statistiske kriteriene. De statistiske kriteriene må selvsagt være på plass, men det er i seg selv ingen garanti for at indeksen holder vann. Dette fordi en rekke fenomener korrelerer med hverandre selv om de egentlig ikke har så mye med hverandre å gjøre. Statistisk programvare tar ikke hensyn til dette og er en side ved indekskonstruksjon som kan være vanskelig å få tak i gjennom metodelitteraturen. Siktemålet her er å få frem at dette er et kritisk aspekt ved indekskonstruksjon, og at man kan havne langt unna målet hvis man bare orienterer seg etter statistiske kriterier. Hensikten er å få frem at den kvalitative siden ved indekskonstruksjon er vel så viktig som den kvantitative, og den teoretiske (eller substansielle) biten er vel så viktig som den matematiske. Jeg skal derfor legge matematiske betraktninger til side, og tar sikte på å drøfte de empiriske resultatene i forhold til deres substansielle innhold.

Dette er vanskelig å illustrere uten et konkret studieobjekt, og det benyttede datasettet er valgt ut fordi det klart får frem det metodologiske poenget. Målinger av ideologi er dessuten gjenstand for en løpende faglig debatt, og i den forstand skal det ikke underslås at analysen også har faglig interesse innenfor sitt felt.

Artikkelen starter med å presentere datamateriale, indikatorer og den refleksive målemodellen som ligger til grunn for den type indekser det her er snakk om. Deretter anvendes fire ulike teknikker for å vurdere om indikatorene gir grunnlag for å konstruere indekser. Jeg starter med korrelasjonsanalyser, som er den teknikken Converse benyttet, og følger opp med faktoranalyser etter mønster av Petersson og Valen. Dernest undersøkes grunnlaget for å konstruere additive indekser, og til slutt blir kumulativiteten i materialet testet med en teknikk kalt Mokkenskalering. De statistiske målene for å vurdere om holdningene er konsistente eller ikke, baserer seg på svarmønstrenes indre konsistens. Den siste teknikken går lenger enn de andre, og begrenser seg ikke til korrelasjonene mellom variablene, men tester også om svarmønstrene er konsistente på individnivå. Avslutningsvis diskuteres resultatene og relevansen av funnene i forhold til annen forskning.

DATA

Datamaterialet kommer fra den norske delen av en felles nordisk parlamentarikerundersøkelse kalt NORDLEG som ble gjennomført vinteren 1996 (Esaiasson & Heidar 2000). I forbindelse med denne studien ble identiske spørsmål rettet til et representativt utvalg av norske borgere påfølgende høst, slik at det er mulig å sammenligne de to nivåene slik Converse gjorde. Respondentene ble bedt om å bedømme tretten forslag som har vært oppe i den politiske debatten langs en skala: svært godt, ganske godt, verken godt eller dårlig, ganske dårlig og svært dårlig. Spørsmålsformen ble i sin tid utviklet av Rensis Likert og er mye brukt av samfunnsvitere for å måle teoretiske begreper (Vogt 1993:128). Forslagene er gjengitt i tabell 1.

Tabell 1. Spørsmålsformuleringer og variabelnavn Nedenfor nevnes en rekke forslag som har vært tatt opp i den politiske debatten. Hvordan bedømmer du de enkelte forslag? (svært bra, ganske bra, verken bra eller dårlig, ganske dårlig, svært dårlig)

1. minske den offentlige sektor (off)

2. minske forsvarsutgiftene (forsvar)

3. øke skatten på høye inntekter (skatt)

4. minske inntektsforskjellene i samfunnet (inntekt)

5. drive mer av helsevesenet i privat regi (helse)

6. innføre seks timers arbeidsdag for alle yrkesaktive (arbdag)

7. forby alle former for pornografi (porno)

8. ta i mot færre flyktninger til Norge (flykt)

9. stanse privatbilismen i bysentrene (bilist)

10. redusere tempoet i oljeproduksjonen (tempo)

11. redusere omfanget av utbyggingen av veier og tunneler i distrikts-Norge (veier)

12. forby inngrep i naturlige arveanlegg hos mennesker og dyr (gener)

13. gi større prioritet til distriktene ved fordeling av statstilskudd (distrikt)

I hovedsak er tanken at spørsmålene skal tappe venstre-høyredimensjonen i nordisk politikk, men den norske delen inneholdt også noen spørsmål som hører hjemme på andre dimensjoner - økonomisk vekst versus naturvern, en moralsk- religiøs dimensjon, i tillegg til et spørsmål om distriktspolitikk. Parlamentarikerundersøkelsen består av 142 respondenter, velgerundersøkelsen av 1316.

Formålet videre er altså å undersøke i hvilken grad spørsmålene gir grunnlag for å konstruere indekser for ideologiske dimensjoner blant norske parlamentarikere og norske velgere med fire forskjellige teknikker. Men før jeg går løs på analysen skal jeg si noen ord om refleksive målemodeller - siden alle teknikkene, slik de blir benyttet her, har bakgrunn i denne.

REFLEKSIVE MÅLEMODELLER

Som mange andre samfunnsvitenskapelige fenomener er ideologiske dimensjoner generelle og abstrakte fenomener som ikke lar seg observere direkte. Kompleksiteten tilsier at vi må vi stille flere spørsmål som på ulike måter omhandler bestemte ideologiske ideer for på den måten å fange opp ulike sider ved begrepet. Klarer vi det, kan vi på ulike måter kombinere spørsmålene og oppnå et godt empirisk mål som fanger opp det teoretiske begrepet vi er ute etter.

Et første skritt er å identifisere målemodellen. I vårt tilfelle om ideologi ligger det en forestilling om at ideologi er et ikke-observerbart fenomen som ligger bak og styrer responsene. Svarene som avgis antas å ha opphav i en felles bakenforliggende variabel, det vil si at vi står overfor en refleksiv målemodell. Figur 1 gjengir variabelstrukturen i en refleksiv målemodell med eksempler fra datamaterialet som skal legges under lupen.2

FIGUR 1.EKSEMPEL PÅ REFLEKSIV MÅLEMODELL

I eksemplet antar vi at representanter og velgere befinner seg ett eller annet sted langs noe vi foreløpig kan kalle for en venstre-høyredimensjon, og at det er denne posisjonen som styrer svarene

deres når de bedømmer de ulike forslagene. Forestillingen er altså at svarene er påvirket av respondentenes «sanne» posisjon på den teoretiske dimensjonen. Det betyr igjen at vi kan anta at en kom-

binasjon av de tre spørsmålene gir oss et grunnlag til å beregne hvor respondentene befinner seg langs denne dimensjonen. Dette innebærer at vi kan måle den teoretiske variabelen indirekte via spørsmål av mer konkret art. Men det holder selvsagt ikke at vi tror at det er slik, vi må også forsikre oss om at antagelsen holder stikk empirisk.

Siden vi antar at vurderingen av forslagene er styrt av samme bakenforliggende variabel, må det nødvendigvis være slik at det foreligger indre konsistens mellom svarene som avgis. Hvis det ikke foreligger en empirisk sammenheng mellom dem, er det heller ingen grunn til å tro at svarene er påvirket av samme bakenforliggende fenomen. Det er imidlertid flere måter å avgjøre hvorvidt de empiriske sammenhengene er konsistente nok, og spørsmålet artikkelen reiser er om dette gir grunnlag for forskjellige resultater. I tillegg stilles det spørsmål ved om vi virkelig kan slå oss til ro med empiriske kriterier uten å ta hensyn til annen informasjon enn den rent statistiske. Dette siste spørsmålet er betimelig fordi statistiske teknikker baserer seg på tekniske kriterier uten hensyn til teoretiske betraktninger.

KORRELASJONSANALYSE

Jeg starter med fremgangsmåten til Converse, som sammenlignet bivariate korrelasjonskoeffisienter på elite- og velger- plan.3 Han vurderte holdningskonsis- tens ut fra styrken på disse koeffisientene, som varierer mellom -1 og 1. Positive fortegn angir at det gjennomgående er slik at hvis det ene forslaget vurderes positivt, så vurderes også det andre forslaget positivt. Negative fortegn angir at

TABELL 2.KORRELASJONER MELLOM INDIKATORENE BLANT NORSKE PARLAMENTARIKERE (NEDRE DIAGONAL) OG VELGERE (ØVRE DIAGONAL). PEARSON'S R

Off

For-

Skatt

Inntekt

Helse

Arb-

Porno

Flykt

Bilist

Tempo

Veier

Gener

Dis-

svar

dag

trikt

Off

-0,01

-0,19

-0,18

0,31

-0,17

-0,13

0,08

-0,08

-0,04

0,07

-0,06

-0,17

Forsvar

-0,60

0,10

0,13

-0,01

0,09

0,00

-0,09

0,10

0,09

0,02

0,08

-0,05

Skatt

-0,81

0,53

0,36

-0,22

0,21

0,17

0,02

0,16

0,15

-0,03

0,06

0,17

Inntekt

-0,70

0,43

0,84

-0,17

0,18

0,21

-0,09

0,16

0,17

-0,05

0,07

0,17

Helse

0,84

-0,58

-0,78

-0,73

-0,09

-0,10

0,10

-0,07

-0,01

0,03

-0,04

-0,08

Arbdag

-0,47

0,47

0,45

0,41

-0,41

0,20

-0,02

0,14

0,10

0,03

0,02

0,15

Porno

-0,43

0,27

0,38

0,40

-0,42

0,35

-0,05

0,17

0,12

0,02

0,10

0,19

Flykt

0,52

-0,40

-0,55

-0,57

0,55

-0,32

-0,31

-0,09

-0,10

0,00

-0,06

0,11

Bilist

-0,58

0,46

0,55

0,53

-0,60

0,48

0,33

-0,42

0,22

0,06

0,12

0,11

Tempo

-0,24

0,15

0,34

0,39

-0,25

0,38

0,35

-0,34

0,42

0,09

0,14

0,11

Veier

0,08

0,15

-0,06

-0,11

0,00

0,04

-0,14

-0,06

0,07

0,05

0,08

-0,13

Gener

-0,25

0,15

0,30

0,38

-0,29

0,37

0,28

-0,25

0,39

0,42

-0,08

0,10

Distrikt

-0,43

0,16

0,45

0,39

-0,48

0,36

0,47

-0,28

0,41

0,46

-0,20

0,32

hvis det forslaget blir oppfattet å være godt, så oppfattes det andre å være dårlig. Jo nærmere 1 (eller -1), dess sterkere tendens til at svarene har sammenheng med hverandre. Det eksisterer imidlertid ingen klare kriterier for hvor sterke koeffisientene må være, men en tommelfingerregel sier at indikatorer med korrelasjoner mellom 0,3 og 0,8 kan inngå i en indeks (Hellevik 1991:275). Tabell 2 gjengir korrelasjonene for både parlamentarikere og velgere. Korrelasjoner som tilfredsstiller tommelfingerregelen er uthevet.

Tallenes tale for parlamentarikerne er krystallklar: De bivariate sammenhengene er sterke, og sammenhengene befinner seg generelt godt innenfor tommelfingerregelens domene - det vil si at de er høyere enn 0,3. Dette skaper problemer fordi de empiriske argumentene ikke stemmer overens med de teoretiske - og antyder at det er færre dimensjoner enn vi antok. Det betyr at vi har empiriske argumenter for å kombinere indikatorer som vi ikke har grunn til å tro hører sammen teoretisk.

Forslagene om å forby biltrafikk i bysentre, redusere tempoet i oljeproduksjonen og å forby pornografi har alle en sterk sammenheng med flere av de «naturlige» indikatorene på venstre-høyredimensjonen. Det foreligger således empiriske argumenter for å innlemme dem i en og samme indeks, selv om de virker teoretisk fjerne fra det vi vanligvis vil koble til venstre- høyreproblematikk. Det innebærer at det empiriske argumentet blir meningsløst. Ser vi nøyere etter, er det likevel mulig å bruke styrkeforskjellene til å konstruere indekser som også hører sammen teoretisk, men en slik fremgangsmåte blir fort tungvinn og skjønnsmessig.

Det er likevel sjelden samfunnsforskere står overfor så sterke sammenhenger, og det er interessant å se om tommelfingerregelen egner seg bedre på velgerdataene. Styrken på disse koeffisientene ligner mer på den empiriske verden samfunnsforskerne vanligvis sysler med. Sammenhengene er markant lavere enn for parlamentarikerne, delvis fraværende, og det er kun to par av indikatorer som tilfredsstiller tommelfingerregelen - nemlig forslaget om å øke skatten og minske inntektsforskjeller samt forslagene om å minske offentlig sektor og drive mer av helsevesenet i privat regi. Muligheten for å konstruere refleksive indekser blant velgerne på bakgrunn av empiriske argumenter er således små - og består i beste fall av to spørsmål. Noe som synes å være litt for spinkelt til å fange opp en kompleks underliggende teoretisk dimensjon.

Med bakgrunn i denne fremgangsmåten ville vi altså bli nødt til å konkludere med at Converse hadde rett - ideologi er noe som er forbeholdt eliten, velgerne er i liten grad i stand til å se saker i sammenheng. Teknikken synes imidlertid mindre egnet til å legge noe empirisk grunnlag for å konstruere indekser - heller ikke på elitenivå. Her henger jo alt i hop.

***

Flere har ment at Converse ikke ville vært så dyster på velgernes vegne om han hadde benyttet mer avanserte teknikker. Etter hvert som programvaren har blitt sterkere har det blitt enklere å anvende mer avanserte analyser som for eksempel faktoranalyse, en analyseteknikk som er skreddersydd for å spore opp underliggende dimensjoner på bakgrunn av refleksive indikatorer. Teknikken er eksplorerende i den forstand at den konstruerer dimensjoner på bakgrunn av korrelasjonsmatrisen for de empiriske indikatorene4 - altså matrisen som nettopp er analysert.

FAKTORANALYSE

Spørsmålene er utarbeidet for å måle ideologiske dimensjoner vedrørende moral-religion, vekst-vern og sentrum- periferi i tillegg til konflikten mellom venstre- og høyresiden i norsk politikk. Det dreier seg altså i prinsippet om fire distinkte dimensjoner, og faktoranalyse er en velbrukt teknikk som gjør det mulig å undersøke flere dimensjoner samtidig.

Det foreligger flere måter å utføre faktoranalyse på, og dette kan gi forskjellige resultater, men for ikke å komplisere fremstillingen mer enn nødvendig skal jeg begrense meg til én fremgangsmåte i denne fremstillingen. Jeg har valgt å presentere den formen som er mest vanlig,

og som også er den Olof Petersson og Henry Valen i sin tid benyttet. Der dreier seg om prinsipale komponenters metode (heretter kalt pc-metoden). Metoden reduserer et større sett av korrelerte variabler til mindre grupper av teoretiske variabler - såkalte komponenter eller faktorer. Det er dessuten vanlig å rotere løsningen slik at komponentene forklarer mest mulig av den statistiske variasjonen i materialet. Det er vanlig å oppgi faktorladningene - som angir styrken på sammenhengen mellom indikatorene og faktorene. Faktorladningene varierer mellom -1 og 1, og kan tolkes på noenlunde på samme måte som korrelasjonskoeffisienter (se for eksempel Kim & Mueller 1978; Norusis 1988).

TABELL 3A.FAKTORLADNINGER. PC-METODE, VARIMAX ROTASJON.

Parlamentarikere

komponent

1

2

3

Off

-,89

Helse

-,89

Skatt

,85

Forsvar

,76

Inntekt

,76

,32

Flykt

-,61

Bilist

-,57

,53

Tempo

,84

Gener

,71

Distrikt

,31

,56

-,43

Arbdag

,45

,54

Porno

,36

,43

-,37

Veier

,88

TABELL 3B.FAKTORLADNINGER. PC-METODE, VARIMAX ROTASJON. VELGERE

Komponent

1

2

3

4

Inntekt

,67

Skatt

,65

Arbdag

,49

Helse

,76

Off

,70

Gener

,60

Tempo

,30

,55

Veier

,54

Bilist

,32

,50

Porno

,34

,34

Distrikt

,30

,67

Forsvar

,52

-,55

Flykt

,42

,55

Også her må vi basere oss på noen løse regler for avgjøre om en gitt indikator tilhører en bestemt faktor, og 0,3 i positiv eller negativ retning er et slikt anbefalt nivå. Tommelfingerregelen ligger således på samme nivå som i forutgående analyse.

Tabell 3a og 3b gjengir faktorladningene for henholdsvis parlamentarikere og velgere og viser bare ladninger som er høyere enn 0,30. Jeg har valgt en fri løsning når det gjelder antall faktorer, det vil si at jeg overlater til programmet å bestemme antall teoretiske variabler.

Det første vi merker oss er at faktorkompleksiteten er større blant velgerne enn blant parlamentarikerne, noe som antyder at velgerne er mindre konsistente enn parlamentarikerne. Det trenger likevel ikke innebære noe mer enn at innslaget av målefeil er større blant velgerne enn blant representantene. På den annen side er det store forskjeller mellom velgere og representanter når det gjelder faktorenes innhold. For begge gjelder det at første faktor dreier seg om konflikter knyttet til motsetningen mellom sosialistiske og borgerlige partier i norsk politikk. Likevel, blant politikerne er det synet på størrelsen av offentlig sektor og privat innslag i driften av helsevesenet som lader høyest på denne faktoren. Blant velgerne utgjør disse spørsmålene en dimensjon for seg selv - nummer to.

Innholdet i de andre dimensjonene er nokså diffust, og selv om vi aner at de omhandler dimensjoner av typen moral-religion, vekst-vern og sentrum- periferi, er hovedinntrykket at det fler-

dimensjonale bildet er grunnleggende uklart.

Metoden er sårbar for hvilke og hvor mange spørsmål som inkluderes, og siden vi har med flest spørsmål som angår venstre-høyredimensjonen, er det naturlig at den trer tydeligere frem enn andre dimensjoner. Blant politikerne er det dessuten en klar tendens til at de fleste spørsmålene - 10 av 13 - lader på venstre-høyredimensjonen, men også blant velgerne lader uforholdsmessig mange spørsmål på denne dimensjonen. Problemet er - igjen - at mange av dem ikke hører «naturlig» hjemme på denne dimensjonen. Vi ser også at flere av spørsmålene lader høyt på flere enn én faktor. Det antyder at de har opphav i flere teoretiske variabler, noe som bidrar til å forvirre bildet ytterligere.

Det er mulig å lagre faktorskårene som egne variabler, og betrakte dem som en form for indekser og benytte dem som variabler i andre sammenhenger. Disse skårene vil primært være et uttrykk for de variablene som lader høyest, men vil også være påvirket av variabler med lave ladninger. Dette kan skape problemer, og særlig i vårt tilfelle - hvor flere variabler lader sterkt på flere faktorer og på faktorer hvor de ikke hører hjemme. Bruk av faktorskårer innebærer at vi får med oss unødvendig mye statistisk «støy» i de teoretiske variablene. Noe som selvsagt ikke er ønskelig.

Denne faktoranalysen5 har dermed ikke bidratt å kaste så veldig mye lys over ideologiske dimensjoner - verken blant parlamentarikere eller velgere. Den har likevel brakt oss et skritt videre. Faktoranalysen antyder nemlig at velgerne tenker mer konsistent enn den enkle korrelasjonsanalysen tilsa. Jeg skal derfor prøve ut to analyseteknikker som tar for seg en dimensjon om gangen for å se om det ideologiske bildet blir ryddigere på den måten. Jeg begrenser meg til nå til venstre-høyredimensjonen av den enkle grunn at denne har best dekning i spørsmålsbatteriet.

ADDITIV SKALERING

En additiv indeks baserer seg på summen eller gjennomsnittet av verdiene på settet av indikatorene som inngår i indeksen, og kalles derfor for additive indekser. Her vil det si at vi måler ideologisk orientering ut fra summen av indikatorene som inngår i indeksen. Metoden differensierer responsene på bakgrunn av all foreliggende systematisk variasjon i svarmønstrene, og behandler alle indikatorer som likeverdige. Den tar således ikke hensyn til at noen av indikatorene kan være viktigere enn andre, noe som er et viktig moment siden metoden forutsetter at indikatorene trekkes fra samme underliggende kontinuum (McIver & Carmines 1981:23). Man kan tenke seg en mengde ulike indikatorer som kan trekkes fra et slikt kontinuum, noe som peker i retning av at indikatorene er gjensidig utskiftbare.

Spørsmålsbatteriet inneholder seks forslag med antatt opphav i det tradisjonelle skillet mellom borgerlige og sosialistiske partiet og den tilhørende venstre- høyredimensjonen i norsk politikk: Min- ske offentlig sektor, øke skatten på høye inntekter, minske inntektsforskjellene, drive mer av helsevesenet i privat regi, minske forsvarsutgiftene og ta imot færre flyktninger.

De fire første kretser rundt det økonomiske aspektet ved konflikten. Forsvarsspørsmålet relaterer seg til venstre-høyredimensjonen ved at borgerlige partier har vært mer ivrige til å bevilge penger til forsvaret enn de sosialistiske partiene. Flyktningspørsmålet nevnes ofte i termer

av venstre og høyre, hvor de som er restriktive til flyktninger hevdes å høre hjemme på høyresiden. Selv om utvelgelsen av nettopp disse variabler har støtte i resultatene i den forutgående faktoranalysen - og derved følger en innarbeidet prosedyre for utvelgelse av indikatorer - er det viktig at å presisere at utvelgelsen primært er drevet frem av teoretiske betraktinger. Valget ville falt på disse seks utvalgte spørsmålene også uten den forutgående faktoranalysen.

Cronbachs alfa er målet som anvendes for å bedømme indekserbarheten i forhold til additive indekser. Den måler intern konsistens for et gitt sett av indikatorer på bakgrunn av gjennomsnittlig korrelasjon mellom indikatorene og antall indikatorer (McIver & Carmines 1981:29). Alfa varierer mellom 0 og 1, og jo nærmere 1, dess høyere intern konsistens mellom indikatorene. Det eksisterer ingen kritiske grenseverdier for Cronbachs alfa i den forstand at vi kan henvise til noen statistisk test. Det er imidlertid utarbeidet skjønnsmessige kriterier som varierer med det substansielle fenomen man er ute etter å måle. For ideologi, slik begrepet behandles her, er 0,5 er angitt som nedre grense for indekserbarhet (Nunnally 1967:226). Er man ute etter å måle tilstander som er mer stabile og robuste enn fenomenet som er gjenstand for denne diskusjonen, må man operere med høyere grenseverdier.

Det må også nevnes at størrelsen på alfa avhenger av antall indikatorer, noe som gjør at man også bør rapportere hvor mange indikatorer som inngår. Det skulle være klart at indeksen ikke har mye substansiell verdi hvis alfaverdien er høy bare som en følge av at man har lagt inn mange indikatorer. Resultatene fra reliabilitetstesten med seks indikatorer for parlamentarikerne er gjengitt i tabell 4a.

TABELL 4A.RELIABILITETSANALYSE FOR INDEKS MED SEKS INDIKATORER. PARLAMENTARIKERE

Felleskorrelasjon

Kvadrert skalakorrelasjon

Alfa hvis

Utelatt

Off

,85

,78

,88

Skatt

,86

,81

,88

Forsvar

,60

,39

,92

Inntekt

,78

,73

,89

Helse

,85

,76

,88

Flykt

,59

,37

,92

Standardisert alfa = ,91

Reliabilitetstesten viser at vi godt kan inkludere alle spørsmålene i en og samme indeks - alfaverdien ligger over 0,90. Korrelasjonene mellom spørsmålene er således svært høy. Likevel, inn-

holdsmessig vil substansen i en slik indeks være flertydig siden spørsmålene dreier seg om ganske så forskjellige temaer som økonomi, forsvar og flyktningpolitikk. Et viktig poeng med indek-

ser er at de skal være mest mulig i samsvar med den teoretiske variabelen. Selv om alle indikatorene over kan knyttes til konflikten mellom sosialistiske og borgerlige partier, vil det være en fordel å rendyrke innholdet. Med alle seks indikatorer inne, får vi ikke vite så mye mer om hva den teoretiske variabelen måler enn om vi hadde anvendt det mer abstrakte skalaspørsmålet om egenplassering langs venstre-høyredimensjonen.

På den annen side, går vi tallene nærmere etter i sømmene, finner vi at synet på forsvars- og flyktningpolitikk korrelerer langt svakere med skalaen enn de andre. Dette ville vi ikke oppdaget om vi utelukkende hadde forholdt oss til alfaverdiene. Det virker dessuten rimelig at det er nettopp disse to som utmerker seg siden indikatorene ikke omhandler økonomiske spørsmål slik de fire andre gjør. Neste skritt er derfor å gjenta analysen uten disse to - og resultatet er gjengitt i tabell 4b.

TABELL 4B.RELIABILITETSANALYSE FOR INDEKS MED FIRE INDIKATORER. PARLAMENTARIKERE

Felleskorrelasjon

Kvadrert skalakorrelasjon

Alfa hvis utelatt

Off

,85

,77

,91

Skatt

,88

,80

,90

Inntekt

,80

,72

,93

Helse

,85

,75

,91

Standardisert alfa = ,93

Alfaverdien stiger når vi utelater de ikkeøkonomiske indikatorene, noe som innebærer at den interne konsistensen har økt. Det betyr at synet på forsvars- og flyktningpolitikken har virket forstyrrende på de individuelle svarmønstrene i de økonomiske spørsmålene. Vi får nå heller ingen signaler om at indeksen vil bli bedre hvis vi fjerner flere variabler, og alle de fire indikatorene har sterk sammenheng med indeksen. Det betyr at jeg har kokt indeksen ned til et spørsmål om syn på offentlig inngrep versus private løsninger, og det politiske innholdet har blitt klarere som følge av at vi utelot spørsmålene om forsvar og flyktninger.

Samme fremgangsmåte ble utført på velgerdataene, og resultatene er gjengitt i

tabellene 5a og 5b. Her er alfaverdiene naturlig nok en del lavere, men det er tydelig at sammenhengen mellom spørsmålene ligner de vi så hos representantene. Synet på forsvars- og flyktningpolitikken faller i mindre grad sammen med synet på økonomisk politikk. De korrelerer lavt med indeksen, og tabellen viser at alfa vil øke en god del hvis vi ekskluderer dem. De ble derfor fjernet, og resultatet av indeksen med fire spørsmål om økonomi ga et nokså tilfredsstillende resultat. Alfaverdien stiger fra 0,48 til 0,56 og befinner seg nå innenfor anbefalte grenseverdier, alfaverdien vil ikke øke hvis vi fjerner noen av dem, og alle indikatorene korrelerer tilfredsstillende med indeksen.

TABELL 5A.RELIABILITETSANALYSE FOR INDEKS MED SEKS INDIKATORER. VELGERNIVÅ

Felleskorrelasjon

Kvadrert skalakorrelasjon

Alfa hvis utelatt

Off

,28

,13

,41

Skatt

,30

,17

,40

Forsvar

,12

,03

,50

Inntekt

,34

,16

,38

Helse

,29

,13

,40

Flykt

,12

,03

,50

Standardisert alfa = ,48

TABELL 5B.RELIABILITETSANALYSE FOR INDEKS MED FIRE INDIKATORER. VELGERNIVÅ

Felleskorrelasjon

Kvadrert skalakorrelasjon

Alfa hvis utelatt

Off

,33

,12

,49

Skatt

,36

,16

,46

Inntekt

,33

,15

,49

Helse

,33

,13

,49

Standardisert alfa = ,56

Reliabilitetsanalysen har dermed brakt oss et skritt videre idet den har gitt oss større klarhet med henblikk på hvilke indikatorer som hører sammen langs venstre-høyredimensjonen. Vi startet ut med seks spørsmål, og analysen antydet at spørsmål av ikke-økonomisk art ikke passet helt sammen med de fire andre. Den endelige indeksen besto dermed av forslagene om å minske den offentlige sektor, øke skatten på høyere inntekter, minske inntektsforskjellene i samfunnet og drive mer av helsevesenet i privat regi. Alle forslagene dreier seg om varianter av kollektive løsninger versus individuell frihet: Er det samfunnet eller individet som skal ha det overordnede ansvaret for forvaltningen av penger når det gjelder viktige samfunnsoppgaver?

Dermed har vi fått et nokså klart og tydelig bilde av hva den underliggende teoretiske variabelen inneholder, og siden denne indeksen ser ut til å passe godt både blant parlamentarikere og velgere, skulle vel alt være bra? Vel, hovedkritikken mot denne type additive skalaer er at innholdet i dem ikke er entydig utenom i ytterpunktene. Jo nærmere midten, dess mer ullent blir innholdet. I en skala som består av to indikatorer med diskrete verdier fra 1 til 5, vil indeksskåren 7 skjule fire ulike svarkombinasjoner (2+5, 3+4, 4+3 og 5+2). Dermed blir vanskeligere å utlede hvilke responser som ligger bak en indeksverdi jo nærmere midtpunktet denne verdien befinner seg. Det åpner også for at skalaen i realiteten kan bestå av mer enn én

dimensjon, noe som er uheldig da hensikten med metoden er å komme frem til et endimensjonalt begrep.

Disse problemene skyldes at teknikken utelukkende baserer seg på aggregert konsistens - gjennomsnittskorrelasjon mellom variabler - og ikke tar hensyn til individuelle svarmønstre. I vårt materiale vil vi for eksempel kunne anta at et sterkt ønske om å minske offentlig sektor forplikter på en slik måte at man er «nødt» til være positiv til forslaget om å drive mer av helsevesenet i privat regi. Dette fordi økt privatisering bidrar til å minske offentlig sektor. Den additive tilnærmingen evner ikke å ta hensyn til dette, noe som gjør at vi for å være på sikre siden også bør teste om responsene er kumulative. Det er tema for neste og siste analyse.

KUMULATIV SKALERING

Problemet med additive indekser er altså at responsmønsteret som utledes fra indeksverdiene er flertydige utenom ytterpunktene samtidig som de kan skjule flerdimensjonale responsmønstre. Louis Guttmanns kritikk mot metoden seg nettopp mot fraværet av krav om ensartede svarmønstre (McIver & Carmines 1981:22). For at en skala skal være endimensjonal, krevde Guttmann at respondenter som har svart positivt på et forpliktende spørsmål også svarer positivt på et mindre forpliktende spørsmål. Ut fra denne tankegangen er det naturlig å bedømme indekserbarhet på bakgrunn av om responsene hoper seg opp i et kumulativt mønster. Indeksskåren vil da presist angi et entydig svarmønster på de enkelte indikatorene. Av denne grunn kalles denne modellen også deterministisk (Debets & Brouwer 1986). I samfunnsforskning, hvor holdningsmål generelt inneholder mye støy, er det liten grunn til å anta at slike deterministiske skalaer er utbredt. Guttmannskaleringer synes dermed å være en lite farbar vei for samfunnsforskere. R.J. Mokken (1971). videreutviklet skaleringsteknikken til Guttmann i probabilistisk retning, en tilnærming som nok er mer realistisk i forhold til de fenomener samfunnsforskere er ute etter. Mokken utarbeidet dessuten teknikken slik at den kunne håndtere variabler med tre eller flere verdier (polykotome variabler), der Guttmann begrenset seg til dikotome variabler.

En kumulativ skala fordrer at individuelle responsene følger samme mønster. For å gjøre det mulig å bestemme om mønsteret er kumulativt, blir de ulike responsene rangert etter vanskelighet på bakgrunn av hvor sjeldne responsene er i datamatrisen. Rangeringen antyder at noen spørsmål innebærer større grad av forpliktelse enn andre, og et kumulativt mønster foreligger når en person som svarer bekreftende på et vanskelig spørsmål også svarer bekreftende på et «lettere» spørsmål (se Debets & Brouwer 1986).

Kumulativitet bedømmes ved hjelp av Lövingers H (H for homogenitetstest), som måler graden av ensartethet i svarmønstrene. Svar som ligger utenfor dette mønsteret betraktes som feilresponser. Følgende eksempel fra brukermanualen til MSP-programmet illustrerer fremgangsmåten. Tabell 6 viser fordelingen mellom to fiktive variabler som begge har tre verdier.

Feilcellene identifiseres så ved å beregne kumulative frekvenser fra xi=2 og oppover til 0, og tilsvarende fra kolonne xj. Siden 0 angir positiv respons er det vanskeligst å svare positivt på rekkevariabelen, og skyggeleggingen markerer de cellene som følger et perfekt kumu-

TABELL 6.FORDELING MELLOM TO HYPOTETISKE VARIABLE. ABSOLUTTE TALL

xj

0

1

2

total

Kumulativ

0

280

100

20

400

100

xi

1

10

80

10

100

60

2

10

220

270

500

50

total

300

400

300

1000

kumul.

100

70

30

lativt mønster. Alle svar utenfor dette er å regne som feil (Eij).6 Siden tilnærmingen bygger på et probabilistisk prinsipp, tas det også hensyn til at det kan ligge tilfeldigheter bak feilresponsene. Derfor trekkes den forventede frekvens (Fij) under uavhengighet for disse responsene og skaleringskoeffisienten Hij = 1 - (Eij/ Fij). Ved et perfekt kumulativt mønster blir koeffisienten 1. Hvis feilfrekvenser opptrer, avhenger koeffisientstørrelsen av hvor stor faktisk feilfrekvens er i forhold til forventet feilfrekvens.

Hvorvidt selve skalaen skal vurderes som sterk eller svak er, som under reliabilitetstesten, et skjønnsspørsmål. Mokken selv foreslo at sterke skalaer var de som hadde H-verdier over 0,5, moderate skalaer lå mellom 0,4 og 0,5, mens H- verdier mellom 0,3 og 0,4 antyder at skalaen er svak. På den annen side påpeker han at også svake skalaer kan ha berettigelse, og at kriteriene var utarbeidet for dikotome indikatorer.

TABELL 7.HOMOGENITETSTEST AV ULIKE INDEKSMODELLER. LÖVINGER'S H

Indeksindikatorer

Parlamentarikere

Velgere

off, forsvar, inntekt, skatt, helse, forsvar

0,46

0,12

off, inntekt, skatt, helse

0,58

0,20

off, helse

0,63

0,27

skatt, inntekt

0,73

0,27

Fremgangsmåten er den samme som for de additive testene.7 Analysen starter med seks indikatorer fra en antatt venstre-høyredimensjon og tester hvorvidt denne er brukbar, og undersøker om den blir bedre med færre indikatorer. Siden ingen av tidligere modeller har vært spesielt gode på velgernivå, testet jeg dessuten om off og helse utgjorde en dimensjon for seg, og om skatt og inntekt utgjorde en annen dimensjon. Tabell 7 viser resultatet av homogenitetstestene for velgere og parlamentarikere.

Som forventet er resultatene igjen betraktelig lavere blant velgerne i forhold til parlamentarikerne. Ut fra de kriteriene Mokken ga (se over), danner den største modellen (med seks indikatorer) en skala av moderat styrke blant parlamentarikerne. På velgernivå passer modellen imidlertid ganske dårlig: velgernes responser følger et temmelig uensartet mønster. Dette kan tolkes dithen at parlamentarikerne har en sterkere evne til å svare i tråd med en underliggende venstre-høyredimensjon, noe som er rimelig tatt i betraktning at politikk og politiske temaer tross alt er jobben deres. De svarer dessuten som representanter for et parti og ikke som privatpersoner, slik som velgerne gjør. Politikerne er seg derved mer bevisst skillet mellom venstre og høyre, og vet derfor hvor umiddelbart hvor forslagene hører hjemme når de får dem presentert.

Nærmere ettersyn viser likevel at homogeniteten blant politikerne er vesentlig lavere i synet på forsvars- og flyktningpolitikk, noe som er i tråd med forutgående analyse. H-verdiene for disse to indikatorene trekker ned H-verdien, og denne verdien øker en god del når vi utelater dem fra indeksen.

Det samme skjer blant velgerne, hvor H-verdien stiger fra 0,12 til 0,20. Dette er riktig nok ikke høyt nok til å kvalifisere til en kumulativ skala. Men siden anbefalingen på 0,3 gjelder svar med langt færre verdier, så innebærer ikke testen noen definitiv gravlegging av indeksen blant velgerne. Den lave H-verdien frister likevel til en utprøving av om vi kan spore to underdimensjoner, og de to nederste linjene viser Lövingers H for indekser hvor bare to indikatorer inngår. Dette gir klare resultatforbedringer, og blant velgerne legger alfaverdiene seg nå tett opptil kravet til svake skalaer - 0,27 - noe som må kunne sies å være tilfredsstillende.

éN DIMENSJON?

Først et kuriøst poeng som understreker at vi ikke bør basere indekskonstruksjon på teknikk alene, er følgende. Faktoranalysen ble bedt om legge alle de tretten indikatorene på en og samme faktor for å teste hvorvidt alle kunne inngå i additive indekser for å finne ut om det er statistisk grunnlag for å hevde at alle svarene har opphav i samme dimensjon. Det samme ble gjort for reliabilitetstesten. Faktoranalysen viste da at blant parlamentarikerne ladet alle indikatorer, med unntak av en, godt over 0,4. På velgerplan ladet alle spørsmål så nær som tre høyere enn 0,3. Den additive reliabilitetstesten av alle tretten spørsmål i en og samme indeks ga Cronbachs alfa på 0,89 blant parlamentarikerne, 0,31 blant velgerne. Dette bekrefter nok en gang at statistisk programvare ikke tar hensyn til den underliggende substansen og alltid vil levere løsninger såfremt matematikken ikke ligger til hinder.

Den kumulative teknikken ble som nevnt utviklet blant annet fordi additive indekser kunne inneholde flere dimensjoner, og forrige avsnitt illustrerer nettopp det på en ekstrem måte. Mer interessant i så måte er den kumulative testen som ble gjennomført på velgernivå, og det er verdt en liten diskusjon.8 I den additive tilnærmingen endte vi opp med en indeks som besto av fire indikatorer etter å ha startet med seks. Alfaverdien for denne var høyere enn for indeksen med seks indikatorer, og den ville ikke bli forbedret om vi reduserte antallet ytterligere. Den kumulative tilnærmingen antydet på sin side at det ville være bedre å lage to indekser av de fire indikatorer. Dette er en klar antydning om at indeksen med

fire indikatorer inneholder to dimensjoner, og ikke bare en.

På den annen side kan det stilles spørsmål ved om det er teoretisk ønskelig å foreta en så detaljert oppsplitting og om dette innebærer en for snever tilnærming til det fenomen vi er ute etter. Hensikten med skalering er jo å fange opp et teoretisk underliggende fenomen og å redusere målefeil. Reduserer vi antall indikatorer til to, kan vi risikere at vi ikke oppnår dette målet. Selv om homogeniteten er høyere for to indikatorer enn for fire, synes innholdet i disse indeksene å ligge altfor tett opptil saksinnholdet indikatorene tar opp. Dermed synes ikke disse indeksene å bringe oss så veldig mye nærmere den teoretiske variabelen vi er ute etter. For de fleste analytiske formål er hensikten å konstruere indekser som fanger opp ulike aspekter ved en kompleks underliggende latent variabel. Indekser bestående av bare to indikatorer av typen vist i tabell 7, kan fort bli oppfattet mer som uttrykk for holdninger til nokså snevre saksområder enn ideologisk orientering.

Det finnes ikke noe fasitsvar på dette, men i dette tilfellet kunne man for eksempel vise til at valgundersøkelser viser at disse indikatorene har opphav i samme bakenforliggende fenomen. I disse undersøkelsene har velgerne vært utsatt for store mengder politisk stimuli i forkant av undersøkelsen, noe som ikke er tilfellet i inneværende undersøkelsen. Velgernes forståelse av «ideologi» er således understimulert, og det er grunn til å anta at dette har betydning for svarene. Parlamentarikerne på sin side får slike stimuli daglig samtidig som de representerer partier, og dette er en medvirkende årsak til deres sterke holdningskonsistens. I tillegg bør man vise at sammenhengen mellom indikatorene blant velgerne forholder seg likt til andre relevante variabler, som for eksempel partipreferanse. Det vil si at borgere med samme partipreferanse uttrykker samme holdning til alle indikatorene, og ikke bare til noen av dem. Hvis man i tillegg legger inn et forbehold om endimensjonalitet, ville det ikke være urimelig å anbefale en indeks som inneholder indikatorene om å minske den offentlige sektor, øke skatten på høye inntekter, minske inntektsforskjellene i samfunnet og drive mer av helsevesenet i privat regi i dette tilfellet. Inneværende analyse gir imidlertid ikke grunn til å etablere dette som en generell indeks til bruk i andre undersøkelser. Men selv til et slik ad hocformål krever indeksen en substansiell argumentasjon ut over den rent statistiske. På den annen side har vel denne gjennomgangen vist at en slik argumentasjon uansett er alfa og omega når det gjelder indekskonstruksjon.

DISKUSJON

Så kan man jo spørre seg om hvor relevant problemstillingen i denne gjennomgangen er, og jeg vil kort diskuterer dette i forhold til foreliggende forskning.

I en nylig publisert studie av norske parlamentarikere er konklusjonen at «helhetsbildet av det politiske rom paradoksalt nok er endimensjonalt snarere enn flerdimensjonalt» (Rasch 2003). Dette er interessant i forhold til gjennomgangen over, som jo har vist at vi kan ende opp med å plassere svarene til parlamentarikerne langs én dimensjon - hvis vi utelukkende holder oss til statistiske kriterier. Men vi så også at det ikke var så lett å akseptere en slik løsning når vi tok hensyn til substansen i spørsmålene. Nå skal det sies at spørsmål og tilnærming i den analysen avviker radikalt fra inneværende analyse, men det er altså

et par momenter som peker i retning av at det politiske landskapet ikke er så endimensjonalt som konklusjonen legger opp til. For det første foreligger et substansielt moment. Det er ingen grunn til å betvile at parlamentarikernes vurderinger av avstanden mellom partier på Stortinget i stor grad følger venstre-høyreaksen. Likevel er det ikke gitt at representantene legger de samme kriterier til grunn for hva de legger i begrepene venstre og høyre. Herav følger det empiriske momentet. Både Høyre og Fremskrittspartiet oppfatter nemlig Senterpartiet som mer ytterliggående enn noen av de andre partiene, noe som antyder at representantene til Høyre og Fremskrittspartiet legger andre kriterier til grunn for sine vurderinger av Senterpartiet. Rasch anfører da også at materialet ikke kvalifiserer til endimensjonalitet i streng forstand, men konkluderer altså likevel at det politiske landskapet er endimensjonalt. Dette gjør at det ville være interessant å undersøke om andre fremgangsmåter hadde gitt andre resultater.

Et annet eksempel som viser at det er nødvendig å ha et aktivt forhold til hvilke spørsmål som trekke inn i analysen, gjelder EU-striden i norsk politikk. Denne striden legger grunnlag for allianser som går på tvers av etablerte skillelinjer, så i stedet for å danne en konfliktdimensjon for seg selv, legger den seg på tvers av etablerte ideologiske dimensjoner. Dette har uheldige konsekvenser for faktoranalysen. Valgprosjektet har derfor som regel utelatt denne indikatoren fra faktoranalysene (Aardal & Valen 1995:81). Det vi skal legge oss på minne i denne sammenhengen er at når en enkelt indikator kan bryte ned hele byggverket, så antyder det at vi bør trå forsiktig i denne materien. Dette er noe man bør legge seg på minnet hvis man er av dem som er ute etter å avdekke dimensjonalitet i et materiale man ikke er 100 prosent fortrolig med.

Et annet eksempel fra valgprosjektet gjelder undersøkelsen fra 1993. I hovedrapporten ble spørsmålet om «å fordele rikdommen i verden» innlemmet i indeksen for offentlig inngrep versus private løsninger - ut fra kriteriet om at den var blant de indikatorene som ladet høyest på denne faktoren (Aardal 1999:74). Etter min mening tilhører ikke dette spørsmålet offentlig-privatdimensjonen, og er derfor ved to senere anledninger byttet ut med spørsmålet om å «øke offentlige tjenester fremfor skattelette» (Ellis 2000:40; Berglund 2004:kap. 6). Foruten at fordelingsspørsmålet er kvalitativt forskjellig fra de andre indikatorene, så viste reliabilitetstesten at indeksen med skattelettespørsmålet hadde like god tilpasning som den tidligere benyttede indeksen (Cronbachs alfa = 0,64).

Ellers viser Ottar Hellevik (1993) viktigheten av å undersøke hvordan indikatorene forholder seg til relevante variabler. Det har lenge pågått en debatt om hvorvidt materialistiske versus postmaterialistiske verdier utgjør én eller to dimensjoner - en som angår tradisjonelle versus moderne verdier og en som angår autoritarianisme versus liberterianisme. Hellevik viser er at de to dimensjonene forholder seg grunnleggende forskjellig til en viktig forklaringsvariabel - generasjon. Dette gjør at dimensjonene tradisjonell versus moderne og materialisme versus idealisme ikke kan betraktes som to underdimensjoner av samme dimensjon, men at de utgjør to selvstendige dimensjoner.

OPPSUMMERING

Kort oppsummert har inneværende analyser vist at holdningene til norske

parlamentarikere har en sterk indre sammenheng, og at vi finner holdningsmønstre som ligner blant norske velgere, selv om den indre sammenhengen blant velgerne er langt svakere. På parlamentarikernivå kunne vi etablere en sterk kumulativ indeks på bakgrunn av forslagene om minske den offentlige sektor, øke skatten på høye inntekter, minske inntektsforskjellene i samfunnet og drive mer av helsevesenet i privat regi. Restriksjonene knyttet til denne type indekser er slik at tilsvarende spørsmål nødvendigvis også utgjorde en sterk additiv indeks. Blant velgerne var skalerbarheten til nevnte spørsmål langt svakere, men den indre konsistensen var likevel sterk nok til at disse kunne inngå i en additiv indeks. Velgerne passerte strengt tatt ikke grenseverdiene for kumulative indekser, selv om det var ansatser i den retning. Resultatene av de unidimensjonale teknikkene sto ikke i noen direkte kontrast til de funn som kom frem under faktoranalysene. Likevel må det kunne hevdes at de unidimensjonale teknikkene virket oppklarende i forhold til det teoretisk underliggende begrep jeg har konsentrert meg om - venstre-høyredimensjonen i norsk politikk. Både den additive og den kumulative teknikken ga oss et ryddigere bilde av det substansielle innholdet. Med disse var det enkelt å finne ut hvilke indikatorer som hørte hjemme på dimensjonen og hvilke indikatorer som ikke var nødvendige. Den kumulative teknikken ga i tillegg noen indikasjoner på at de additive løsningene ikke var så endimensjonale som vi skulle kunne ønske.

Likevel er det vanskelig å hevde at resultatene har ledet frem til noen sterke konklusjoner om hvilken teknikk som er best egnet når vi skal lage refleksive indekser. Det må dog sies at den strengeste metoden - Mokkenskalering - er sikrest med henblikk på å ha kontroll over det substansielle innholdet. Samtidig er det åpenbart vanskelig å finne frem til slike endimensjonale skalaer på velgernivå. Psykometrikerne, som har utviklet skaleringsteknikkene og satt kriteriene for når indre konsistens er konsistent nok, sysler med problemstillinger som er mindre forstyrret av subjektive oppfatninger blant studieobjektene enn de spørsmål som sosiologer og statsvitere vanligvis beskjeftiger seg med. Men, som Mokken også poengterte, selv svake skalaer kan ha sin berettigelse. Et viktig argument for å godta en venstre-høyreindeks med fire indikatorer i denne sammenhengen er at siden den passet svært godt på politikerne, så bør man kunne tillate et svakere mønster blant velgerne. Dette fordi politikerne har grunnleggende bedre forutsetninger for å svare konsistent siden de møter denne type problemstillinger i sitt daglige virke.

Resultatene for faktoranalysene var mer tvetydige, men kan likevel gi et godt utgangspunkt i tilfeller der man ikke har sterke antagelser om hvilke sammenhenger man står overfor. Det skulle likevel være klart at vi ikke bør basere oss på faktoranalysen alene, siden ulike former for faktoranalyse kan gi ulike resultater.

Den viktigste lærdommen vi kan trekke ut av denne gjennomgangen er, etter min mening, at indekskonstruksjon ikke er noe samfunnsforskere kan overlate til tekniske avveininger alene. Det må hele veien ligge teoretiske avveininger bak de valg som gjøres. Man må tenke nøye gjennom hva man er ute etter å måle og hvilke implikasjoner dette har for valg av teoretisk modell og skaleringsteknikker. Det er dessuten vist at heller ikke indekser som er gode etter tekniske kriterier ikke trenger være gode

etter innholdsmessige kriterier, samtidig som indekser som ikke oppnår gode tekniske kriterier også kan ha berettigelse. Det betyr at vi på bakgrunn av teoretisk

kunnskap bør stille spørsmål om vi kan klare oss med svake skalaer tuftet på strenge kriterier eller sterke skalaer tuftet på «milde» kriterier.

Noter

1. Det finnes atskillig mer avanserte teknikker enn de som blir gjennomgått i denne artikkelen, blant annet modeller som baserer seg på strukturelle ligningssystemer. I denne artikkelen skal jeg imidlertid begrense meg til teknikker som inngår i et metoderepertoar som er tilgjengelig for samfunnsvitere generelt.

2. For en mer generell diskusjon om målemodeller, se Mastekaasa, A. (1987), «Modellbruk, indekser og konsistenskriterier.» Tidsskrift for samfunnsforskning, 26:167-188.

3. Converse benytter riktig nok Spearmankorrelasjoner, som er designet for å håndtere korrelasjon mellom ordinale variabler, mens jeg presenterer Pearsons r, som strengt tatt krever kontinuerlige variabler. Siden det viste seg at forskjellene mellom målene var minimale, og folk flest er mest fortrolige med sistnevnte, ble denne valgt.

4. Det ligger imidlertid ofte et møysommelig arbeid bak utvelgelsen av variabler i en undersøkelse, noe som bidrar til å redusere det eksplorerende aspektet som hefter ved slike analyser.

5. Det ble også foretatt andre faktoranalyser med andre ekstraksjonsteknikker og rotasjonsprinsipper. Disse ga til dels nokså forskjellige faktorløsninger i forhold til de som er vist i teksten, noe som antyder at resultater fra faktoranalyser bør omgås med forsiktighet. Det innebærer at det også er vanskelig å lete etter dimensjoner eller bestemme dimensjonalitet i datamateriale ut fra faktoranalyser.

6. Hvis kolonnevariabelen hadde vært den vanskeligste responsen, dvs. den responsen færrest oppgir, ville responsene (0,0), (1,0), (1,1), (1,2) og (2,2) dannet det kumulative mønsteret.

7. Statistikkprogrammet MSP - Mokken Scale Analysis for Polychotomous Items, Debets, P. & E. Brouwer (1986), User's Manual MSP. Amsterdam, Technisch Centrum Universiteit van Amsterdam - er benyttet i for å teste om det foreligger kumulative svarmønstre. MSP tilbyr også en eksplorerende søkeprosedyre hvor programmet leter seg frem til kumulative skalaer, men her er testprosedyren benyttet.

8. Det gjelder for så vidt også reduksjonen fra seks til fire indikatorer for parlamentarikerne, hvor H-verdien øker fra 0,46 til 0,58.

Referanser

ACHEN, CHRISTOPHER (1975), «Mass Political Attitudes and the Survey Response.» American Political Science Review, 69:1218-1231.

CONVERSE, PHILIP (1964), «The Nature of Belief Systems». I: David Apter, red., Ideology and Discontent. London: The Free Press of Glencoe.

BERGLUND, FRODE (2004), Partiidentifi- kasjon og politisk endring. Oslo: Unipax.

DEBETS, P. & E. BROUWER (1986), User's Manual MSP. Amsterdam: Technisch Centrum Universiteit van Amsterdam.

ELLIS, INGUNN OPHEIM (2000), «Politisk kunnskap - en forsømt faktor i studiet av norske velgere?». Oslo: Insti-

tutt for statsvitenskap, Universitetet i Oslo.

ESAIASSON, PETER & KNUT HEIDAR, red. (2000), Beyond Westminster and Congress. The Nordic Experience. Columbus: Ohio State University Press.

HELLEVIK, OTTAR (1991), Forsknings- metode i sosiologi og statsvitenskap. Oslo: Universitetsforlaget.

HELLEVIK, OTTAR (1993), «Kulturelle skillelinjer i dagens samfunn. Et innlegg i postmaterialisme-debatten.» Sosiolo- gisk tidsskrift, 1:25-50.

JUDD, CHARLES & MICHAEL MIL- BURN (1980), «The Structure of Attitude System in the General Public: Comparisons of a Structural Equation Model.» American Sociological Review, 45:627-643.

KIM, JAE-ON & CHARLES MUELLER (1978), Introduction to factor analysis. Newbury Park: Sage Publications.

MASTEKAASA, ARNE (1987), «Modellbruk, indekser og konsistenskriterier.» Tidsskrift for samfunnsforskning, 26:167-188.

MCIVER, JOHN & EDWARD CAR- MINES (1981), Unidimensional Scaling. Newbury Park: Sage Publications.

MOKKEN, R.J. (1971), A Theory of Procedure of Scale Analysis. Haag: Mouton.

NORUSIS, MARIA J. (1988), SPSS/PC+ Advanced Statistics V2. Chicago: SPPS Inc.

NUNNALLY, JIM (1967), Psychometric Theory. New York: McGraw-Hill.

PETERSSON, OLOF & HENRY VALEN (1979), «Political Cleavages in Sweden and Norway.» Scandinavian Political Studies, 2:313-331.

PIERCE, JOHN & DOUGLAS ROSE (1974), «An Overview of the American Electorate». I: John Pierce & John Sullivan, red., The Electorate Reconsidered. Beverly Hills: Sage.

RASCH, BJØRN ERIK (2003), «Det politiske landskap.» Tidsskrift for samfunnsforskning, 44:37-66.

SCARBROUGH, ELINOR (1984), Political Ideology and Voting. Oxford: Clarendon Press.

VOGT, PAUL W. (1993), Dictionary of Statistics and Methodology. Newbury Park: Sage Publications.

AARDAL, BERNT (1999), Velgere i 90- årene. Oslo: NKS-forlaget.

AARDAL, BERNT, red. (2003), Velgere i villrede ... En analyse av stortingsvalget 2001. Oslo: N.W. Damm & Søn.

AARDAL, BERNT & HENRY VALEN (1995), Konflikt og opinion. Oslo: NKS-forlaget.