Skal du bruke ATEKST-arkivet som kilde for et prosjekt? Kanskje du allerede har brukt det? Det kan vise seg at du gikk glipp av noen tekster som kunne ha vært avgjørende for din forskning. Det er også mulig at de tekstene du har funnet i ATEKST-basen og har referert til i god tro, egentlig ikke finnes i den avisen du fant dem i. Det vil da være fornuftig å sjekke samsvaret mellom ATEKST-arkivet og avisas papirutgave. Det kan godt være at artikler som er presentert i papirutgaven ikke finnes i den elektroniske databasen, eller omvendt. ATEKST kan lede deg på villspor.

På Mediearkivet.no AS sine nettsider står det at basen er Norges ledende tekstarkiv: «ATEKST inneholder de redaksjonelle arkivene til en del av Norges største og viktigste mediebedrifter. Ved hjelp av ord, fraser og navn søker du hurtig opp publiserte artikler.»1 Dette høres ut som et svært nyttig redskap, spesielt for medieforskere. «Dette var akkurat det jeg trengte da jeg kom til Norge for å samle data og skrive min magistergradoppgave», tenkte jeg. I prosjektet tar jeg for meg dekningen av krigen i Irak i norske og polske aviser. Jeg ønsket å analysere papirutgaver av Aftenposten (AP) og Bergens Tidende (BT) i perioden fra 20. mars til 10. april 2003. Som del av prosjektet gjennomfører jeg kvantitativ analyse av innholdet, og jeg er blant annet interessert i både dato og sidetall på hver enkelt artikkel. Jeg ble derfor svært entusiastisk da jeg forsto at jeg kunne bruke ATEKST. Nå kunne jeg slippe å gå ut av mitt kontor for å sitte foran mikrofilmleseren – jeg kunne jobbe ved datamaskinen min i stedet.

Men jeg var ikke kun opptatt av kvantitative data. Jeg ønsket også å analysere grafikk og layout og måtte derfor bruke mikrofilm til deler av datainnsamlingen. Etter først å ha analysert oppslagene i ATEKST for deretter å analysere presentasjonen i den mikrofilmede papirutgaven, ble jeg virkelig overrasket. Det viste seg at materialet i ATEKST-basen ikke stemmer overens med mikrofilmutgavene.

For det første ble jeg overrasket over at det finnes flere artikler om krigen i Irak på mikrofilm enn i ATEKST. I Aftenpostens morgenutgave fra 20. mars 2003 mangler det kun én artikkel, mens to av artiklene er utelatt fra relevant kategori. Med ATEKST-utgaven av BT var det verre: Denne dagen mangler det fire artikler. Min første tanke var at de manglende artiklene kanskje var feilplassert i databasen, noe som jo kan skje når det finnes store mengder materiale som skal føres inn i systemet. Men søk etter tittel eller forfatter til disse artiklene ga «ingen treff». En

annen mulig forklaring kunne gå ut fra informasjon på Mediearkivet.no AS sin nettside:

«Mediearkivet.no AS gjør oppmerksom på at artiklene i ATEKST er hentet fra kildenes papirutgave, med unntak av Kommunal Rapport, som også inneholder artikler fra internett-utgaven. På grunn av opphavsrett, kan det være at noen artikler ikke er tilgjengelig.»2

Men kunne det være at opphavsretten til artiklene på sidene 7 og 19 i BT den 21. mars 2003 gjorde artiklene utilgjengelige i ATEKST-basen? Og kunne det være at NTBs meldinger var utilgjengelige på grunn av opphavsrett? Det er mulig at små notiser eller meldinger rett og slett blir utelatt i ATEKST. Men ATEKST utelater også store artikler, som for eksempel Tommelen opp for Saddam på side 13 i BT den 20. mars 2003. Dette er stor og vesentlig reportasje fra Tyrkia, med bilde. Store og viktige artikler skrevet av avisens journalister er altså utelatt i ATEKST-utgaven.

For det andre ble jeg overrasket over at det også i noen tilfeller finnes flere artikler i ATEKST enn i den mikrofilmede papirutgaven. I BT 20. mars 2003 er det 12 av 20 artikler om Irak-krigen fra ATEKST-utgaven som ikke finnes i papirutgaven denne dagen. Noen av ATEKST-artiklene er plassert på side 10, hvor det i papirutgaven kun finnes en annonse som tar hele siden. ATEKST-artiklene finnes altså ikke i papirutgaven.

For det tredje ble jeg overrasket over at tekster som ble oppgitt i ATEKST fantes i helt andre versjoner der enn i papirutgaven. Et eksempel er side 14 i BT den 20. mars 2003. Ifølge ATEKST inneholder denne siden tre artikler med følgende titler: Den amerikanske utenrikspolitikk; De 12 forhatte menn; og Hjertelig takk, President Bush. Ifølge BT på mikrofilm står det to andre tekster (men ikke tre) på denne siden under én felles tittel: Dødsfiender i krig (som ikke finnes i tekstarkivet i det hele tatt). Jeg har ennå ikke funnet de tre artiklene fra ATEKST-basen i papirutgaven. En mulig forklaring kunne være at disse artiklene kommer fra nettutgavene av de to avisene. Men Mediearkivet.no AS gjør det klart (se også sitat over) at det er papirutgaven av avisene som er kilden.

Et fjerde punkt jeg ble overrasket over er at ATEKST-utgaven mangler hele sider i forhold til papirutgaven. Et eksempel på dette er sidene 12 og 13 fra BT 10.4.2003.

La meg illustrere problemene i en tabell. Den viser mangel på samsvar mellom ATEKST-utgaven og mikrofilmet papirutgave i de to avisene. Dette gjelder artiklene om Irak-krigen i min analyseperiode.

I denne perioden finnes det altså ikke en eneste dag der den mikrofilmede papirutgaven er lik ATEKST-utgaven når det gjelder dekningen av krigen. Ikke nok med det, forskjellene mellom ATEKST og mikrofilmutgaven er til dels store og slett ikke uten betydning. Nå har jeg riktig nok tatt for meg bare to aviser i en svært begrenset periode. Likevel, når manglene i denne perioden er så vesentlige, er det grunn til å advare mot følgende: ATEKST-utgavene av norske aviser er ikke representative for de avisene publikum leser i papirform. Ellers sagt på en annen måte: Ut fra mine erfaringer vil jeg påstå at ATEKST presenterer en helt annen avis enn den som er utgitt på papir.

Disse problemene er dessverre ikke de eneste en forsker kan komme ut for når han/hun vil bruke ATEKST. Det finnes også ulemper som ligger i selve verktøyet: artiklene kan teoretisk sett sorteres som kombinasjon av for eksempel emne og sidemodus. Men dette fungerer ikke alltid. Det skjedde enkelte ganger at jeg valgte emne (Krig og konflikter) og ikke fikk sortert artiklene etter sidetall. Dersom jeg trykket på «Sidemodus», mistet jeg det emneutvalget jeg ville ha. Det ene utelukket det andre, men ikke alltid!

En annen ulempe med søkeverktøyet er at kategoriene (for eksempel emner) til en viss grad er forskjellige og ikke svarer til hverandre i de ulike avisene. Dette gjør ikke sammenlikningsarbeidet i ATEKST lettere!

En tredje ulempe er følgende: Ofte finnes det flere versjoner av papirutgavens førsteside eller av deler av papirutgaven. I slike tilfeller tar ATEKST tekster fra begge versjonene. Dette er bra! Men problemet er at basen ikke markerer hvilken tekst som kommer fra hvilken versjon. Dette er problematisk når en skal bruke basen til forskning.

I praksis betyr dette at den som velger ATEKST som eneste kilde for informasjon om avisers innhold, kan få et ufullstendig eller forvrengt bilde av hvordan avisen har presentert seg for sitt publikum. Dersom ikke ATEKST-basen gir et representativt bilde av avisdekningen, hvilken nytte kan vi som forskere da ha av basen? Dette skaper opplagte problemer i forhold til validitet, spesielt når det gjelder kvantitative innholdsanalyser.

Mine funn er altså begrenset til tolv avisutgaver av to aviser. Det er likevel vanskelig å tro at de problemene jeg fant, ikke også gjelder andre avisutgaver av Aftenposten og BT. Videre er det grunn til å anta at de problemene jeg fant i forhold til Aftenposten og BT også finnes når det gjelder andre aviser i ATEKST-basen.

Problemene hadde ikke vært så store hvis det kun var meg de angikk. Men jeg vet at ATEKST er en viktig database for analyse av aviser. Statistikken for bruk av ATEKST ved Universitetet i Bergen viser at nettopp Aftenposten er den mest brukte kilden, tett fulgt av Bergens Tidende.3 Jeg antar at de fleste som bruker den slags verktøy på universitetet ikke gjør dette for moro skyld, men i forbindelse med ulike prosjekter og oppgaver. Problemene hadde ikke vært så store heller, hvis ATEKST bare var et hjelpeverktøy brukt av studenter og vitenskapelig ansatte med en klype skepsis. Men jeg vet at ATEKST blir betraktet som en pålitelig informasjonskilde. Det er nok å nevne hvor overrasket professor Knut Helland fra informasjons- og medievitenskap ved Universitetet i Bergen ble da han fikk vite om problemet. Det var han som oppmuntret meg til å skrive dette inlegget. Professor Knut Helland har selv brukt ATEKST i sin forskning uten noen tvil om dens troverdighet. Han hevder at både han og hans kollegaer har anbefalt bruk av ATEKST til sine studenter på medievitenskap. Han mente at han selvfølgelig kunne vente seg noe små, ikke-relevante feil i ATEKST-basen, men de uoverensstemmelsene som kom fram i lyset i anledning min forskning kan ikke regnes verken som små eller som ikke-relevante. I mitt tilfelle kunne jeg likevel bruke ATEKST i begrenset omfang. Jeg tok utskrifter fra ATEKST-søk og sammenlignet dem med mikrofilmutgavene av de utvalgte avisene. Da jeg så hva jeg kunne ta fra ATEKST og hva jeg måtte analysere fra mikrofilmen, kunne jeg sette i gang.

Spørsmålet er så hvem som har ansvar for disse problemene. Er det kildeavisene, eller er det ATEKST-arkivet? Et annet viktig spørsmål er: Kan dette bli rettet på? Det er også urovekkende at dette helt sentrale problemet ikke ble oppdaget tidligere.

Noter

  1. http://atekst.mediearkivet.no/atekst/

  2. http://atekst.mediearkivet.no/atekst/

  3. http://atekst.mediearkivet.no/atekst/