Databasen ATEKST, levert av Mediearkivet.no AS, inneholder redaksjonsarkivene til 14 norske medier, og er med dette Norges ledende tekstarkiv. Daglig overføres det tekst fra artikler som har vært på trykk i papirutgaven til avisene, meldinger fra NTB samt artikler fra internettutgaven til Kommunal Rapport til vår database. Hver enkelt kilde er ansvarlig for de artiklene som overføres til ATEKST, derfor kan enkelte artikler av opphavsrettslige eller avtalemessige forhold være utelatt fra ATEKST. Dette informerer vi om på våre sider, og dette har også Srebrowska påpekt at vi gjør. For kvantitative undersøkelser vil følgelig ATEKST derfor ikke gi et 100% korrekt bilde, noe vi da heller aldri har ment at den gjør.

For flere av kildene klassifiseres artiklene slik at gjenfinningen blir enklere. Klassifiseringen utføres i den enkelte avis og tar utgangspunkt i interne systemer. Dog har noen av kildene som inngår i ATEKST startet å klassifisere artiklene i henhold til IPTC-koder. Selvfølgelig hadde det vært optimalt dersom alle kildene benyttet det samme systemet. Vi i Mediearkivet er allerede i gang med å se på mulighet for at brukerne kan benytte samme klassifiseringsbegreper på tvers av kilder når søkene foretas.

Urszula Srebrowska har foretatt en sammenlikning der hun finner avvik mellom papirutgavene og artiklene i ATEKST for kildene Aftenposten og Bergens Tidende i perioden mars-april 2003. Hun mener manglende er omfattende. Mediearkivet.no AS har derfor vært i kontakt med begge avisene for å få deres forklaring på Srebrowskas eksempler.

Vedr. Aftenposten

Etter å ha sammenlignet med avisen på mikrofilm viser Urszula Srebrowska til at 21 Aftenposten-artikler er utelatt fra ATEKST. Dette er riktig. Men av disse er 20 artikler fra NTB. Av opphavsrettslige forhold er artikler fra byråer ikke tilgjengelig i ATEKST. Aftenposten har derfor ikke mulighet for å la NTB-artiklene inngå sammen med artikler fra egne journalister. NTB finnes som kjent som egen kilde i ATEKST. Det jobbes med en teknisk løsning der artiklene vises, og kildene fordeler

inntektene internt ut fra bruken, men denne løsningen er ikke på plass enda. Den siste artikkelen er laget som grafikk. ATEKST inneholder ikke bilder eller grafikk som har vært på trykk i avisen. Dette skyldes dels produksjonstekniske forhold, og dels at ATEKST er et rent tekstarkiv, og ikke kan vise grafiske elementer. Artikkelen som står til grafikken har en egen merknad om at grafikken ikke er med, og den henviser til mikrofilmutgaven av avisen.

At man kan komme frem til ulikt antall artikler i arkiv og papirutgaven fra Aftenposten kan ha flere andre grunner, viktigst blant disse er:

  • artikkelbegrepet kan være forskjellig (kan være forskjellige oppfatninger av hva som er en artikkel, (del)artikler samles i ATEKST til større saker/rigg for å lette gjenfinning og lesbarhet)

  • vanskelighetene ved fritekstsøk er godt kjent og dokumentert, for å avhjelpe dette indekserer/klassifiserer Aftenposten sitt stoff i en rekke felt (artikler om krigen i Irak er f.eks. klassifisert under saken=Irakkrigen, i tillegg er de enkelte artikler påført relevante emneord, geografiske angivelser og evt. person- og institusjonsnavn). Indekseringen gjøres primært for egen redaksjon, men utnyttes også i stor grad av eksterne brukere. Det er en kjent utfordring at de ulike kildene opererer med ulike klassifikasjonsskjema. Uten å kjenne klassifikasjonssystemet kan det være vanskelig å utnytte systemet optimalt ved søking, og det blir selvfølgelig ikke lettere ved at de forskjellige kildene ikke bruker samme system.

  • artikler og sider kan komme i flere utgaver/versjoner. Hvis forskjellene er små lagres utgavene som én artikkel med merknad om endringene. Hvis endringene er større legges artiklene inn som separate artikler.

  • elementer som lages som grafikk og som vanskelig kan uttrykkes som kun tekst er ikke med i ATEKST fordi ATEKST kun takler tekst. Artikkeltekst i grafikk er som hovedregel likevel med, med noen unntak

  • bilder er ikke med i ATEKST. Bildetekster er imidlertid med, enten alene (i rene bildesaker), eller knyttet til artikkelen der bildet stod

Dette kommer altså i tillegg til de artikler og byråstoff man ikke har arkivrettigheter til, og det vil derfor være forskjeller mellom ATEKST og papirutgaven/mikrofilmutgaven av Aftenposten.

Det påpekes videre at enkelte artikler er utelatt fra «relevant kategori». Feil kan naturligvis skje, særlig tatt i betraktning omfanget. Bare i Aftenposten arkiverer vi 200-250 artikler per dag, sier Alf Endre Magnussen i Aftenpostens Dokumentasjonssenter. Av kapasitetsmessige hensyn er det kun 150-200 av disse som «berikes» med emneord osv. Men kategorisering vil også alltid være en subjektiv prosess basert på skjønn. Av artiklene Srebrowska viser til er det noen som kanskje kunne ha fått flere indekstermer, også knyttet til krigen i Irak, men samtidig er det også flere artikler vi bevisst ikke har kategorisert som artikler om Irak-krigen, fortsetter Magnussen. At krigen nevnes i en artikkel betyr ikke nødvendigvis at Aftenposten ønsker å kategorisere artikkelen til å handle om krigen.

Srebrowska etterlyser angivelse av hvilken utgave artikkelen er hentet fra. For tidsperioden hun har analysert framgår det tydelig hvilke artikler som er 2. eller 3. utgave (øverst i artikkelen med lys rød bakgrunnsfarge). Ved mindre endringer ble den opprinnelige artikkelen supplert med disse, samt en merknad om dette øverst i artikkelen (eks: «Billedtekst endret i 2utg»). Etter at Aftenposten i 2004 utkommer fast med minst to utgaver (fjern- og næropplag) blir disse opplysningene dessverre ikke vist i den eksterne arkivdatabasen. I ATEKST vil man altså få treff fra alle utgaver.

På papiravisen (og på mikrofilm) uttrykkes dette med små ringer ved logoen på forsiden, samt et system med fylte eller tomme stjerner øverst på de sidene som har endringer. I ATEKST får man treff på artikler fra alle utgaver. Noen ganger vil artikler framstå som like, forskjellen kan være en ørliten rettelse.

Utgangspunktet for Aftenpostens arkiv i ATEKST er å finne tilbake til artikler som har vært på trykk, og man må ta høyde for dette når man utøver kvantitative analyser på dette datamaterialet (som ikke er laget spesielt for kvantitative analyser). Per i dag er det nok ingen lettere måte å gjøre slike analyser på enn å bla i mikrofilm, men som mange forskere vil være kjent med er det heller ikke her alltid lett å telle artikler; siden kan visuelt endres uten at artikkelinnholdet endres (gjelder bl.a. artikler som Srebrowska har sett på), og ofte gjør man visuelle grep for å lette lesbarheten, selv om man egentlig bare presenterer en mellomtittel i en fontstørrelse som ser ut som tittel.

På vegne av Aftenposten ønsker Alf Endre Magnussen å gjenta at vi ikke har funnet at artikler ikke er med i ATEKST, når man ser bort fra NTB-artiklene som Aftenposten ikke har arkivrettigheter til og grafikkartikkelen.

Vi er opptatt av at Aftenpostens arkiv er komplett og korrekt, og oppfordrer Srebrowska og andre til å melde konkrete tilfeller av feil eller uklarheter til undertegnede på e-post alf.magnussen@aftenposten.no , avslutter Magnussen med.

Vedr. Bergens Tidende

Også Bergens Tidende benytter innkjøpt stoff som de ikke har rett til å ha tilgjengelig i databaser for kommersiell bruk. Dette er grunnen til at artikler fra de utvalgte datoer ikke finnes i ATEKST, men kun i papirutgaven. Artiklene er skrevet av journalister fra andre aviser som Jyllandsposten, Stavanger Aftenblad og NTB.

Så til noe som i utgangspunktet synes spesielt, nemlig at artikler fra Bergens Tidende finnes i ATEKST men ikke i de mikrofilmene som Srebrowska har benyttet ved sammenlikningen.

Aslaug Eide, leder av Faktaavdelingen i Bergens Tidende forklarer følgende:

Depotbiblioteket i Mo i Rana filmer bare vår siste utgave. Mens til ATEKST sender vi samtlige artikler som vi får overført fra produksjonen (minus byrå og samarbeidsstoff). Altså stoff fra både 1. og 2. utgaven og evt. 3. utgaven.

Artiklene det vises til finnes i papirutgaver – men de er altså ikke blitt filmet.

Ved store hendelser kan det være opptil tre ulike papirutgaver av Bergens Tidende, som når frem til ulike lesergrupper. Vi har også ekstrautgaver som f.eks ved Arafats død som bare eksisterer i løssalg eller til utdeling, sier Eide.

For å hindre denne forvirringen, kan vi i Bergens Tidende bedre våre rutiner for mikrofilming ved å sørge for at Depotbiblioteket i Mo i Rana får samtlige utgaver av avisen til filming.

I tillegg er manglende merking av 1. og 2. utgave nevnt som et problem. Dette skal vi se nærmere på sammen med Mediearkivet.no AS, sier Aslaug Eide.

Når en tar seg bryet med å telle og registrere artikler, hadde det vært en god ide å ta kontakt med Bergens Tidendes arkiv for en klargjøring – faktasentralen i Bergens Tidende hjelper gjerne til med å formidle stoff til studenter og forskere, kontakt oss gjerne på e-post fakta@bt.no , avslutter leder av Faktasentralen med.

Etter det arbeidet som er foretatt i Aftenposten og Bergens Tidende, og det som fremkommer som forklaring, vil Mediearkivet.no AS tilbakevise at ATEKST leder brukere på villspor. Vi er prisgitt det tekstlige innhold vi får levert fra avisene og oppfordrer andre brukere til å ta kontakt med oss i Mediearkivet dersom det oppstår uklarheter ved bruk av vår database.