Oppgrader til nyeste versjon av Internet eksplorer for best mulig visning av siden. Klikk her for for å skjule denne meldingen
Ikke pålogget
{{session.user.firstName}} {{session.user.lastName}}
Du har tilgang til Idunn gjennom , & {{sessionPartyGroup.name}}

Historiografi møter algoritmer

Maskinell fjernlesning av lokalhistoriske framstillinger av kvinnehistorie, et supplement til nærlesning?
Historiography meets Algorithms
Rådgiver, Norsk lokalhistorisk institutt, Nasjonalbiblioteket
Forsker, Norsk lokalhistorisk institutt, Nasjonalbiblioteket.

Tidligere analyser av historiefaget og historieskrivingens utvikling har vært basert på nærlesning av et begrenset utvalg tekster. Nå har Nasjonalbibliotekets omfattende digitaliseringsprosjekt gjort det mulig å bruke datamaskinelle metoder til å gjøre kvantitative analyser av større tekstmengder. I denne artikkelen undersøker vi om kvantitative innholdsanalyser basert på datamaskinell fjernlesning kan representere et supplement eller korrektiv til klassisk nærlesning. Artikkelen retter søkelyset mot hvordan kvinners liv og virke har vært behandlet i by- og bygdeboklitteraturen. Bygdebøkene vi analyserer handler om 1800-og 1900-tallets historie, og er skrevet mellom 1970 og 2015. Dataprogrammene vi bruker er opprinnelig utviklet for å kartlegge ordforekomster og narrative strukturer i skjønnlitterære verker, men har også vist seg egnet til å analysere og sammenligne historiefaglige tekster. I løpet av perioden vi har studert, er det i by- og bygdeboklitteraturen skjedd en målbar økning i bruk av ord og fraser som refererer til kvinners liv og virke. Dette er særlig tydelig i bøker skrevet av kvinner. Datamaskinell fjernlesning representerer et svært effektivt heuristisk verktøy og resultatene har høy grad av etterprøvbarhet. Men vi er mer usikre på hvor godt resultatene faktisk måler signifikante endringer i by- og bygdeboklitteraturens behandling av kvinners historie.

Nøkkelord: historiografi, kvinnehistorie, digital humaniora, byhistorier, bygdebøker

The purpose of this article is to investigate to which extent quantitative content analyses based on computerized distant reading can supplement or correct a more traditional close reading. Earlier analyses of the way Norwegian history has been written have been based on the close reading of a limited number of texts. At present, the National Library of Norway’s ongoing extensive digitization project has made computer-assisted quantitative analyses of larger text corpora a viable and interesting avenue for research into this subject. In this article we focus on how the lives of women have been treated in works of local history. The texts that form the basis of our study focus on 19th and 20th century history and were written between 1970 and 2015. The programs we are using were originally developed in order to map word frequencies and narrative structures in works of literary fiction but have also proved to be well suited for analyzing and comparing parallel issues in historical studies. Our analyses show that between 1970 and 2015, there has been a measurable increase in the frequency of words and phrases that refer to women’s lives and women’s work. This is especially prevalent in texts written by female authors. Distant reading represents an effective heuristic tool and gives highly reliable results. We are less certain of how well the results actually reflect significant changes in how women’s history has been treated in Norwegian local histories.

Keywords: Historiography, women’s history, digital humanities, urban biographies, rural community histories

Innledning

Denne artikkelen har to formål. Det ene er historiografisk. Vi vil undersøke hvordan kvinnehistorie er behandlet i by- og bygdeboklitteraturen fra 1970 til 2015. Det andre formålet er metodologisk. Vi ønsker å finne ut om dataprogrammer som er utviklet for å analysere skjønnlitterære verk, også kan brukes i undersøkelser av historiefaglig litteratur. Legger vi disse to intensjonene oppå hverandre, kan vi formulere den overordnede og samlende hensikten med artikkelen slik: å undersøke kritisk om dataprogrammer kan gi ny innsikt eller kunnskap om et viktig historiografisk tema, lokal kvinnehistorie – kunnskap og innsikt som ikke lar seg etablere på basis av mer tradisjonelle metoder.

Tradisjonelt har mange historiografiske undersøkelser vært basert på en induktiv tilnærmingsmåte, det vil si nærlesning av et forholdsvis lite utvalg tekster og slutning derfra til et mye større tekstmateriale. Som Ryymin, Andresen, Heiret og Melve har påpekt, har dette resultert i arbeider som ikke er «særlig godt festet i empiriske undersøkelser».1 Liv Marthinsens historiografiske pionerarbeid «Kvinnene i by- og bygdehistorien» fra 1986 er for eksempel basert på nærlesning av tre bøker – én byhistorie og to bygdebøker – og disse tre danner premisser for en vidtfavnende konklusjon: «Samlet sett har kvinnene hittil fått en skyggeplass i bygdebøkene. Vi aner deres eksistens, men stort sett er de behandlet anonymt og generelt.»2 Selvfølgelig er Marthinsens slutning også tuftet på bred lesning av mange andre bøker, men svakhetene ved nærlesning som metode er uansett vanskelige å oppheve, fordi nærlesning har mentale begrensninger. Metoden avhenger rett og slett av hva en forsker er i stand til å lese rent fysisk, som medieviteren Eivind Røssaak sier.3 Nærlesning er dessuten ekstremt tidkrevende. Datamaskinell lesning sprenger derimot både de kognitive og de temporale barrierene og gjør det mulig «å lese» millioner av dokumenter på brøkdelen av et sekund. En av pionerene innenfor digital humaniora, Franco Moretti, betegner dette som «distant reading», fjernlesning, i kontrast til den fysiske nærlesningen.4

Materialet: Digitaliserte utgaver av by- og bygdebøker

Mulighetene for datamaskinell fjernlesning har i løpet av det siste tiåret endret seg fundamentalt, ikke minst i kraft av Nasjonalbibliotekets omfattende digitaliseringsprosjekter, som i prinsippet omfatter alle medietyper. Blant annet har prosjektene gjennom avtaler med ulike rettighetshavere gjort digitale versjoner av nesten 290 000 boktitler tilgjengelig for alle med norsk IP-adresse. Dessuten er også digitaliserte utgaver av bøker som er digitalisert under mer begrensede spredningsbetingelser, tilgjengelige for bibliotekbrukere. Til sammen er omtrent 542 000 boktitler i prinsippet tilgjengelige både for lesning og for datamaskinelle analyser.5

Vårt tekstkorpus er ganske beskjedent sammenlignet med dette. Det består av 184 by- og bygdebøker.6 Tre kriterier ligger til grunn for utvalget. For det første er undersøkelsen begrenset til sjangeren allmennhistorie. Gards- og slektshistoriene er holdt utenfor, både fordi utvalget dermed blir mer ensartet, og fordi gards- og slektshistoriene presenterer særegne metodiske utfordringer. Et annet kriterium er at vi har avgrenset oss til bøker publisert mellom 1970 og 2015, siden dette gir mulighet til å sammenligne verker utgitt både litt før og etter at kvinnehistorie ble etablert som et eget fagfelt i Norge.

Figur 1

Grafen viser i relative tall forekomsten av ordet «kvinnehistorie» i norske bøker, tidsskrifter og aviser fra begynnelsen av 1900-tallet til 2015. Ordet gjør et byks midt i 1970-åra, men særlig løfter det seg fra omkring 1990, før bruken igjen faller på begynnelsen av 2000-åra. Vi tror at fallet kan ha minst to mulige årsaker; den ene er at termen «kjønnshistorie» erstatter «kvinnehistorie» i relevante kontekster. Den andre er at kvinnehistorie, som er et abstrakt ord, i mindre grad tematiseres på et teoretisk eller refleksivt plan, kanskje fordi kvinnehistorie som empirisk disiplin blir en mer selvsagt del av historiefaget. En tredje mulighet er at kvinnehistorie som sosialhistorisk sub-disiplin, blir løftet opp og fram av den generelle interessen for sosialhistorie i løpet av 1970-åra, men også daler igjen etter hvert som interessen for sosialhistorie faller.

Grafen er utarbeidet av Lars G. Johnsen ved Språkbanken, Nasjonalbiblioteket.

Akkurat når et fagfelt etableres, kan selvfølgelig være gjenstand for diskusjon. Men i historien om den norske kvinnehistoriens framvekst er det vanlig å datere «utgangspunktet», som Kari Melby betegner det, til Ida Bloms presentasjon av fagområdet i et foredrag i 1975.7 Her definerte Blom kvinnehistorie som «all forskning som tar opp kvinners aktivitet i fortiden og problemer med særlig relevans for tidligere tiders kvinner», og vi kommer i det følgende til å holde oss til denne nokså vide rammedefinisjonen, selv om fagfeltet over tid har utviklet seg i en litt annen retning. Poenget i vår sammenheng er å finne ut om det er forskjeller i hvordan kvinners historie behandles før og etter «den kvinnehistoriske bølgen» (figur 1).8 For det tredje har vi konsentrert oss om bøker som omhandler perioden etter 1800, altså det som gjerne kalles moderne historie, fordi kvinners rettslige, sosiale og politiske situasjon endret seg fundamentalt i denne perioden; husholdsøkonomien ble avløst av markedsøkonomi, kvinner fikk nye roller i familien, i økonomien og i offentligheten, de ble synlige og deltakende på andre arenaer enn i det før-moderne og før-industrielle samfunn. Alle disse endringene har dessuten nedfelt seg i et betydelig større kildemateriale som kan belyse kvinners situasjon, og ikke minst viktig: De aller fleste kvinnehistoriske forsknings- og formidlingsarbeider, hovedoppgaver, bøker og vitenskapelige og populære artikler dreier seg om moderne historie. I en bibliografi fra 1990 inkluderte Ingeborg Fløystad 72 hovedoppgaver med kvinnehistoriske emner. De aller fleste ble til i tiårsperioden mellom 1975 og 1985. Hele 62 av dem handlet om tida etter år 1800, og forbausende mange har lokalhistorisk relevans.9 Alt i alt synes det derfor rimelig å forvente at bøker som omhandler 1800- og 1900-tallets historie gir et slags maksimumsuttrykk for gjennomslaget til kvinnehistoriske perspektiver og empiriske undersøkelser av kvinners liv og virke i lokalhistorisk litteratur.

Problemstillinger og metode

Tre spørsmål skal stå i fokus for undersøkelsen. Det første retter søkelyset mot tekstene eller bøkene i mer isolert forstand: Kan vi observere målbare endringer i måten by- og bygdebøkene skriver om kvinner og kvinners «liv og virke» i perioden fra 1970 til 2015? Det andre spørsmålet retter oppmerksomheten mot relasjonen mellom kjønn og tekst. Før 1990 er nesten alle forfattere av generelle by- og bygdebøker som omhandler moderne historie, menn. En av de første bøkene som i sin helhet er skrevet av en kvinne – Randi Rønning Balsviks to binds historie om Vardø – ble publisert i 1989.10 I det følgende tiåret vokser antall kvinnelige forfattere, men det er først etter århundreskiftet at vi kan snakke om en betydelig endring i kjønnsbalansen. Hva innebærer kvinnenes inntog? Kan vi påvise målbare forskjeller i måten kvinnelige og mannlige forfattere skriver om kvinner? Det tredje og siste spørsmålet er enda litt vanskeligere, og svaret må bli desto mer usikkert og prøvende. Som Eivind Røssaak har understreket, representerer introduksjonen av datamaskinelle metoder i humaniora en allianse med en algoritmisk kultur, og denne alliansen har som konsekvens – advarer Røssaak – at «fortolkninger og fortellinger kombineres med og til dels underordnes telling, kvalitet møter kvantitet og humaniora møter teknikkens verden.»11 Hvordan skal vi kritisk forholde oss til denne alliansen? Innebærer den at den tolkende, kvalitative eller mer «impresjonistiske» tilnærmingen til historiografiske problemstillinger får en underordnet eller sekundær status?12

På veien mot svar skal vi bruke to ulike programmer, som begge er basert på programvare skrevet i Python i Jupyter Notebook og utviklet av Lars G. Johnsen ved Språkbanken på Nasjonalbiblioteket. Det ene programmet, som vi for enkelthets skyld kaller P1, teller og sammenligner den totale forekomsten av ord i et nærmere definert korpus og visualiserer resultatene i form av stolper eller søyler. Det andre programmet – P2 – registrerer søkeord fra side til side gjennom ett forhåndsdefinert verk, og visualiserer resultatene i form av et diagram, der x-aksen (den horisontale linjen) angir hvor i teksten forekomsten finnes, mens y-aksen angir frekvensen av et ord, eller for den saks skyld et knippe av ord. I det følgende skal vi først undersøke noen eksempler på hvordan programmet P1 kan brukes, deretter skal vi se nærmere på P2.

Fjernlesning 1: Den enkle telling – den vanskelige tolkning

For å kaste lys over det første spørsmålet ovenfor – spørsmålet om diakrone endringer i hvordan den lokalhistoriske litteraturen behandler kvinnehistorie – har vi delt opp vårt hovedkorpus i flere underkorpus, ett for hvert tiår fram til årtusenskiftet (1970–79, 1980–89 og 1990–99) og ett som rommer alle bøker utgitt etter årtusenskiftet (2000–2015). Underkorpusene er av forskjellig størrelse, men programmet P1 omregner til relative verdier for forekomsten av ord, slik at det blir mulig å sammenligne dem.13 Hvis vi tar utgangspunkt i ordet «kvinne» og flertallsformen «kvinner» – som vi nærmest trivielt må forutsette at har betydning for spørsmålet om kvinners representasjon i tekstene – så ser vi i figur 2 hvordan forekomsten av ordene skiller seg en god del i de to korpusene som er de tidsmessige ytterpunktene i perioden. Vi har også hentet ut ordene «mann» og «menn» for å kunne måle forskjeller mellom kjønnene. En legger merke til at både «kvinner» og «kvinne» forekommer med større frekvens i bøker etter årtusenskiftet enn tilfellet er i 1970-åra. Men likevel: Mest overraskende er det kanskje at «kvinne» – altså i ubestemt form entall – fortsatt er så beskjedent representert i teksten – og dessuten at «kvinner» i ubestemt flertall forekommer noe oftere enn den tilsvarende formen «menn».14 Isolert sett framstår det som om denne ene indikatoren bekrefter Liv Marthinsens konklusjon, nemlig at kvinnene var tilskrevet en «skyggeplass» i lokalhistorien fram til midten av 80-åra, og at de omtales som et ubestemt kollektiv mer enn som konkrete individer. Spørsmålet er snarere om litteraturen etter årtusenskiftet er så mye bedre. Men ett eneste ord kan selvsagt ikke være mer enn en indikator i så måte. Vi må lete videre.

Figur 2

Den blå søylen angir forekomsten av substantivene «mann», «menn» og «kvinner», «kvinne» i by- og bygdebøker skrevet på 1970-tallet, den oransje tilsvarende i bøker skrevet mellom 1990 og 2015. Søylene måler forekomster pr. 10 000 tegn tekst.

De aller fleste by- og bygdebokforfatterne på 70-tallet var menn. Det samme var forfatterne i 1980-åra. Et sentralt unntak var Randi Rønning Balsvik. Som vi har nevnt ovenfor, publiserte hun i 1989 et tobinds verk om Vardøs historie fra 1850–1950. Verket ble hyllet av anmelderen Knut Einar Eriksen som et klart brudd med den tidligere litteraturen og et varsel om en vending i retning av å gi kvinners historie større plass i framtidas by- og bygdebøker:

Det epokegjørende grep er at familien, kvinner og barn har fått en mer framtredende plass enn i noen annen norsk by- og bygdehistorie. Ikke minst kvinnenes levekår og virksomhet er skildret med sikker og bred penn […] på et helt sentralt felt, behandlingen av kvinne- og barnehistorien, representerer verket et lite paradigmeskifte i praksis.15

«Epokegjørende grep», «paradigmeskifte i praksis» er sterke uttrykk fra en anmelders side. Og verket har også i ettertida fått en nærmest enestående posisjon i lokalhistorisk historiografi. Men hvor sterkt et brudd representerte verket? Og hvor paradigmatisk ble det? Innevarslet det en kvinne- eller kjønnshistorisk vending i by- og bygdeboklitteraturen? For å finne svar har vi gjort en sammenligning mellom Balsviks bøker og den tidligere litteraturen, altså underkorpusene som omfatter 1970- og 80-åra. For å få et bredere sammenligningsgrunnlag enn eksemplet ovenfor har vi ved siden av «kvinne» også søkt etter de to andre ordene Eriksen framhever i sin anmeldelse – nemlig «barn» og «familie». Videre har vi inkludert tre ord på fenomener som Balsvik selv framhever som spesielle for sitt verk: «matlaging», «sykdom» og «hjem». Også nynorskformer som «sjukdom», «born» og «heim» er inkludert, og i alle tilfeller har vi selvsagt søkt på samtlige bøyningsformer av substantivene.

Blant alle søkeordene er det noen som opptrer så sjelden at programmet ikke har fanget opp forekomsten på en måte som lar seg meningsfylt visualisere. Andre termer har fått så små utslag at vi derfor har droppet dem, men i figur 3 er de ti høyest scorende ordene representert. Presentasjonen viser at Balsvik bredt og systematisk har høyere forekomst av ord som viser til «kvinneord» enn sammenligningskorpuset. Tellingen bekrefter med andre ord tolkningen. Fjernlesningen styrker inntrykket av nærlesningen, som Knut Einar Eriksen baserer sin konklusjon på. Balsviks bøker framstår virkelig som et brudd med den tidligere litteraturen.

Figur 3

De oransje søylene gir forekomsten av en rekke substantiver i den gitte bøyningsformen i Randi Rønning Balsviks tobinds verk om byen Vardø fra 1989. Den blå søylen angir tilsvarende for andre by- og bygdehistorier utgitt mellom 1970 og 1989. Søylene måler forekomster pr. 10 000 tegn tekst.

For å kunne vurdere om boka varslet et nytt paradigme, en ny måte å skrive om kvinner i fortida, har vi også rettet lyskasteren framover i tid og sammenlignet verket med bøker utgitt i perioden 1990 til 2015. Skal vi dømme ut fra resultatene som vist i figur 4, ser det imidlertid ut som Balsvik i liten grad har påvirket litteraturen generelt. Det kan selvsagt være enkeltverk som har behandlet kvinners liv og virke på en tilsvarende måte, men som går under radaren for programmet vi bruker. Og vi vet det finnes forfattere som bruker andre kvinne- og kjønnsperspektiver enn Balsviks. Basert på resultatet i figur 4 virker det likevel rimelig å anta at verket ikke har fått paradigmatisk betydning – det vil si at det ikke er blitt et forbilde, et mønster for andre forfattere, et eksempel til etterfølgelse. Men på dette punktet støter tellingen og målingen av ord mot en slags erkjennelsesmur, en mur som bare kan overskrides ved å undersøke tekstenes narrative strukturer, altså hva slags fortellinger om kvinner, barn og familier som forfatternes prosjekter åpner for eller stenger ute.

Figur 4

De oransje søylene angir som i figur 3 forekomsten av 10 substantiver i Randi Rønning Balsviks tobinds verk om byen Vardø fra 1989. Den blå søylen angir tilsvarende for andre by- og bygdehistorier utgitt i perioden 1990–2015. Søylene måler også i dette tilfellet forekomster pr. 10 000 tegn tekst.

Fjernlesning 2: Telling og fortelling i Vardøs historie

Å finne, undersøke og analysere slike komplekse strukturer har tradisjonelt vært nærlesningens eksklusive domene. Og ved nærlesning av Balsviks byhistorie finner vi et fortettet uttrykk for hennes kvinnehistoriske prosjekt i begynnelsen av verkets andre bind. I dette nøkkelavsnittet skiller hun mellom to samfunnssfærer: «den offentlige sfæren», dominert av menn, og «den private sfæren», preget av kvinner.16 Sfærene er forskjellige på flere plan. Den offentlige representerer samfunnets produksjon, den private står for reproduksjon; den første er kjennetegnet av lønnsarbeid, den andre av ulønnet arbeid. Den første er synlig og har etterlatt seg et stort skriftlig kildemateriale, den andre er skjult og har derfor avsatt få skriftlige spor. Kvinners arbeid «var så selvfølgelig som luft og vann og behøvde ingen beskrivelse». Balsviks prosjekt er å åpne opp privatsfæren og fortelle historien om «det skjulte arbeidet» som foregikk der, «kvinnfolkarbeidet», arbeidet knyttet til omsorg for barn og familie, stell av hus og klær, matstrev og matlaging, men også en rekke omsorgsoppgaver overfor «de som skulle føde, de foreldreløse, de gamle, de syke og døende.»17

Så langt nærlesningen. Det andre programmet vi introduserte ovenfor – P2 – gir oss en mulighet til å få et grafisk og visuelt uttrykk for hvordan Balsvik gjennomfører prosjektet, altså hvordan hun konkretiserer og praktiserer tosfæreteorien i framstillingen av Vardøs historie. Som tidligere nevnt, er programmet utviklet for å gi et digitalt innsyn i skjønnlitterære teksters narrative struktur. Men historiefaglige tekster er også generelt kjennetegnet av narrative strukturer, noe som neppe krever nærmere begrunnelse. Og by- og bygdehistoriske framstillinger, som legger vekt på populær formidling til et bredt publikum, er i spesiell grad preget av kronologisk framskridende fortelling. Følgelig framstår programmet som relevant for undersøkelse av vårt korpus. Mens programmet vi har anvendt tidligere – P1 – er begrenset til søk på ett og ett ord av gangen, gir P2 muligheter til å samle en sekk eller pose av ord, og deretter «tråle» gjennom en bestemt bok for å finne forekomster av ordene. Slik kan vi kombinere ord som er nært assosiert med hverandre eller refererer til samme situasjon, prosess eller sfære i virkeligheten.

Med utgangspunkt i Balsviks konkretiseringer av tosfæreteorien, har vi laget en fortegnelse over ord som til sammen gir et representativt uttrykk for privatsfæren, slik vi møter den i Balsviks verk. Substantiver som «kvinne», «familie» og «barn» i alle bøyningsformer er selvsagt viktige i denne sammenheng, men også «mor», «far», «hjem», «hushold», «husholdning», «mat», «matstell», «kosthold», «strikking», «søm», «vask», «bad», «svangerskap», «barsel», «helse» og «sykdom» som Balsvik trekker fram som eksempler på privatsfærens ansvarsområder. Tilsvarende har vi satt opp en fortegnelse over ord som representerer den offentlige sfæren, ord som for eksempel brukes for å beskrive økonomiske, sosiale og politiske forhold på lokalplanet, ord som «næringsliv», «fiskeri», «fabrikk», «bedrift», «sysselsetting» eller «reder», «kjøpmann», «arbeider», «fisker» eller «bystyre», «formannskap», «vedtak», «valg» osv.

På denne måten har vi samlet to sekker av ord, eller kanskje er det bedre å bruke et annet bilde, og si at vi har laget to trålposer, som vi kan bruke til å gjøre datamaskinelle fisketurer etter disse ordene i Balsviks tekst. Resultatet ser vi i figur 5, der tallene i x-aksen (den horisontale) representerer antall tegn fra første til siste side i teksten, mens y-aksen tegner frekvensen av ord i henholdsvis «privatsfæren» og «den offentlige sfæren».18 Vi ser at Balsvik konsentrerer framstillingen av privatsfæren i den første tredjedelen av boka, nærmere bestemt i det store kapitlet «Levekår og kvinnekår», noe som ikke er overaskende. Vi legger også merke til at privatsfæren stiger over den offentlige sfæren i siste del av boka, der temaet er krig, okkupasjon og gjenreisning, noe som er mer uventet – fordi lokalhistoriske framstillinger av okkupasjonen generelt er mer preget av krigshandlinger, lokale helter (som oftest var menn) og samfunnet utenfor hjemmets sfære, enn av hverdagsliv eller kvinner og barns situasjon. Men samtidig er denne vektforskyvningen helt i tråd med Balsviks prosjekt.

Figur 5

Grafene angir henholdsvis forekomsten av ord som refererer til «Den private sfæren» (oransje graf) og «Den offentlige sfæren» (blå graf) i andre bind av Randi Rønning Balsviks Vardø-historie. X-aksen (den horisontale) teller antall tegn fra første til siste side i boka, og denne vil følgelig variere med bokas sidetall. Y-aksen angir summen av forekomstene av et større eller mindre utvalg ord (en «ordsekk») innenfor ulike seksjoner av boka. For å gjøre det lettere å sammenligne grafene har vi lagt en linje langs 40 forekomster. Se for øvrig brødteksten.

Vardøs historie: Et paradigmeskifte?

Spørsmålet vi reiste ovenfor, var imidlertid om Vardø-verket introduserte en ny måte å skrive om kvinner og kjønn i by- og bygdeboklitteraturen, som fikk mønsterdannende betydning. Med utgangspunkt i Balsviks egne formuleringer av sitt prosjekt virker det ikke urimelig å si at Balsviks måte, hennes kvinnehistoriske metode, kommer godt til syne i figur 5, som speiler en dominerende interesse for «privatsfæren», den sfæren der kvinner primært lever og virker i mesteparten av den historiske perioden vårt tekstkorpus omhandler. For å finne ut om denne måten fikk paradigmatisk betydning, må vi prøve å sammenligne narrative strukturer i Balsviks verk med seinere litteratur. Dette er problematisk.

Et første problem ligger selvfølgelig i hvordan de opprinnelige trålposene eller ordsekkene er satt sammen. Sekkene vi har brukt ovenfor, er naturligvis tilpasset Balsviks prosjekt, basert på hennes tekster og avspeiler dessuten samfunnsforholdene langs finnmarkskysten. Som et forsøk på å kompensere for denne skjevheten har vi gått gjennom alle bøker utgitt mellom 1990 og 2015 og funnet termer som vi kategorisert i den ene eller andre ordsekken, altså som referanser til enten «privatsfæren» eller «den offentlige sfæren». Kriteriene for å velge den ene eller andre sekken er i grunnleggende forstand de samme som vi har brukt ovenfor, i sorteringen av Vardø-verkets tekst, men selvfølgelig vil det være et element av vilkårlighet knyttet til våre tolkninger. Vi tror imidlertid at totalbildet likevel representerer tekstenes narrative mønster – og det er dette som er hovedsaken her – på en adekvat måte. Et annet problem er at vi trer Balsviks tosfæreteori ned over alle andre by- og bygdebokforfattere. Men utgangspunktet for sammenligningen er nettopp å vurdere om Balsviks bøker ble forbilder for seinere bøker, og dessuten virker relasjonen mellom privatsfære og offentlig sfære som et relevant mål på tekstenes interesse for kvinners liv og virke – i alle fall i mesteparten av det tidsrommet vårt korpus omhandler.

Figur 6–7

To verker som viser narrative mønstre som ligner bind to av Randi Rønning Balsviks Vardø-verk. Øverst: Astrid Andresen Handelsfolk og fiskerbønder 1794–1900. Tromsø gjennom 10 000 år fra 1994. Nederst: Øivind Bjørnson Haugesund 19141950. Dei trødde sjøen som utkom i 2004. Grafene angir henholdsvis forekomsten av ord som refererer til «Den private sfæren» (oransje graf) og «Den offentlige sfæren» (blå graf). Se ellers brødteksten.

Vi har gjort datamaskinelle undersøkelser av omkring 30 bøker fra perioden etter 1990, og det er få tekster som har et målbart narrativt mønster som er beslektet med Vardø-boka. Nærmest kommer Astri Andresens bok om Tromsø, Handelsfolk og fiskerbønder, fra 1994 og Øivind Bjørnsons bok om Haugesund, Dei trødde sjøen, fra 2004 (figur 6 og 7).19 Begge framviser dominerende søyler for termer assosiert med privatsfæren, og ved nærlesning av tekstene finner en at søylene refererer til kapitler eller delkapitler der forfatterne drøfter temaer som barn (særlig Andresen), familie, hushold og velferd (spesielt Bjørnson). Mye vanligere i litteraturen er imidlertid fortellingsmønstre som står i kontrast til dette, og der ord knyttet til den offentlige sfæren dominerer framstillingen. I figurene 8 og 9 har vi gitt eksempler på dette fra to tekster, Anders Bjarne Fossens historie om Askøy fra 1998 og Yngve Skjævelands historie om Stord som utkom i 2006.20 Vi har sammenlignet med 20 bøker fra 1970- og 80-åra. Også i disse tiårene er det primært den offentlige sfæren som dominerer, men bildet er komplekst, og det finnes bøker som gir privatsfæren ganske god dekning. Likevel er nok forfatternes narrative individualitet det mest framtredende trekket vi har observert etter å ha gjort dette – riktignok begrensede – datamaskinelle lengdesnittet gjennom bøkene. Ingen bøker ligner helt på hverandre, noe som er litt overraskende, på basis av at by- og bygdeboklitteraturen ofte oppfattes som «stivna i ein sjanger», som Ståle Dyrvik har sagt, og i ferd med «å daudkøyrast på sitt smale spor», som han advarte for snart tretti år siden.21 Stort bedre har det ikke gått i åra etter, skal vi tro oppfatningen til evalueringskomiteen som undersøkte norsk historieforskning i 2008 og beskrev lokalhistorie som «en sterkt normert tradisjon som er etablert langt tilbake».22 Sant nok, men med utgangspunkt i det narrative mangfoldet som synes å stige fram fra denne fjernlesningen, kan det være grunn til å undersøke litteraturen nærmere.

Figur 8–9

To verker som viser narrative mønstre som er forskjellige fra bind to av Randi Rønning Balsviks Vardøverk. I begge tilfeller preges framstillingen av ord assosiert med den offentlige sfæren (blå graf), mens den private sfæren er noe mindre representert (oransje graf) Øverst: Anders Bjarne Fossen Det nye Askøy blir til 18701940, Askøys historie bind II fra 1996. Nederst: Halvard Tjelmeland: Fra byfolk og bona til tromsøværing 1945-1996. Tromsø gjennom 10 000 år. For en nærmere kommentar, se brødteksten.

Bildet er også sammensatt hvis vi skiller de drøyt 20 bøkene skrevet av kvinner ut som et eget korpus, og sammenligner det med forskjellige kronologiske korpus med mannlige forfattere. Men jamt over er det nok en tendens til at kvinner legger større vekt på privatsfæren. Forskjellene mellom mannlige og kvinnelige forfattere kommer tydeligere fram hvis vi i stedet for å sammenligne narrative linjer retter søkelyset mot ordtellinger, slik det første programmet vi introduserte, gir muligheter for. Vi har valgt omtrent det samme knippet av ord som vi tidligere har brukt – ord som for det første er intuitive (mann, kvinne) eller for det andre er nært assosiert med privatsfæren (familie, barn). I de to siste figurene har vi sammenlignet et korpus med bøker skrevet av kvinnelige forfattere fra perioden 1990–2015 med bøker av mannlige forfattere fra samme periode. Som vi ser av figur 10, bruker kvinnelige forfattere den ubestemte flertallsformen «kvinner» betydelig oftere enn menn, og det samme gjelder ordets entallsform. Det siste indikerer kanskje at «individualisering» av kvinner – av kvinnelige enkeltskjebner – som Liv Marthinsen etterlyste i midten av 1980-åra, fortsatt ikke er veldig framtredende i bøkene. Entallsformen «mann» derimot, brukes betydelig mer og omtrent på samme nivå av både mannlige og kvinnelige forfattere. Også når det gjelder bruk av nøkkelord fra privatsfæren – som «barn» og «familie» – er det markante ulikheter mellom kvinnelige og mannlige by- og bygdebokforfattere (figur 11).

Figur 10–11

De oransje søylene oppgir forekomsten av en rekke substantiver i et korpus som bare består av tekster skrevet av kvinner. Tilsvarende representerer den blå søylen forekomster i et korpus skrevet av menn. Begge omfatter tekster skrevet mellom 1990 og 2015.

Humaniora og algoritmisk kultur

Datamaskinelle undersøkelser av den typen vi har utført ved bruk av to ulike Jupyter Notebook med Python-programmer, representerer primært nye verktøy, nye kvantitative instrumenter i utforskningen av tekster.23 Som metode betraktet, representerer imidlertid ikke slike analyser noe aldeles nytt. Tvert imot har kvantitative og systematiske innholdsanalyser av tekster lenge vært en etablert framgangsmåte innenfor samfunnsvitenskap og humaniora.24 Vitenskapshistorisk har metoden opphav i etterkrigstidas amerikanske samfunnsforskning som var båret oppe av en visjon om å finne kausale, nærmest naturvitenskapelige, lover som kunne forklare samfunnet. Poenget med tellinger av observerbare ord eller kombinasjoner av ord i tekster – for eksempel i partiprogrammer eller politiske taler – var nettopp å kunne måle tyngden eller betydningen av ett utsagn eller en type utsagn i forhold til andre: Jo flere ganger et politisk budskap dukket opp, jo større verdi eller vekt hadde det, og desto større var muligheten for at det forårsaket handling. Metoden har vært gjenstand for kritikk fra human- og samfunnsvitenskapelig hold, og mye av denne kritikken er også relevant i vår sammenheng.25

Tre viktige premisser for kvantitativ innholdsanalyse er at mening er observerbar, og derfor lar seg se og telle; at den er konstant, slik at selv om en måler forekomsten av et ord på forskjellig tid og i ulike tekster, så måler en det samme; og endelig at frekvens har betydning, det vil si at antall ganger et ord brukes i en tekst, har betydning for hvor viktig ordet er i konteksten. Alle de tre premissene har vært gjenstand for kritikk, som kort og punktvis kan resymeres slik: Mening kan ikke observeres, men må tolkes og prøves i relasjon til teksten for øvrig, i forhold til andre tekster og til ytre forhold som påvirker teksten, samfunnsmessige maktforhold for eksempel. Mening er ikke konstant, men flytende, «i evig forandring», påvirket av meningskjeder den står i sammenheng med eller i opposisjon til. Og endelig er heller ikke frekvens et pålitelig mål på hvor viktig et mer eller mindre bestemt meningsinnhold er, «[h]vor ofte noe påkalles, er […] mindre viktig enn i hvilken form og kontekst det trer fram», argumenterer Øyvind Bratberg.26

En annen vanlig kritikk mot kvantitative innholdsanalyser, som i enda høyere grad kan reises mot datamaskinelle analyser, er at de sikrer høy etterprøvbarhet eller reliabilitet, men at dette ikke står i forhold til validiteten. Mer konkret: Når vi måler enkeltord eller store ordsekker med Python notebook får vi ut resultater som er fullstendig etterprøvbare. Resultatene lar seg reprodusere i aller minste detalj. Reliabiliteten er stor, og står i klar kontrast til de mer diskutable konklusjonene som følger av kvalitative eller nærlesende metoder, metoder som ifølge Ryymin og hans medforfattere har dominert historiografiske undersøkelser.27 Den høye graden av reliabilitet er også et av de sterkeste argumenter for å ta datamaskinelle analyser i bruk. Spørsmålet er imidlertid om etterprøvbarheten står i et rimelig forhold til validiteten, det vil si om vi faktisk måler det vi teoretisk sett påstår at vi måler? Igjen mer konkret: Når vi måler at en bok, eller et nærmere avgrenset korpus av bøker, bruker ord som «kvinne», «barn» eller «familie» med større eller mindre frekvens enn en annen bok eller et annet korpus av bøker, kan vi da slutte noe om kvinneperspektivene til forfatterne av teksten? Kan kvinneperspektivenes tyngde eller mening i en framstilling måles? Er ordenes mening så konstante at de kan si noe om endringer over tid? Det enkle svaret er at vi ikke vet. For å få like klare svar på validiteten som reliabiliteten trenger vi først og fremst flere undersøkelser av ulike historiografiske temaer med fjernlesende metoder.

Konklusjon: Tolkning eller telling – eller begge deler?

Med dette utgangspunktet må også svarene på de to første problemstillingen vi reiste i begynnelsen, bli prøvende og forbeholdne: Vi kan observere etterprøvbare endringer i hvordan by- og bygdebokforfatterne skriver om kvinner. Ved å bruke Randi Rønning Balsviks verk om Vardø som et fyrtårn, kan vi se at tekstene som er utgitt på 1970- og 80-tallet inneholder færre referanser til ord som «kvinne», «barn» og «familie» enn tekster publisert etter 1990. Vi kan også observere målbare og etterprøvbare resultater som viser at tekster fra 1970- og 80-åra relativt sett er preget av større vekt på den offentlige sfæren enn privatsfæren, den sfæren der kvinner i størsteparten av vårt tidsspenn hadde sitt liv og virke, mens det motsatte synes å være tilfelle for tekster publisert etter 1990. Videre kan vi observere og måle at tekster skrevet av kvinnelige forfattere inneholder flere referanser til ord som «kvinne», «barn» og «familie» enn tekster skrevet av menn i samme periode. Og vi har tilsvarende resultater som tenderer mot å vise at kvinnelige forfattere skrev mer om privatsfæren enn menn gjorde i den perioden kvinnelige fagfolk for alvor meldte seg på som forfattere av by- og bygdebøker.

Men hvilken validitet dette har, er vi altså usikre på, noe som selvsagt har betydning for hvordan vi skal besvare det tredje spørsmålet, spørsmålet om hvordan vi skal forholde oss til eller bruke fjernlesende verktøy og metoder. La oss begynne med det selvsagte: Datamaskinell fjernlesning er et uvurderlig heuristisk verktøy. Ved hjelp av programmer som dem vi har tatt i bruk her, kan vi søke opp enkeltord og knipper av ord i et stort tekstmateriale på brøkdelen av et sekund. Litt mindre selvsagt: Fjernlesning kan også anvendes heuristisk på en mer avansert måte, ved at den hjelper oss til å se store tekstmengder fra ulike perspektiver – gjennom varierende utvalg av ord – og dermed setter oss på sporet av perspektiver eller problemstillinger, både innenfor teksten og i virkeligheten utenfor, som vi ellers ikke hadde tenkt på muligheten av. Videre er det vår erfaring at fjernlesning som verktøy for forskning fungerer best i kombinasjon med nærlesning. Eller litt sterkere sagt: Kvantitativ fjernlesning er mest nyttig når den samkjøres med kvalitativ nærlesning, gjerne slik at relasjonen mellom fjern og nær lesning får karakter av en hermeneutisk spiral, som gradvis fører til ny innsikt.

Litteratur

Andresen, A. (1994). Handelsfolk og fiskerbønder 1794–1900. Tromsø gjennom 10 000 år. Tromsø kommune.

Avdem, A. J. (1988). Kvinnehistorie i lokalhistoria. Ei utfordring og nødvendig fornying. Heimen, 25, 193–211.

Balsvik, R. R. (1989 a). Vardø. Grensepost og fiskevær 1850–1950, bind 1. Vardø kommune.

Balsvik, R. R. (1989 b). Vardø. Grensepost og fiskevær 1850–1950, bind 2. Vardø kommune.

Bergström, G. & Boréus, K. (red.). (2012). Textens mening och makt. Metodbok i samhällsvetenskaplig text- och diskursanalys. Lund: Studentlitteratur AB.

Bjørnson, Ø. (2004). Haugesund 1914–1950. Dei trødde sjøen. Bergen: Vigmostad og Bjørke.

Blom, I. (1977). Kvinnehistorie som forskningsområde. I I. Blom & G. Hagemann (red.), Kvinner selv … Sju bidrag til norsk kvinnehistorie (s. 11-21). Oslo: Aschehoug og Co.

Bratberg, Ø. (2014). Tekstanalyse for samfunnsvitere. Oslo: Cappelen Damm Akademisk.

Burdick, A., Drucker, J., Lunefeld, P., Presner, T., Schnapp, J. (2012). Digital Humanities. Cambridge, London: The MIT Press.

Dyrvik, S. (1981). Merknader [til Kva er lokalhistorie?]. Heimen, 18, 143f.

Eriksen, K. E. (1990). Anmeldelse av Vardø. Grensepost og fiskevær 1850–1950, b. 1 og 2. Historisk tidsskrift, 69, 378–383.

Fløystad, I. (1990 a). Kvinnehistorie i Norge i Norge 1970–1990. Noen linjer. Historisk tidsskrift, 69, 403–415.

Fløystad, I. (1990 b). Kvinnehistorie i Norge. En bibliografi. Historisk tidsskrift, 69, 598–621.

Fossen, A. B. (1996). Det nye Askøy blir til 1870–1940. Askøys historie II. Bergen: Grafisk Hus.

Fyllingsnes, F. (1997). Norsk lokalhistorisk litteratur. Ein bibliografi ca. 1900–1996. Oslo: Norsk lokalhistoriske institutt.

Hagemann, G., Melby, K., Roll-Hansen, H., Sandvik, H. og Øye, I. (2020). Med kjønnsperspektiv på norsk historie. Oslo: Cappelen Damm Akademisk.

Hayles, N. K. (2012). How We Think. Digital Media and Contemporary Technogenesis. Chicago and London, The University of Chicago Press.

Marthinsen, L. (1985). Kvinnene I den generelle by- og bygdehistorien. I A. Tranberg & H. Winge, Kvinnekår i det gamle samfunn (s. 7–21) Oslo: Norsk lokalhistorisk institutt.

Melby, K. (1996 a). Norsk kvinnehistorie 1975–1995; kjønnets endrede vitenskapelige status. Historisk tidsskrift, (1), 185–214.

Melby, K. (1996 b). Historiografi og kjønn. I Børresen, A. K., Myhre, J. E. og Stugu, O. S. (red.), Historikerne som historie. Rapport fra HIFO-seminaret 1995, nr. 14, Skriftserie fra Historisk institutt. Trondheim: NTNU.

Myhre, J. E. (2009). Mange veier til historien. Om historiefagets og historikernes historie. Oslo: Unipub AS og Tid og Tanke.

Rian, Øystein. (1988). Anmeldelse av Kvinnekår i det gamle samfunn ca. 1500–1850. Norsk lokalhistorisk institutt 1986. Historisk tidsskrift, 67, 114–115.

Ryymin, T. S., Andresen, A., Heiret, J. og Melve, L. (2019). Hovedtendenser i norsk historievitenskap 1969–2015 belyst gjennom doktoravhandlinger. Historisk tidsskrift, (2), 130–166. https://doi.org/10.18261/issn.1504-2944-2019-02-03

Røssaak, E. (2018). Når nasjonens hukommelse digitaliseres: Kulturens ubevisste vender tilbake. Mediehistorisk tidsskrift, (2), 22–41.

Stråth, B. Simonsen, D. G., Warring, A., Lindkvist, T, Villstrand, N. E. (2008). Evaluering av norsk historiefaglig forskning. Oslo: Norges forskningsråd.

Tjelmeland, H. (1998). Fra byfolk og bona til tromsøværing 1945–1996. Tromsø gjennom 10 000 år. Tromsø kommune.

1Ryymin, T. S., Andresen, A., Heiret, J. og Melve, L. 2018, s. 134.
2Marthinsen 1986, s. 20.
3Røssaak 2018, s. 33.
4Ibid.
5Digitaliseringen foregår fortløpende. De eksakte tallene pr. 18.07.2020 er henholdsvis 287 546 og 541 935.
6Korpuset er utarbeidet av bibliotekar Siri Iversen, Nasjonalbiblioteket, og basert på Fyllingsnes 1996 supplert med nyere litteraturlister utarbeidet ved Norsk lokalhistorisk institutt.
7Blom 1977, s. 13. Avdem 1988, s. 194. Melby 1996a, s. 186. Hagemann, G., Melby, K., Roll-Hansen, H., Sandvik, H. og Øye, I. 2020.
8Rian 1988, 114.
9Fløystad 1990 a, s. 404 og 405 (tabellen). Fløystad 1990 b, s. 598–621.
10Balsvik 1989 a og b. Vi tror også at Balsvik var den første kvinne som var alene om å skrive en by- eller bygdebok med 1800- og 1900-tallets lokalhistorie som periode. Bodil Wold Johnsen var medforfatter i Stavanger mellom sild og olje (1988) og Berit Nøkleby var den ene av to forfattere til Drammen. En norsk østlandsbys utviklingshistorie (1981).
11Røssaak 2018, s. 33.
12Ordet «impresjonistisk» er anvendt om en tolkende tilnærming til et historiografisk spørsmål av Myhre 2009, s. 40, og referert til senere av Ryymin et al., 2019 (note 22).
13Størrelsen på underkorpusene: 1970–79 = 16 bøker; 1980–89 = 30 bøker; 1990–99 = 84 bøker; 2000–2015 = 54 bøker.
14Vi har også undersøkt de bestemte formene, men tallene er her så små at de knapt lar seg registrere med programmet, og for anskuelighetens skyld har vi derfor utelukket dem fra visualiseringen.
15Eriksen 1990, s. 378, s. 383.
16Balsvik 1989 b, s. 16.
17Samme sted.
18Det er foreløpig en svakhet ved programmet vi bruker, at sidetall ikke framkommer i x-aksen, slik at vi direkte kunne spore hvor vi finner de ulike konsentrasjonene av ord.
19Andresen 1994; Bjørnson 2004.
20Fossen 1996.
21Dyrvik 1981, s. 143.
22Stråth et al. 2008, s. 120f.
23Hayles 2012; Burdick et al. 2012.
24Bergström & Boréus 2012, s. 49–90; Krippendorf 2013; Bratberg 2014.
25Bratberg 2014, s. 98f; Krippendorf 2013, s. 22f.
26Bratberg 2014.
27Ryymin et al. 2019.

Idunn bruker informasjonskapsler (cookies). Ved å fortsette å bruke nettsiden godtar du dette. Klikk her for mer informasjon