I et sterkt formulert innlegg for at samfunnsforskningen må ta i bruk digitale data og nye analyseteknikker, hevder Savage og Burrows at:

Både utvalgsstudien og det kvalitative dybdeintervjuet er i økende grad utdaterte forskningsmetoder. Sannsynligvis kan disse metodene ikke gi empiriske sosiologer noen robust samfunnsposisjon i de kommende tiårene (Savage & Burrows 2007:885).

Savage og Burrows mener at hvis samfunnsforskningen ikke lærer seg å beherske bruken av digitale data, vil disipliner og aktører som er i stand til det overta dens rolle som leverandører av viktige samfunnsanalyser. De begrunner utsagnet med at digitale data er data om faktiske handlinger, samt data som gjelder for hele populasjoner og at de dermed gir store muligheter til presise beskrivelser av ulike deler av samfunnslivet. Mens surveyen er avhengig av å trekke representative utvalg og predikere med utgangspunkt i disse utvalgene, har de som analyserer webdata direkte tilgang til komplette data om handlinger og ytringer. Med andre ord omgår de som bruker digitale data representativitetsproblemet: de kan gi reelle beskrivelser. Mot det kvalitative dybdeintervjuet er argumentet at denne metoden ikke er i stand til å gripe kompleksiteten som moderne liv består av. Denne kompleksiteten kan bedre gripes i sin helhet ved å studere de enorme mengdene kulturelle uttrykk – bilder, videoer, tekst – som finnes på Internett.

Det er ingen tvil om at bruk av digitale data i forskning stiller forskere overfor nye og interessante muligheter til å analysere sosiale fenomener. Samtidig løser ikke digitale data problemer knyttet til representativitet, ekstern validitet og objektivitet (boyd & Crawford 2011). Bruken av digitale data har også sine begrensninger, og bringer inn et sett nye etiske og praktiske utfordringer. Både mulighetene og utfordringene er nær knyttet til datas karakter, men også til hvordan eierskap og tilgang til data er regulert.

I dette symposiet tar vi for oss noen av de nye forskningsmulighetene og utfordringene som ligger i bruken av internettdata og såkalte «big data», som kort fortalt er data fra alle de hverdagslivets gjøremål som registreres digitalt – bompasseringer, minibankuttak, telefonsamtaler, helsekontroller og alle former for kjøps- og bruksinformasjon. Symposiet har både et pedagogisk og et kritisk siktemål. Vi ønsker å vise potensialet som ligger i bruken av digitale data – og å inspirere norske samfunnsforskere til å forsøke å ta slike data i bruk. Samtidig vil vi invitere til kritisk refleksjon over de etiske og strukturelle utfordringene som reises i bruken av disse nye typene data. De tre tekstene i symposiet bidrar til dette på forskjellige måter, gjennom beskrivelser av utviklingen i stort, og gjennom empiriske eksempler på hvordan digitale data kan utnyttes kvalitativt og kvantitativt. Alle bidragene har samtidig et blikk for de nye etiske problemstillingene som reises ved bruken av slike data.

Torgeir Brandsar og Torkild Hovde Lyngstad gir i sitt bidrag til symposiet et konkret og praktisk eksempel på hvordan samfunnsforskningen kan ta i bruk Twitter i analyser av sosiale nettverk. Forfatterne har innhentet Twitter-data fra 96 stortingsrepresentanter med ulik partibakgrunn og brukt statistiske teknikker for å undersøke de digitale nettverkene disse imellom. De analyserer graden av sammenknytning i nettverket som helhet og i de enkelte partigruppenes nettverk, og konkluderer at politikerne tenderer mot å være tettere knyttet mot sin partigruppe enn mot andre Twitter-brukere. Arbeiderpartiets stortingsgruppe viser den sterkeste sammenknytningen. Samtidig som Brandsar og Lyngstads artikkel viser hvor anvendelig sosiale medie-data kan være, reiser forfatterne interessante spørsmål om forholdet mellom utvalg og populasjon i studien av digitale nettverk, samt om hvordan lenker og aktiviteter i digitale nettverk egentlig skal forstås som sosiale fenomener.

Sjurseike, Nesvold og Wadel fokuserer i sitt innlegg på kvalitative analyser av data fra sosiale medier. Med utgangspunkt i en studie av debatten blant muslimske kvinner på et diskusjonsforum, diskuterer de hvilken kildekritikk forskere bør utøve i studier av nettdebatt, og hvordan personvernet kan ivaretas i studier av anonyme nettdebatter spesielt. Selv om en del utfordringer knyttet til kildekritikk er parallelle til de man finner i bruken av andre data, peker forfatterne på at sosiale medie-data reiser særegne utfordringer. Særlig gjelder dette vurderinger av datas troverdighet og relevans, samt av hva slags utvalg ytringene i et diskusjonsforum representerer. Forfatterne argumenterer for at etisk sett befinner sosiale medie-data seg i en gråsone mellom offentlig og privat informasjon, og at det påhviler forskere å vurdere graden av sensitivitet nøye i design av studier. Slike avveininger bør få konsekvenser både for hvorvidt informert samtykke innhentes og hvordan forskeren håndterer hensynet til anonymitet.

I det siste bidraget til symposiet gir Bernard Enjolras en presentasjon av fenomenet big data og hva slike data kan brukes til. Han argumenterer for at den industrien som har oppstått rundt big data innebærer at privat informasjon er blitt markedsvare, og at normene rundt personvern har endret seg. I og med at Internett per definisjon er globalt og uten felles styringsstruktur, er en felles regulering av bruken av digitale data vanskelig å utforme og håndheve. I påvente av felles standarder argumenterer Enjolras for en tilpasning av personvernreglene som gjelder for samfunnsforskningens bruk av big data i Norge. Han mener dagens regler, og spesielt kravet om informert samtykke, bidrar til å hemme norske og europeiske forskningsmiljøer i den internasjonale konkurransen, og at disse burde erstattes av en konsesjonsordning for forskere og forskningsmiljøer som forplikter seg til å overholde bestemte etiske og systemiske regler, både når det gjelder lagringssikkerhet, analysemetoder og publisering.

Med fremveksten av digitale data oppstår nye muligheter, men også nye problemstillinger og utfordringer for forskningen. Digitale data etablerer også nye skillelinjer, mellom de som legger igjen sine data og de som bruker dem i sine analyser, mellom de som har tilgang til digitale data og de som ikke har det, mellom kommersielle aktører og forskningsinstitusjoner og mellom de som har kompetansen til å utnytte digitale data og de som ikke har det (boyd & Crawford 2011; Manovich 2011). Vi tror det er viktig at samfunnsforskere kjenner til og reflekterer over disse forskyvningene og endringene i betingelsene for kunnskapsproduksjon og inntar konstruktive roller både når det gjelder bruk av nye typer data og den nødvendige etiske refleksjonen. Dette symposiet er en invitasjon til nettopp dette.

Referanser

Boyd, d. & K. Crawford (2011). Six Provocations for Big Data. A Decade in Internet Time: Symposium on the Dynamics of the Internet and Society. Oxford: Oxford Internet Institute.

Manovich, L. (2011). Trending: The Promises and Challenges of Big Social Data. http://lab.softwarestudies.com/2008/09/cultural-analytics.html#uds-search-results, retrieved 09.01.13.

Savage, M. & R. Burrows (2007). The Coming Crisis of Empirical Sociology. Sociology, 41(5): 885–899.