Digitale metoder

Digitale metoder er en samlebetegnelse for de fremgangsmåder, der benytter internettet til at indsamle og analysere digital kommunikation. Oprindeligt blev begrebet digitale metoder forbundet med et specifikt perspektiv på internetstudier udviklet omkring årtusindskiftet af forskningsgruppen Digital Methods Initiative (DMI) ved Universitetet i Amsterdam (se https://www.digitalmethods.net/). For DMI beskriver digitale metoder et kritisk projekt, der søger at belyse, hvordan den digitale infrastruktur (fx søgemaskiner og sorteringsalgoritmer) påvirker, hvordan vi finder information og interagerer med hinanden på internettet (Rogers 2013).

Med udviklingen af sociale netværkssider og mobile applikationer er forskere imidlertid begyndt at anvende ‘digitale metoder’ i bredere forstand til at beskrive forskning, som anvender computerprogrammer til at indsamle og analysere data – med vidt forskellige teoretiske og metodologiske formål (se fx Snee, Hine, Morey, Roberts & Watson 2016). Selvom digitale metoder dækker over en bred palet af tilgange, så adskiller de sig fra mere traditionelle metoder i medie- og kommunikationsforskningen på en række parametre. De centrale forskelle er opsummeret i skemaet nedenfor.

Digitale metoder skiller sig klarest ud ved at være ‘født digitale’. Det betyder, at digitale metoder har udviklet sig med og er afhængig af de digitale medier – i særdeleshed internettet. Nok kan traditionelle empiriske undersøgelsesmetoder med visse modifikationer overføres til en digital kontekst (fx som observationsstudier på Facebook eller en spørgeskemaundersøgelse gennem e-mail), men digitale metoder adskiller sig på afgørende vis ved at integrere internettet i analysen af kommunikation. Digitale metoder anvender internettets infrastruktur (såsom hyperlinks, hashtags, netværksrelationer) til at studere digital kommunikation. Til det formål bruger forskere digitale værktøjer, dvs. computerprogrammer, til at tilgå og analysere data. Denne indsamlingsmetode tillader forskerne at arbejde med store datamængder på en struktureret måde. Derved bliver det muligt at indsamle og analysere millioner af tweets omkring et hashtag (eks. Bruns, Moon, Paul & Münch 2016) eller kortlægge link-relationer mellem tusindvis af hjemmesider (eks. Farrell & Drezner 2008). Samtidig er indsamlingsprocessen begrænset til de data, som kan automatiseres i et computerprogram. Det betyder, at en masse kontekstinformation (såsom hvordan en samtaletråd på Twitter visuelt hænger sammen) ikke kan registreres gennem digitale metoder. Derfor supplerer digitale og traditionelle metoder ofte hinanden i forskningsprojekter.

Digitale metoder kan groft sagt inddeles i indsamlings- og analysemetoder. To af de typiske digitale metoder forskere benytter til at indsamle internetdata er scraping og crawling. Med scraping menes den proces, hvor man udtrækker (skraber) data fra en hjemmeside eller en social netværksside ved hjælp af et computerprogram (Marres & Weltevrede 2013). Typisk indsamler man information om digitale objekter som tekstfelter, billeder, hyperlinks og specifikke sociale netværkselementer som delinger, synes godt om, hashtags, tweets, pins osv.

En crawler er et mere avanceret program, som er i stand til at identificere specifikke web-elementer, fx et hyperlink, og anvende disse elementer, fx ved at følge linket videre til destinationen. Crawlere kan derfor anvendes til at give et overblik over, hvordan hjemmesider eller sociale netværksprofiler er forbundne med hinanden. Hvis man kombinerer scrapere og crawlere, er det muligt både at indsamle informationer om de enkelte sider/profiler og analysere relationerne mellem siderne/profilerne. Et eksempel på indsamling af data med digitale metoder er netarkivering, hvor hele hjemmesider crawles og scrapes for indhold med det formål at studere internettets udvikling over tid (se fx Brügger 2013). På internationalt plan står archive.org for arkivering af internettet og i en dansk kontekst udfører netarkivet.dk en lignende indsamling.

På det analytiske plan adskiller digitale metoder sig ved at bruge meta-data (fx hvor mange retweets et givent tweet har modtaget) aktivt i analysen. Meta-data bliver tit anvendt til analyser af popularitet (fx hvilket indhold bliver delt mest på sociale netværkssider) og sociale positioner (hvilke profiler/sider optræder centralt i netværket af relationer). Til analyser af popularitet bruges ofte konventionelle statistiske teknikker såsom korrelations- og regressionsanalyser (se eks. Bro & Wallberg 2014). I de senere år er der udviklet digitale værktøjer til at analysere og visualisere frekvenser af ord (fx i ordskyer) på en række hjemmesider eller sociale medie-opslag i stil med traditionel indholdsanalyse. For at analysere sociale positioner bruger forskere i stigende grad netværksanalyse (se fx Linaa Jensen, Ørmen & Lomborg 2016). Der er udviklet specifikke værktøjer til at analysere link-netværk mellem hjemmesider (se fx Issue Crawler: issuecrawler.net/) og sociale netværksprofiler (se fx Gephi: gephi.org/), men da netværksanalyse har en lang historik før internettet (Wasserman & Faust 1994) findes der også alternativer i traditionelle statistiske programmer. Selvom analyserne typisk er af kvantitativ karakter, så lægger materialet indsamlet via digitale metoder i lige så høj grad op til kvalitative analyser (for eksempler se Rogers 2013).

I de seneste år er der kommet et væld af digitale værktøjer til at indsamle og analysere data, og der kommer hele tiden nye til. Der findes en del forskningsprojekter, som har udarbejdet lister med digitale værktøjer (fx digitalmethods.netwww.medialab.sciences-po.fr/tools/socialmediadata.wikidot.com/), som er tilgængelige for offentligheden. Mange firmaer og organisationer tillader desuden programmører, forskere og andre interessenter at tilgå data igennem Application Programming Interfaces (API’er). Her kan man hente begrænsede mængder data, som er præspecificerede af hjemmesidens ejere. Eksempelvis tillader sociale netværkssider som Twitter og Facebook, i skrivende stund, udefrakommende at hente data om interaktioner (likes, kommentarer, tweets osv.) fra offentlige profiler (se Lomborg & Bechmann 2014). Oftest er man imidlertid nødsaget til at programmere egne værktøjer for at få adgang til ønskede data. Det er en af årsagerne til, at forskning i digitale metoder sker i samarbejde på tværs af datalogi, humaniora og samfundsvidenskab.


Digitale metoder åbner nye muligheder for dataindsamling i medie- og kommunikationsforskningen, men der kommer også nye udfordringerne til. For det første lever alle digitale værktøjer til indsamling og analyse på lånt tid. Det er meget ressourcekrævende at vedligeholde værktøjerne, og de bliver derfor hurtigt forældede, når de ikke kan følge opdateringerne på hjemmesider, på sociale netværkssider, i mobile applikationer osv. For det andet er det ofte uklart, hvordan værktøjerne genererer data. Det kræver datalogisk kendskab at kunne forstå, hvordan digitale metoder som crawlere og scrapere indsamler data i praksis. For det tredje bevæger digitale metoder sig i et juridisk og forskningsetisk grænseland. Selvom data er offentligt tilgængeligt på internettet, kan det være problematisk at indsamle dem. Data kan være opretshavsbeskyttet og kan derfor ikke reproduceres i forskningen uden forudgående aftale. Ofte er data af personlig og sensitiv karakter (fx interaktioner på sociale medier), og håndtering samt publicering af data kræver derfor omhyggelige etiske overvejelser.

2017

Forfatter Jacob Ørmen
Supplerende læsning

Rogers 2013, Snee, Hine, Morey, Roberts & Watson 2016

Reference

Bro, Peter & Wallberg, Filip (2014). “Digital Gatekeeping: News media versus social media.” Digital Journalism, 2 (3), s. 446-454. <doi:10.1080/21670811.2014.895507>

Bruns, Axel; Moon, Brenda; Paul, Avijit & Münch, Felix (2016). “Towards a typology of hashtag publics: A large scale comparative study of user engagement across trending topics.” Communication Research and Practice, 2 (1), s. 20-46. <doi: 10.1080/22041451.2016.1155328>

Brügger, Niels (2013). “Web historiography and Internet studies: Challenges and perspectives.” New Media & Society, 15 (3). <doi: 10.1177/1461444812462852>

Farrell, Henry & Drezner, Daniel W. (2008). “The Power and Politics of Blogs.” Public Choice, 134, s. 15-30

Linaa Jensen, Jakob; Ørmen, Jacob & Lomborg, Stine (2016): “The Use of Twitter in the Danish EP Elections 2014.” I: Bruns, Axel; Enli, Gunn; Skogerbø, Eli; Larsson. Anders Olof & Christensen, Christian (red.). The Routledge Companion to Social Media and Politics. London / New York: Routledge, s. 503-517

Lomborg, Stine & Bechmann, Anja (2014). “Using APIs for Data Collection on Social Media.” The Information Society, 30 (4), s. 256-265. <doi: 10.1080/01972243.2014.915276#038>

Marres, Noortje & Weltevrede, Esther (2013). “Scraping the social? Issues in live social research”. Journal of Cultural Economy, 6 (3), s. 313-335. <doi:10.1080/17530350.2013.772070>

Rogers, Richard (2013). Digital Methods. Cambridge, Mass.: The MIT Press

Snee, Helene; Hine, Christine; Morey, Yvette; Roberts, Steven & Watson, Haley (2016). “Digital Methods as Mainstream Methodology: An Introduction.” I: Snee, Helene; Hine, Christine; Morey, Yvette; Roberts, Steven & Watson, Haley (red.). Digital Methods for Social Science: An Interdisciplinary Guide to Research Innovation. London: Palgrave Macmillan, s. 1-11. <doi: 10.1057/9781137453662_1>

Wasserman, Stanley & Faust, Katherine (1994). Social network analysis: Methods and applications. (Structural Analysis in the Social Sciences. Vol. 8.) Cambridge: Cambridge University Press