Den virala artikeln

Skrivet av: Magnus Engström – Utvecklare, MittMedia

 

I mediebranchen (och allmänt på Internet) används ordet viral som en benämning för innehåll som rekommenderas och sprids såpass snabbt mellan olika personer att en kritisk massa av länkdelningar snabbt uppstår och leder till ett stort antal sidvisningar. När en nyhetsartikel blir viral slutar den i regel att agera efter hur en artikel förväntas bete sig och andra faktorer kommer i spel.

 

Ordet viral härstammar från virus. När ett virus sprider sig hos den insjuknande är det en viral infektion (virusinfektion) som pågår. Eftersom viruset genom interaktioner sprider sig från person till person är det enkelt att förstå likheterna mellan sjukdomsepedemin och den virala nyhetsartikeln.

 

För att förstå och motarbeta en sjukdomsepidemi måste den analyseras i hopp om att kunna förutse den fortsatta spridningen.

 

Att hitta metoder för att förutspå framtiden har alltid varit den viktigaste hörnstenen i samhället. Förändringar i vädret styr när det är dags att så skörden, skaderapporterna förväntas påverka matchresultatet, föraningar om dåliga kvartalsrapporter sänker börserna och opinionssiffrorna avslöjar ofta det kommande valresultatet.

 

Tillvägagångssätten är många. Att spå i kaffesump må vara en ett ganska oprecist verktyg medan en tolkning av indicier (eller en magkänsla) ofta kan vara chockerande exakt. I andra fall finns det enorma mängder värdefull data att analysera, bara någon kan ställa rätt fråga till databasen.

 

Google har i över 15 år lagrat extremt värdefull data. 2004 lanserades Google Trends, vilket för första gången gjorde det möjligt att agera på de miljarder söktermer som varje år sparas i databaserna. Samhällsnyttan var tidigt uppenbar, men det skulle ändå dröja ytterligare några år innan någon i medicinskt syfte lyckades formulera rätt fråga.

 

2008 lanserades Google Flu Trends. Genom att med algoritmer analysera sökningar gällande hälsa och sjukdomssymptom kan Google med detta verktyg förutspå en epidemi med (enligt vissa mätningar) 97 procents säkerhet.

 

Jag har i den här bloggposten analyserat statistik från MittMedias webbsajter och ett flertal andra större nyhetssajter. Genom data från Facebook, Comscore, Chartbeat, KIA Index, Adtoma Fusion och Google Analytics är mitt mål att försöka bryta ner den virala artikeln i sina beståndsdelar i hopp om att förstå hur den uppstår och hur vi kan förutspå när och hur en artikel övergår till att klassas som viral.

 

Genom att hitta relevanta söktermer går det att motarbeta spridningen av virala epidemier. På samma sätt kan vi genom att analysera trafikströmningar och användares beteenden förutspå vårt virala innehåll.

 

Jakten på viral trafik har ursprungligen sina rötter i den så kallade räckvidsaffären som innebär att desto större trafikvolym en sajt kan uppbringa desto högre annonsintäkter. Detta beror i sin tur på att digital annonsering historiskt haft mycket av sin grund i antingen marknadsföring av digitala tjänster eller ren varumärkesbyggnad. Detta håller dock på att förändras genom ett räckvidsaffären sakta skiftas över till målgruppsfokus, vilket möjliggör andra typer av annonsaffärer riktade mot attribut hos besökaren som ser annonsen.

 

Idag är viral trafik i allt större mån en möjlighet att nå en så bred publik som möjligt med erbjudanden om premiumkonton, prenumerationer, försäljning etc.

 

Jag kommer vid upprepade tillfällen att referera till artiklar. För att undvika begreppsförvirring vill jag redan nu fastställa att en artikel i detta sammanhang motsvarar en enskild sida på en webbsajt med innehåll som är publicerat av en redaktion. Det kan alltså röra sig om rena nyhetstexter, opinionsmaterial, video och all annan typ av innehåll som förekommer på en nyhetssajt.

 

Statistik och verklig data

Det finns gott om rådata att förhålla sig till när MittMedias webbtrafik ska analyseras. Men rådata blir snabbt väldigt oprecist, och i detta fall kommer mycket av arbetet ligga i att analysera förhållandevis små förändringar som sker under en mycket kort tidsperiod. Därför behövs först och främst en rejäl datatvätt.

 

Mätverktyg visar på att MittMedias sajter gemensamt hanterar över 1 000 000 sidvisningar per dag, eller mer exakt 41670 sidvisningar i timmen.

 

Mindre än en procent av MittMedias innehåll konsumeras mellan klockan 23.00 och 05.59 (nattugglor tycks således vara en outforskad målgrupp), därför kommer jag fortsättningsvis i denna bloggpost utgå från att ett dygn utgörs av 17 timmar (vilket även råkar vara dygnslängden om du befinner dig på Uranus). Jag refererar till detta som ett aktivt dygn.

 

Trafikutvecklingen på MittMedias artiklar under 42 timmar

 

Vidare utgör startsidor och underavdelningar en stor del av det totala antalet sidvisningar, och även detta måste filtreras. Grovt avrundat utgör dessa hälften av den totala mängden sidvisningar.

 

Med dessa filter på plats, och under en mätperiod på tre månader, visar Comscore att artiklarna sammanlagt leder till nära 26500 sidvisningar/timme. En annan rapport (med samma filter) visar att trafiken på en genomsnittlig dagsfärsk artikel är ungefär 250 sidvisningar/timme. Detta är naturligtvis gravt missvisande för många artiklar då de publiceras, redigeras och delas mellan redaktioner kontinuerligt, men ger oss i alla fall en tydlig riktlinje: en bra artikel kan alltid förväntas ha minst 250 läsare per timme under det aktiva dygnet.

 

Eftersom jag redan tidigare fastställt att ett statistiskt dygn hos MittMedia inte innehåller timmarna mellan klockan 23.00 och 05.59 kommer jag vidare i denna bloggpost att betrakta alla artiklar som dykt upp under natten som att de publicerades först klockan 06.00.

 

Den sociala trafiken

En standardrapport baserad på en tidsrymd av fyra veckor pekar i regel på att omkring 15% av alla MittMedias besök anländer via sociala medier. Detta i sig är naturligtvis en stor trafikvolym. Betänk att den ofiltrerade mängden sidvisningar per dag oftast överstiger en miljon. Det ger 150 000 ”sociala” sidvisningar/dag.

 

Men för att få relevanta siffror att utgå från bör filtren som tidigare användes på rapporter om sidvisningar även appliceras här.

 

Resultatet blir att en genomsnittlig artikel får 28% av sin trafik från sociala medier. Mer intressant blir det om vi är än mer granulära och tittar på den sociala trafiken fördelad över ett aktivt dygn på 17 timmar. En standardartikeln kan under en förmiddag väntas få 20-25% av sina sidvisningar förmedlade via sociala medier. Senare under kvällen har dessa siffror stigit till 30-35%. Detta innebär att en artikels viralitet måste bedömas olika beroende på klockslaget artikeln publicerats.

 

Den sociala trafiken och antalet sidvisningar under ett aktivt dygn på 100 artiklar i standardsegmentet

 

Vad är en viral artikel hos MittMedia?

Med grund i det data som presenteras ovan går det att skärskåda de virala artiklar MittMedia publicerat under 2014.   Det finns tyvärr inga tydliga förslag på gränsvärden för vad som kan och bör klassas som viralt innehåll. För att komma vidare har jag helt ovetenskapligt därför i detta fall utgått från att en viral artikel måste uppfylla följande kriterier:

  • Majoriteten av artikelns läsare anländer via sociala medier.
  • Under tre dagar (direkt vid publicering) har artikeln minste tio gånger fler läsare än medianartikeln under samma tidsperiod.
  • Artikeln har delats/gillats/kommenterats vid mer än 5000 tillfällen (detta bör exponera länken på sociala medier till minst 100 000 personer utifrån Facebooks statistik för annonsering)

Totalt rör det sig om en lista på ett hundratal artiklar publicerade inom MittMedia, varav jag valt att fokusera på de 100 översta i denna bloggpost.

 

Hur mycket trafik motsvarar en delning på sociala medier?

Det är mycket enkelt att ta fram siffror över hur mycket trafik en delning kan förväntas leda till.   Den totala mängden ”sociala” sidvisningar och delningar på de 100 mest virala artiklarna visar att varje delning kan förväntas leda till i snitt 11,8 nya artikelläsningar. Dock påverkar rubriken denna siffra kraftigt.

 

Rubriken

Rubriker kan delas in i två kategorier:

  • Lockande rubriker, som leder till att artikeln får i snitt 15 nya läsare varje gång den delas.
  • Beskrivande rubriker, som ger fem nya läsare per delning (men delas oftare).

 

Bakom den sista punkten finns data som också tyder på att ungefär en tredjedel av alla som delar en viral artikel med beskrivande rubrik inte läst texten vid delningstillfället.   Medellängden för rubrikerna på MittMedias virala artiklar under 2014 var 4,8 ord. För de artiklar som samlas under socialanyheter.seär medellängden under de senaste veckorna 9,1 ord.

 

Värdet av en delning

Det är svårt att avgöra värdet på en sidvisning. Det går naturligtvis att titta på den totala intäkten och fördela ut den på det totala antalet sidvisningar, men summan blir fullständigt missvisande då varje sidvisning måste sträva efter att komma närmare målgruppsaffären och bort från räckviddsaffären.

 

Vad som menas med detta är att ju mer data som går att knyta till en sidvisning, desto mer ökar den i värde. En ny besökare som aldrig tidigare surfat på någon av MittMedias sajter och besöker en sajts startsida står för den absolut lägst värderade sidvisningen. Det finns ingen historik, inget mönster och inget sammanhang som kan placera besökaren i en målgrupp (men i praktiken kan åtminstone många besökare geopositioneras via IP-adressen).

 

Om samma okända besökare istället besöker en sportartikel finns det ett sammanhang som gör sidvisningen attraktiv för de annonskampanjer som riktar sig mot sportkonsumenter. Det finns dock fortfarande varken någon historik eller något besökarmönster att anpassa annonsen efter.

 

För de besökare som anländer till en artikel via en Facebook-länk på sin smartphone är det precis denna typ av sidvisning som registreras. Ett ganska vagt sammanhang, kanske en geografisk position, men ingen historik eller mönster. Varje mobil Facebook-besökare registreras alltid som en ny unik webläsare, oavsett typ av webbsajt. Detta gör för övrigt alla försök att använda ”unika besökare” som ett mätvärde på en nyhetssajt fullständigt missvisande.

 

Enligt det data som presenteras under ”Hur mycket trafik motsvarar en delning?” kan en delning förväntas resultera i 12 nya sidvisningar.

 

Utan att gräva ner mig i faktiska prismodeller är slutsatsen att varje artikeldelning bör utöka det annonslager som styrs av innehåll med 10*X, där X är antalet annonser som exponeras per sidvisning. Jag rundar av varje delning till att motsvara tio sidvisningar eftersom alla besök inte sker från mobiltelefoner och att det därför i vissa fall förekommer annonsblockerare.

 

Lagen om den virala artikelns uppkomst

Som jag tidigare fastställt kräver en artikel minst 250 visningar/timme för att kunna klassas som populär. Många artiklar uppnår denna nivå, men får trots detta ingen större spridning på sociala medier.

 

Andra artiklar drar majoriteten av sina läsare från sociala medier, men når aldrig gränsvärdet för populärt innehåll.   I båda dessa fall misslyckas artikeln med att nå en viral status enligt de kriterier jag tidigare listat.

 

För att en artikel ska nå en viral status måste den uppfylla följande kriterium:

Senaste en timme efter publicering har artikeln överstigit 500 visningar, och den sociala trafiken är minst 10% högre än standardvärdet för artiklar under samma tidpunkt (kom ihåg att detta varierar beroende på tid på dygnet).

 

Förutsatt att detta kriterium uppfylls kommer följande att infalla inom tre timmar (kom ihåg att tiden mellan 23.00 och 05.59 räknas bort:

  • Artikeln ökar antalet sidvisningar exponentiellt mot tid som passerar, och vid något tillfälle dubblas antalet sidvisningar på mindre än 30 minuter.
  • Den sociala trafiken utgör minst 60-70% (beroende på tid på dygnet) av det totala antalet sidvisningar.

 

När dessa två punkter inträffat kommer artikeln att nå sin trafiktopp senast vid nästkommande morgon, lunch eller kväll (vad helst som inträffar först).   D.v.s att om en artikel uppnår detta klockan 14.00 kommer trafiktoppen (senast) att inträffa under kvällen samma dag. Antalet sidvisningar motsvarar minst fyra gånger den trafikmängd som artikeln uppnått den timme då den sociala trafiken når 60%.

Viral markering
Två exempel på virala artiklars sociala trafik under publiceringsdygnet. Gränsen för att trigga en viral spridning ligger nära 60% eftersom båda artiklarna publicerades under morgontimmarna. Antalet sidvisningarna överstiger kriteriet för en viral artiklel och ingår i detta fall enbart för att visa på trafiksvängningar.

 

Den virala dagsländan

I regel har MittMedias virala artiklar nått sin trafiktopp (och sedan fallit markant) inom 24 timmar förutsatt att den ursprungliga publiceringen skedde innan klockan 12.00 på förmiddagen.   Den absoluta toppen varar i mindre än två timmar.

Ett typiskt exempel på en viral artikels trafikutveckling under ett längre perspektivt

 

Den virala artikelns återuppståndelse

Det är mycket svårt att förutspå vad som föranleder att en artikel plötsligt återupptäcks av anhängare på sociala medier och börjar klättra bland sajtens just nu populäraste innehåll.   En intressant notering är att populärt innehåll av opinionskaraktär ofta tycks ge ifrån sig mindre livstecken ungefär ett kvartal efter den ursprungliga publiceringen. Detta kan tyda på att det kan finnas tidsramar att förhålla sig till vid uppmärksammande av äldre material.

Sammanslagning av trafiken till ett flertal virala opinionsartiklar, från publiceringsdagen och 100 dagar framåt.

 

När väl en gammal (äldre än tre veckor) artikel får ny spridning följer den samma mönster som en nypublicerad artikel. När artikeln når 500 visningar på en timme, eller 1000 visningar under tre sammanhängande timmar, kommer en trafiktopp att infalla inom senast 12 timmar.

 

Utanför MittMedia

Det finns enorma skillnader i trafikvolym mellan MittMedias sajter och många av de nationella nyhetssajterna. Men det finns också motsvarande skillnader inom MittMedia, där de stora sajterna inom koncernen har mångdubbelt mer trafik än de mindre.

 

Det finns dock faktorer att förhålla sig till som gör att analyserna kan sträcka sig både mellan koncernens olika sajter och de externa aktörerna. Till exempel är det rimligt att anta att besökare på små webbsajter har lika många Facebook-vänner som besökare på stora nyhetssajter. En delning blir alltså exponerad för lika många personer oavsett vilken sajt artikeln befinner sig på. Genom att använda tjänster som Facebook LinkStatsgår det att analysera länkar från alla webbsajter, och genom att bevaka en artikels delningshastighet går det också att beräkna det lägsta antalet potentiella visningar artikeln har (och kan förväntas få).

 

Det finns idag redan ett flertal tjänster som listar de mest delade artiklarna, men genom att analysera delningsgraden går det i ett väldigt tidigt stadie identifiera en viral artikel.

 

Reflektioner

En viral artikel fungerar inte på samma sätt som vi är vana att göra trendspaningar. Långt innan en trend har identifierats och någon kan agera har en viral artikel haft sin uppgång och fall.

 

Mest likheter har den virala artikeln med börsen, där rykten om ett eventuellt uppköp kan få ett mindre företags aktiekurs att rusa och därmed trigga en lång rad automatiska köpsystem, långt innan någon hunnit reagera. Precis på samma måste vi förlita oss på automatiserade system för att kunna agera på virala artiklar, samtidigt som vi måste ha kunskap och rutin för att i efterhand kunna analysera och reagera på vad som skett.

 

Genom att på förhand kunna förutse en artikels utveckling går det att uppmärksamma redaktionen på artiklar som är på gränsen att nå utanför den vanliga räckvidden. Ibland kan det räcka med en annan typ av rubrik eller en liten knuff på startsidan eller det egna Facebook-flödet för att en artikel ska nå sin fulla potential istället för att passera mer obemärkt.

 

Det finns många intressanta experiment att utföra för att fastställa, förfina eller omkullkasta det jag skrivit.

 

Något jag gärna skulle vilja se är ett test då några utvalda lokala användare i samförstånd med MittMedia kopplar sina Facebook-profiler med utökade rättigheter (för att möjliggör listan över vänner) till nyhetssajerna. Genom teorin för Six Degrees of Separationbör vi då kunna skapa en visuell karta över hur en artikel färdas genom Facebook mellan olika personer.

 

Sammanfattning

  • Ett dygns första timmar skapar ett hål i statistiken och måste filtreras bort innan det går att finna tydliga trafikmönster.
  • Artiklar når viral status under de första timmarna efter publicering eller efter klockan 06.00.
  • Trafiktoppen på artikeln infaller alltid nästa morgon, lunch eller kväll efter att antalet sidvisningar dubblerats under 30 minuter och 60-70% av trafiken kommer från sociala medier.
  • En viral artikel är attraktiv under mindre än 32 timmar och trafiktoppen varar mindre än två timmar.
  • När en viral artikel ”återuppstår” har det passerat mer än tre veckor sedan den ursprungliga publiceringen. Det finns ingen bortre gräns för når en artikel kan återuppstå.
  • Genom att förstå korrelationen mellan antalet delningar och tid sedan publicering går det att förutspå trafikutveckling på både MittMedias och externa aktörers innehåll.

 

Skrivet av: Magnus Engström – Utvecklare, MittMedia

Publicerat av

Kommentera

E-postadressen publiceras inte. Obligatoriska fält är märkta *