Den autonoma rekommendationen

bloggbild-automatisering

Av: Magnus Engström – Utvecklare, MittMedia

Nyhetssajter har utgjort en av hörnstenarna på Internet nästan hela vägen tillbaka till mediets födelse. Vissa vill till och med gå så långt som att hävda att långt innan den digitala distributionen kom att utgöra ett hot mot tidningshusen var det tidningarna själva som bidrog till att legitimera Internet som en trovärdig informationskälla, och därmed på allvar starta revolutionen.

Lika länge som nyhetssajterna har levererat nyheter har de också haft automatiserade element, varav många idag är så självklara att vi inte längre reflekterar över dessa trots att automatiseringsdebatten aldrig varit hetare än just nu. Under rubriker som ”senaste nytt”, ”mest kommenterat”, ”mest läst” och ”trendande innehåll” har artiklar sedan tidernas begynnelse presenterats i den ordning som system lärt sig att rangordna dessa. Små enkla algoritmer, som erbjuder artiklar sorterade på ett sätt som om de gjordes med manuellt arbete utan tvekan skulle svälja ett antal heltidstjänster.

Om du är en frekvent användare av våra nyhetssajter har du antagligen till exempel lagt märke till den horisontella listan betitlad ”Mest läst” högst upp på sajten. Den ska nämnas direkt att denna artikellista aldrig har reflekterat sajtens mest lästa artiklar i vanlig bemärkelse, utan snarare fått namnet på grund av att användartester tidigt avslöjade att ”10 heta” inte var en tillräckligt beskrivande titel.

"Mest läst" på dalademokraten.se
”Mest läst” på dalademokraten.se

 

När vi på MittMedia efter en längre tankeprocess tar nästa steg i automatiseringen väljer vi att inleda med att återbesöka detta (för våra användare) välbekanta sajtelement. En funktionalitet som vi vet hur den presterar idag och på vilken vi genom lättöverskådliga dataanalyser kan mäta förbättringar och försämringar över tid. Dessutom är avgränsningen bekväm med ett enskilt användningsområde som vi enkelt kan hantera om det uppstår oväntade utmaningar i något skede.

Vad är då skillnaden mellan den ”Mest läst” vi nu lanserar kontra den som funnits med sedan plattformen lanserades?

Till att börja kan en kortfattad beskrivning av hur den tidigare algoritmen fungerar vara på sin plats. Enkelt sammanfattat utgjordes artikellistan av artiklar som ökat kraftigt i läsning under en viss tidsintervall jämfört med tidigare tidsintervaller av samma längd. Om en artikel till exempel blivit läst och delad 500 gånger under den senaste halvtimmen och innan dess blivit läst och delad 700 gånger under föregående heltimme (dvs. 350 ggr per halvtimme i snitt) fanns det goda chanser att artikeln (som nu ökat i popularitet med 30%) letade sig upp bland de tio artiklarna i listan.

Denna intervallbaserade typ av rankning är mycket vanlig typ av algoritm som i olika former förekommer på allt från Facebook till Reddit.

Denna helautomatiska approach för dock med sig ett antal problem som är extra märkbara i en miljö där användaren förväntar sig ett artikelurval signerat av en publicist. Bland annat kan en algoritm oövervakad presentera innehåll som av olika anledningar inte passar i sammanhanget. Det kan till exempel röra sig om trafikvarningar som hastigt passerat, ”inför matchen”-rapporter som hänger kvar trots att matchen startat eller rent av vällästa sorgeannonser. I de flesta fall då problem har uppstått har utvecklare och redaktörer gjort manuella insatser på de artiklar som önskats filtreras bort. Problemet med denna manuella approach är att systemet fortsätter agera på en i programmeringskod definierad algoritm. Därmed kan inte funktionen utan insatser från utvecklare modifieras vartefter nya förändringsbehov uppstår.

MittMedias första steg i en autonom nyhetstjänst är att återföra möjligheterna och ansvaret kring artikelrekommendationer till våra redaktörer och analytiker.

Under våren har ett stort antal anställda hos MittMedia genomgått olika typer av utbildningar inom våra analyssystem. I ett flertal omgångar har redaktörer och journalister drillats i hur rapportverktygen kan användas för att presentera innehållslistor efter alla tänkbara parametrar och datapunkter.

Tillsammans har de lärt sig besvara frågor som: Vilka artiklar som publicerats idag är mest lästa? Vilka artiklar har störst spridning i sociala medier senaste två dygnen? Vad konsumerar våra inloggade användare? Vilken typ av innehåll är populärt bland våra ofta återkommande besökare? Eller, vilken typ av innehåll letar en sportintresserad återkommande användare efter på morgonen en typisk söndagsmorgon på höstkanten?

Det är denna kunskap vi nu lägger som grund i vårt automatiseringsarbete. Från och med lanseringen av vår nya automationsservice agerar våra automatiserade funktioner på data producerat av algoritmer byggda och testade i våra analyssystem, av analytiker och redaktörer som dagligen jobbar med lära sig mer och mer om vad som fungerar och vad som inte gör det. När en förändring görs på en rapport i analyssytemet kommer det direkt att återspeglas på sajten.

Trendande innehåll enligt rapport skapad i analyssystem
Trendande innehåll enligt en rapport skapad i ett analyssystem

 

Genom att tillföra nya typer av metadata, som prioritet och bästa före-tidpunkter (mycket likt den approach Aftonbladet arbetar efter), kan de återkommande utmaningarna vi idag har med automatiska listor enkelt hanteras.

Varje förändring är mätbar, och vi hoppas att kontinuerlig A/B-testning på våra sajter med olika typer av dataunderlag kommer att ge oss en allt tydligare bild av vilka användare som föredrar olika typer av urvalsalgoritmer.

På sikt kommer vi att möjliggöra innehållsrekommendationer ur ett större perspektiv där innehållet också viktas av potentiella målgrupper (och på dessa beräknade annonsintäkter), och i en förlängning kommer kanske systemen själva att lära sig förstå vilka urvalsalgoritmer som passar olika typer av trafikmönster och kontexter.

Detta är det första steget MittMedia tar mot en helt dynamisk autonom nyhetstjänst. Nästa steg är att frikoppla denna funktionalitet från de ”statiska” listelementen och även tillgängliggöra samma funktionalitet i det dagliga arbetet, och därmed förse våra startsidor med en varieté av ”automatpuffar” baserade på olika typer av specialbyggda analysrapporter. Detta kommer att möjliggöra en helautomatisk startsida (om så önskas). Huvudsyftet är att inte bara avlasta redaktörerna ett ofta icke värdeskapande arbetsmoment utan även att bygga en djup förståelse och optimering för hur vårt innehåll konsumeras beroende på vem som utgör konsumenten och i vilken miljö denne befinner sig.

Och när nu MittMedia inom en snar framtid även lanserar än mer innovativa projekt som robottexter och målgruppsegmenterade annonssystem (med self service-gränssnitt) har vi en mycket stabil grund att stå på. Vi har anledningen att återkomma till detta.

Av: Magnus Engström – Utvecklare, MittMedia

Publicerat av

En reaktion på ”Den autonoma rekommendationen”

  1. Tack för intressant text! Ser fram emot en förbättrad mest läst-tjänst. Hur tänker ni kring bubblare och hur ser användningen ut bland våra besökare? Ser liknande problem som 10 heta. Kanske framförallt för att det krävs att någon förklarar upplägget, vilket måste vara uselt ur ux-synpunkt. Och för mig som främst surfar via mobilen tar funktionen en hel del plats på skärmen.

Kommentera

E-postadressen publiceras inte. Obligatoriska fält är märkta *