De fleste metrics vi bruker i dag tar sikte på å gi innblikk i sin lille bit av reklameeffektivitet. Sammen kan de være gode indikatorer på hvor godt reklamen fungerer. Men der de klassiske metricene er ærlige i sitt omfang - klikk måler klikk, visninger måler visninger, viewability måler om noe har vært på skjermen - er attention en ulv i fåreklær.
Maskinautomatiserte (altså ikke et panel eller en gallup) former for oppmerksomhetsmåling måler alt annet enn oppmerksomhet. Tallene du får servert er tuftet på en modell som er trent opp til å gjenkjenne hva som scorer høyt i panelbaserte (menneskebesvarte) oppmerksomhetsmålinger.
Det i seg selv høres ikke så galt ut.
Maskinlæringsmodeller som er trent til å gjenkjenne katt scorer bedre enn mennesker på kattegjenkjenning. Modeller som er trent til å se tegn på kreft gjør det nå bedre enn radiologer. Slikt sett står attention-modellene i celebert selskap, likevel er de udugelige.
Bildegjenkjenning krever ingen forståelse, men å forsøke å modellere hvilke reklamer som skaper oppmerksomhet fordrer en dyp resonneringsevne i maskinen.
Attention-modellene vi har i dag kan gjenkjenne farge, de vet hvor logoen sitter, finner ansikt, måler tekst - men de forstår absolutt ingenting.
De klarer ikke vite hvorvidt en tekst er morsom, et bilde er slående, en animasjon er lekker. De vet ikke om helheten forteller en historie.
Det eneste attention-modellene egentlig måler er om sammensetningen, eller layoutet, av reklamen minner om reklamer som har gjort det bra i reelle settinger.
Disse to bannerne ville scoret helt likt i dagens maskinbaserte attention-modeller, gitt at andre måleparametere er like. Hva er det da som egentlig måles?, spør Bjørne-Larsen.
Disse modellene bakes inn i attention-algoritmer som trekker inn datapunkter som viewability, reklametetthet, domenedata og klikk for å gi mer nøyaktige estimater. Dermed blir sluttresultatet at vi koker de samme gamle gode metricene til en ganske statisk vekting av hvilke formater i hvilke plasseringer som vanligvis genererer så-så mange sekunder av faktiske øyne som ser, basert på data fra eyetracking-tester.
Det faktiske kreative innholdet, og hvorvidt merkevaren passer godt på domenet, ender opp med å ikke ha noe å si i vektingen. Det vi blir servert er hvor oppmerksomhetsgivende disse pixlene pleier å være dersom dette rektangelet er viewable på dette domenet.
Å legge til en «forventede blikkfang basert på fastsatte vektinger» i kampanjerapporter er i og for seg uproblematisk. Men etter kampanjen er kjørt kan du sitte igjen med ett av to scenarier:
A) Attention forteller samme historie som klikk og viewability. Alt er godt.
B) Attention forteller en annen historie enn klikk og viewability. Hvilken historie skal du stole på? Gjorde kampanjen det bra eller dårlig?
Attention-tilbyderene mener at det da er attention du skal lytte til.
Ved å estimere «oppmerksomhet» på om rektanglene som kjøpes følger vanlig god praksis, feier vi ikke bare det kreative uttrykket under teppet - men vi dreper også et av de sterkeste reklamegrepene, nemlig muligheten til å gjøre noe atypisk.
I adtech- og martech-lingomylderet er det vanskelig å ta stilling til og sette seg inn i alt som dukker opp. Vi blir nødt til å tro på presentasjoner vi blir servert, og heldigvis er det få aktører som tør å presentere tall som er oppspinn - men i navngivningen av produktene kan det snikes inn noe som velter forståelsen fullstendig.
Bruken av attention-begrepet for maskinmodelleringer er tilnærmet språklig svindel. Tallene du ser i rapporter fra attention-modeller stemmer på en prikk, men det er ikke oppmerksomhet som tallfestes.
Om vi hadde kalt attention for Ad Layout & Placement Typicality Index hadde det ikke vært noe behov for denne kronikken, og en slik indeks i seg selv kunne vært en helt okay pre-test av et grafisk uttrykk. Dessverre dukker det stadig opp nye eksempler på at vi snakker om attention-estimeringer som en faktisk måling av oppmerksomhet. Dette undergraver paneltester av oppmerksomhet enormt, da de ofte settes side om side og presenteres som én og samme ting.
Det er viktig å bemerke at panelbaserte oppmerksomhetstester er en helt legitim praksis, som (hvis panelet er representativt og metodikken vitenskaplig) avdekker nettopp det de hevder. Det er i forsøket på å skalere opp panelene til å kunne kjøre på enhver kampanje til en veldig lav kost at språksvindelen oppstår.
Det å faktisk kunne måle oppmerksomhet i stor skala forblir den hellige gral, og det kan godt tenkes at vi en dag får mulighet til å gjøre det i digital reklame, men i mellomtiden bør vi være forsiktig med ordbruken, ellers risikerer vi å attentionvaske bort god reklame.
Kommentér