Fredrik Pettesson, teknologidirektør i ANFO, stiller et relevant spørsmål i sin artikkel: Hvorfor skylder vi på KI når noe går galt? Hans argument om at sluttresultatet ofte handler om brukerens kompetanse, er gyldig. Men for å forstå hvorfor noen KI-genererte resultater svikter, må vi se nærmere på de tekniske begrensningene som KI-verktøyene har innebygd i sin arkitektur og funksjonalitet. Dette er ikke bare spørsmål om brukerferdigheter, men om hva teknologien faktisk kan og ikke kan gjøre.

Generative KI-modeller, som for eksempel text-to-image-systemer, er basert på avanserte nevrale nettverk som har blitt trent opp på massive datasett. Disse datasettene danner grunnlaget for modellens evne til å generere innhold. Problemet oppstår når treningsdataene ikke dekker tilstrekkelig spesifikke eller kontekstuelle aspekter. For eksempel i tilfeller som Postens julefrimerker, der KI ble kritisert for ikke å gjenskape den estetiske dybden eller de kulturelle nyansene mange forventer, er det tydelig at modellen ikke hadde tilstrekkelig kontekstspesifikk data til å produsere et resultat som resonnerte med publikum.

Les også: Reklamebyrå tar avstand fra egen kundes KI-bilde: - Ikke vi som har laget det 

Dette peker på en teknisk begrensning: Generative modeller fungerer som sannsynlighetsmaskiner. De produserer utdata som er statistisk sannsynlige basert på treningsdataene. Resultatet er ofte "gjennomsnittlig" eller generisk, fordi modellen er optimalisert for å minimere feil i et stort spekter av mulige scenarier, snarere enn å maksimere kvalitet i en spesifikk kontekst. Dette kalles "mode collapse", hvor modellen tenderer mot å produsere variasjoner av det mest sannsynlige utfallet, snarere enn unike eller innovative løsninger. I kampanjer som Friele sin, hvor bildene ble oppfattet som kunstige eller livløse, ser vi dette i praksis: modellen leverte visuelt korrekte resultater, men manglet evnen til å skape noe virkelig distinkt eller meningsfullt.

Videre har KI-modeller begrenset evne til å forstå semantisk eller kulturell kontekst. Selv avanserte modeller som GPT eller Stable Diffusion tolker ikke dataene de genererer på samme måte som et menneske ville gjort. Dette skyldes mangelen på en «symbolsk forståelse» i modellene. Selv om de kan assosiere visuelle eller tekstuelle elementer med hverandre basert på mønstre, har de ingen faktisk forståelse av hva disse elementene betyr i en spesifikk kulturell eller sosial sammenheng. Dette gjør at KI lett kan produsere visuelt korrekte, men meningsløse eller upassende resultater i visse scenarier.

Les også: Coca-Cola slaktes for KI-reklame – nå er den byttet ut med «ekte» vare

En annen teknisk begrensning er knyttet til datasettets bredde og kvalitet. Generative modeller som brukes i kreative prosesser, er ofte trent på enorme, men ustrukturert data. Selv om mengden data gir bred dekning, er den sjelden kuratert for spesifikke bruksområder. Dette fører til manglende presisjon i spesifikke applikasjoner. For eksempel i Avinors kampanje for sikkerhetsregler for powerbanker, var KI-modellen sannsynligvis trent på generelle visuelle datasett som ikke reflekterte den spesifikke konteksten til flysikkerhet eller reisesituasjoner. Resultatet var et bilde som ikke bare manglet autentisitet, men som også fremsto som generisk.

Til slutt, teknologisk transparens og «bias» i modellene kan også påvirke resultatene. For eksempel kan KI-modeller reflektere skjevheter i treningsdataene, som kan føre til at resultatene favoriserer visse stiler, perspektiver eller kulturelle referanser. Dette er ikke en feil i modellen, men en begrensning i dataarkitekturen som krever en aktiv innsats for å korrigere.

Les også: Designere reagerer på Postens julefrimerker: - Trent på stjålne åndsverk

Som Pettesson påpeker, er KI et kraftig verktøy som krever brukerkompetanse. Men det er like viktig å erkjenne at teknologien selv har iboende begrensninger som vi ennå ikke fullt ut har overkommet. Å forstå disse tekniske utfordringene er avgjørende for å bruke KI effektivt i kreative prosesser og for å stille riktige forventninger til hva teknologien kan levere.

KI er en transformerende teknologi, men den er fortsatt i utvikling. For å utnytte dens fulle potensial, må vi både mestre verktøyene og forstå hvor grensene deres går. Dette handler ikke om å skylde på teknologien, men om å erkjenne dens begrensninger og tilpasse våre tilnærminger deretter. Teknologiens styrke ligger i dens muligheter, men vi må ikke overse dens svakheter.