Är generativ AI klippdockor och dockteater fast för vuxna?

Är det generativ AI-teknik som kommer ”förändra allt”? Jag är personligen något tveksam till det, men visst finns det användbara godbitar av allt det som släppts på senare år.

Förra hajpen var om röstassistenter, bildklassificering och löftet om autonoma fordon. Det fanns förstås saker innan som allt byggde på, men som hajp betraktat drog det igång strax efter 2012 tack vare djupinlärning som företeelse.

Men hann vi ens med att göra upp med den hajpen innan all den här nya förhoppningen drog igång? Jag tycker inte det. Hur imponerade är vi av röstassistenter och bilars autonomi idag? Jag skulle hävda att vi fått justera våra orimliga förväntningar, och det är ett helt naturligt steg.

Bild 1: Siri föreslår utan att blivit tilltalad, sent på kvällen, att prata om restauranger. Av någon anledning.

Senast nu ikväll avbröt Siri i min Apple Watch när jag läste en Bamse-saga för att natta mitt barn. Barnet utbrast ”MEN SIRI!!!” Mitt barns uppväxt med röstassistenter var med i webbinariet jag var med i i början av maj. Du kan se inspelningen i efterhand här. Jag lovar dig ett sansat och balanserat samtal med fokus på vad man kan göra med generativ AI idag men också lite förmaningar runt upphovsrätt och etik.

Att Siri eller Amazons Alexa skulle börja prata vid mindre bra tillfällen var jag mer orolig för när dottern var ett spädbarn. Då slutade jag ha klockan på mig för att den inte skulle gorma i örat på barnet jag just vaggat och nynnat till sömns.

Bild 2: Min ettåring babblar med röstassistenterna Amazon Echo / Alexa och Google Home 2018.

Mitt barn har haft röstassistenter sedan innan hon själv kunde prata. Nu kan hon prata och konstaterar att ”Siri är inte så smart”. Och det kanske är en välgrundad iakttagelse från en person som till skillnad från mig inte vet vad en telefonkatalog var för något, inte förstår dagstidningar i affären och som besviket upptäckte en DVD-skiva i vad hon trodde var en bok (läs, ett DVD-fodral).

Var vill du komma med det här Marcus? Jo, att först när vi mognat med dagens generativa AI, som ChatGPT för text och Midjourneys häftiga bilder, eller videogenerering, då återstår det att se vilken faktisk nytta som finns. Ungefär som sexåringen jag har hemma. Hon som haft röstassistenter i fem sjättedelar av sitt liv. För henne är det inte så exotiskt att med rösten kunna styra pryttlar runt omkring sig. Men hon är inte heller särskilt imponerad, eller tycks tycka att det är så intuitivt att hon föredrar att säga åt sin HomePod att spela upp en låt än att göra det via sin skärm.

Jag har försökt ha DiffusionBee, en app för Stable Diffusion man kan generera bilder med, som grund för kreativt ritande med dottern. Det går så där. Lekfullt försökt med ”ska vi be pappas dator rita ett neonfärgat lejon och så ritar vi egna varianter?” Hon blir liksom inte imponerad. Och när jag genererat bilder som föreställer människor eller någon i familjen tycker hon att bilderna ser läskiga ut. Nu har jag gett upp i väntan på bättre lekfulla ingångar till teknik.

Just nu springer vuxna runt som yra höns och (återigen) tänker att allt kommer förändras. Klart saker kommer förändras. Det brukar de. Och ja, kanske går det lite fortare än vanligt. Men min poäng är att försöka leka och lära med de här nya verktygen vi möts av, men att inte göra onödiga avkall på våra krav. Det gäller att försöka ha huvudet på skaft och se tekniken för vad den egentligen är och om det fyller ett behov vi faktiskt har.

Inom webbanalysen har vi en användbar motfråga när någon tycker sig ha skådat ljuset. Man ställer motfrågan "Än sen?", för någonstans finns kanske något riktigt värt i det där som föreslås. Det svåra kan vara att utröna exakt vad.

Min vän Almira beskrev konverserande AI en gång som en sorts avancerad dockteater.

”Förr eller senare, så kanske det blir artificiell intelligens av det hela, men just nu är det avancerad dockteater med varierande kvalitet på manus.”
– Almira Osmanovic Thunström (Konversations UI - Chatbot för Terapisamtal, Utveckling i VGR, 2020)

Det känns igen både när jag ska skriva prompter åt ChatGPT men också i föräldrarollen när man faktiskt får öva på att leka, bland annat dockteater. Nedan instruktion fick jag av min sexåring idag som glatt hittat en flyttlåda i lägenheten. Nu behövdes bara ett lekscenario.

”Pappa, låtsas att du är en brevbärare. Du ska packa ner mig i den här lådan och posta iväg mig.”
- barn instruerar förälder

Ungefär så kan instruktioner till ChatGPT och generativ AI kännas. Man talar till varandra med ett begränsat språk och hoppas överbrygga kommunikativa barriärer. ”Du ska vara min redaktör och ge mig redigeringsförslag på en text jag snart ger dig!”, ”Ge mig Python-kod för att iterera en CSV-fil” eller ”Jag vill att du är rolig och berättar ett skämt med en karaktär som är en osynlig enhörning som är regnbågsfärgad!”

Vad är ditt intryck av generativ AI? 🤔

Mer om generativ AI

AI and the American Smile – How AI misrepresents culture through facial expression – nej, du kan inte rakt av använda genererat innehåll med hull och hår. När man tränar AI-modeller förenklas och generaliseras den träningsdata man matar in. Ibland blir det klockrent, ibland blir det extremt stereotypt och fördomsfullt.
Ska ni börja med generativ AI på företaget? Tänk på det här först (Computer Sweden) säg den medieorganisation som inte tipsar om hur du lyckas med generativ AI
Video: AI för digitala kommunikatörer – webbinariet jag var med i för någon vecka sedan. Du kan vara lugn, det är ett sansat samtal för att handla om AI 2023.