Anteckningar: NLP-forum på AI Innovation of Sweden

Datum: 23 oktober, 2019
Tanken är att det blir ett NLP-forum varannan månad framöver.

Peter Kurzwelly hälsar deltagarna välkomna

Simon & Danila från Recorded Future

Jobbat med NER (Named Entity Recognition) annotering - behövs tiotusen omnämnanden i corpus/textmassan för att tas upp som ett begrepp. Exempelvis organisationer som Djurens rätt kan vara sånt som man behöver upptäcka och inte finns i en strukturerad datakälla man importerar.

Mänsklig handpåläggning tar mycket tid. Recorded Future la 1000h på projektet de pratade om. Flera människor behövs. Viktigt att hantera när människor inte kommer fram till samma sak. Slutligen har de länkat sina annoteringar, kopplar dem till Wikidata.

LSTM-CRF är deras modell, vilket är ett RNN (Recurrent Neural Network). Bekymmer dock med produktentiteter.

Lärdomar

Språkspecifika features:

  • Svenska: Clitic genitive “s” - “Packa Petters kappsäck”. “Petters” är relaterad till “Petter”. Litauiska har tolv varianter dock :)
  • “Han reste till Sverige” - metonymically - Sverige är här en plats (LOC), medan i “Sverige vill inte gå ur EU” blir kanske mer en organisation (ORG)?
  • Hur vet vi att våra data är etiska? Finns där bias?

Lärde mig ett nytt ord: Gazetteer, en geografisk ordlista.

Andreas Krona från Talkamatic

Dagens småbarn lär sig att prata med allt möjligt runt omkring dem, till skillnad från dagens yngre tonåringar som trodde allt med bilder gick att svajpa.

Anledningen till att konverserande gränssnitt bör funka är att människor kommunicerat med ljud i hundratusentals år. Till skillnad från att manipulera pekskärmar vilket de flesta gjort i cirka 10 år. Resonemanget är att vår hjärna är anpassad till konversation. Dock gäller det att tekniken blir så pass bra att det går att kommunicera med den på en människas villkor. Där är vi inte riktigt än.

“Dialog first
Users firstest™”

Dialog first

När smartphones kom pratade man om mobile first, är dialog first nästa steg?

Också viktigt med Text2Speech/talsyntes så maskinen låter naturlig, så man har lust att tala med den och känner att den är tillförlitlig.

Det jobbas på könsneutrala röster och ibland är det viktigt för att det ska upplevas som tillförlitligt. Samtidigt är det viktigt att man vet att man pratar med en maskin. Och många tycker nog att det vore creepy att först efter en stund lista ut att det är en maskin. Google Duplex gör dock detta ganska bra. Kommentar: “It’s a great stage performance they’re doing”, som alltid med en demo visas teknikens bästa sidor. På temat Google Duplex; en hmm-bot har utvecklats, den hummade mest med, vilket var en stor del av vad folk blev imponerade över under Google i/o 2019s demo av Duplex. En hummande chatbot skulle kunna ersätta rätt många psykologer :)

Talkamatics projekt går ut på att det finns ett mål eller en orsak för människan att konversera med en maskin. Antar att det är för att det ska gå att (binärt) mäta ifall konversationen gav något. De bygger alltså inte chatbotar likt den i filmen Her (2013) eller den Microsoft byggt för den kinesiska marknaden.

Dialogmaskiner tar över servicejobb

Tänk att beställa i drive-through på en hamburgerrestaurang. I många fall skulle maskiner kunna göra jobbet i servicesektorn.

500 miljoner i VGR (uppges på mötet) gå till spillo för att folk uteblir från sina vårdmöten. En femtedel uppskattas vara på grund av språkbarriärer. Dessutom sitter kompetent folk och svarar i telefon där deras kompetens inte kommer till full nytta, samt att telefontiderna minskar tillgängligheten till vården.

Tänker på hur 1177 Vårdguiden per telefon numera har en annan kö för administrativa frågor, en särskild för de som behöver prata somaliska eller arabiska. Snart kanske en chatbot är tillräckligt bra på ett eller flera språk för att göra det här jobbet och minska slösade resurser. Som Andreas skämtade efteråt, “Jag löser det där problemet för 495 miljoner” :)

//Marcus


Publicerad: 2019-10-24
Kategori: AI-tekniker
Tagg: Naturligt språk (NLP) AI Innovation of Sweden

‹ bloggen

Hör av dig