Banbrytande forskning om det är vad hon sa

Den överraskande effektiviteten och livslängden hos det nu legendariska det är vad hon sa skämt, nyligen populärt igen med hjälp av Kontoret , har gjort mer än att ge miljoner ett knä-jerk svar på avslappnad konversation. Den har nu nått en ny nivå av social betydelse genom att inspirera till allvarlig språklig forskning. Den kommer i form av ett forskningsarbete som heter Det är vad hon sa: Identifiering av dubbel entender , författad av två datavetenskapliga studenter, Chloe kiddon och Yuriy Brun .

I sin artikel beskriver paret deras skapande av Dubbel entender via Noun Transfer eller DEviaNT metod som automatiskt identifierar att det är vad hon sa (TWSS) skämt. De kallar deras tillvägagångssätt metaforisk analys, som har en dubbelbetydelse helt och hållet, och bygger på att vikta vissa ord som sexigare än andra. Teamet vägde flera sexiga substantiv och verb och körde sedan sin algoritm.

I sin forskning upptäckte paret också några intressanta regler för TWSS-skämt. Till exempel risken att åberopa ett TWSS-skämt felaktigt. Från deras studie:

I en social miljö är kostnaden för att säga att det är vad hon sa felaktigt hög, medan kostnaden för att inte säga det när det kan ha varit lämpligt är försumbar.

För att ta itu med detta och för att ge bättre resultat använde teamet en inlärningsalgoritm. Bland annat satte detta skapandet av falska positiva 100 gånger högre än falska negativ.

Efter att ha kört DEviaNT genom en serie föridentifierat TWSS skämtmaterial och slumpmässigt citat. I testet använde de 1,5 erotiska meningar och 57 000 icke-erotiska meningar. Teamet säger att de uppnått en framgångsgrad på över 71,4%. Även om det kanske inte verkar så mycket, säger teamet att de med en större datamängd skulle förvänta sig resultat närmare 99,5%. Dessutom gav DEviaNT några intressanta resultat. Återigen, från studien:

DEviaNT returnerade 28 sådana meningar (alla är bundet för att sannolikt vara en TWSS), varav 20 är sanna positiva. Men två av de 8 falska positiva är faktiskt TWSS (trots att de kommer från de negativa testdata): Ja, ge mig all grädde och han är borta. och Ja men hans hål luktar verkligen ibland.

Vissa kan försämra denna forskning och kallar den helt enkelt en lärka och av lite värde. Detta skulle vara ett lågt angrepp, eftersom även forskarna beskriver sitt arbete som ett svårt naturligt språkförståelseproblem. (Det är vad hon sa.)

( Ny forskare via Escapisten )