Investigación pionera sobre eso es lo que ella dijo

La sorprendente efectividad y longevidad del ahora legendario eso es lo que ella dijo broma, recientemente popularizada de nuevo con la ayuda de La oficina , ha hecho más que proporcionar a millones una respuesta instintiva a una conversación informal. Ahora ha alcanzado un nuevo nivel de importancia social, al inspirar una investigación lingüística seria. Viene en forma de un trabajo de investigación llamado Eso es lo que dijo: identificación de doble entendido , escrito por dos estudiantes de informática, Chloe Kiddon y Yuriy Brun .

En su artículo, la pareja describe su creación del Entender doble a través de transferencia de sustantivo o DEviaNT enfoque que identifica automáticamente eso es lo que dijo (TWSS) bromas. Llaman a su enfoque análisis metafórico, que tiene un doble significado propio, y se basa en ponderar ciertas palabras como más sexys que otras. El equipo ponderó varios sustantivos y verbos sexys y luego ejecutó su algoritmo.

En su investigación, la pareja también descubrió algunas reglas interesantes para los chistes de TWSS. Por ejemplo, el riesgo de invocar incorrectamente una broma de TWSS. De su estudio:

Por ejemplo, en un entorno social, el costo de decir eso es lo que ella dijo de manera inapropiada es alto, mientras que el costo de no decirlo cuando podría haber sido apropiado es insignificante.

Para abordar esto y producir mejores resultados, el equipo empleó un algoritmo de aprendizaje. Entre otras cosas, esto hizo que la creación de falsos positivos fuera 100 veces mayor que la de falsos negativos.

Después de ejecutar DEviaNT a través de una serie de material de broma de TWSS pre-identificado y citas al azar. En su prueba, usaron 1.5 oraciones eróticas y 57,000 oraciones no eróticas. El equipo dice que lograron una tasa de éxito superior al 71,4%. Si bien eso puede no parecer mucho, el equipo dice que con un conjunto de datos más grande, esperarían resultados más cercanos al 99,5%. Además, DEviaNT arrojó algunos resultados interesantes. Nuevamente, del estudio:

DEviaNT devolvió 28 oraciones de este tipo (todas empatadas con mayor probabilidad de ser un TWSS), 20 de las cuales son verdaderas positivas. Sin embargo, 2 de los 8 falsos positivos son de hecho TWSS (a pesar de provenir de los datos de las pruebas negativas): Sí, dame toda la crema y se habrá ido. y sí, pero su agujero huele mucho a veces.

Algunos pueden restar valor a esta investigación, llamándola simplemente una broma y de poco valor. Este sería un ataque de baja intensidad, ya que incluso los investigadores describen su trabajo como un difícil problema de comprensión del lenguaje natural. (Eso es lo que ella dijo.)

( Científico nuevo vía El escapista )