Detalles Básicos

¿Qué es Discovery?

Discovery es un programa que lleva a cabo procesamiento del lenguaje natural—una rama de la inteligencia artificial relativa a las interacciones entre los seres humanos y las computadoras, utilizando lenguajes humanos tales como el inglés. Su principal desafío es habilitar programas de computación para que entiendan texto o habla humana, escrito o hablado, al menos tanto como le sea posible a una máquina.

Dicho de otro modo, el procesamiento del lenguaje natural (PLN) trata de imitar la habilidad que el ser humano tiene para comprender el lenguaje humano.

Lo qué Discovery hace

En su aspecto más básico, un usuario puede teclear una frase en inglés, ya sea una afirmación o una pregunta, y Discovery

determina la categoría gramatical aplicable para cada palabra de una oración,

determina la definición(es) aplicable(s) para cada palabra, y

diagrama la oración.

Problemas a superar en el Procesamiento del Lenguaje Natural

El principal desafío en el procesamiento del lenguaje natural es habilitar a los programas de computación para que imiten—tanto como les sea posible—la comprensión del lenguaje humano. Pero, ¿cómo una máquina podría ser capaz de "comprender" el lenguaje humano?

Para responder a esta pregunta, primero nos debemos preguntar cómo lo hacemos los seres humanos.

Cuando deseamos expresar conocimiento sobre una idea, opinión o evento, seleccionamos instantánea e inconscientemente palabras que representan las cosas, acciones y cualidades involucradas que transmiten con mayor precisión este conocimiento. Entonces casi instantáneamente combinamos esas palabras en un orden determinado para transmitir nuestro significado.

Un gran problema en el PNL, sin embargo, es que las palabras son muy ambiguas. Una palabra puede tener más de una categoría morfosintáctica. Y como parte de una categoría en particular, una palabra puede tener más de un significado. Así que ¿cómo podría un programa de computación examinar las palabras de una frase y averiguar las categorías morfosintácticas y definiciones aplicables?

De la misma manera como lo hacemos los humanos: vemos o escuchamos cómo las palabras están ordenadas gramatical y sintácticamente, y deducimos las categorías morfosintácticas y definiciones a partir de la estructura del enunciado.

Tenemos un acuerdo común tácito acerca del significado de las palabras en un idioma, así como también sobre la manera en que estas deberían estar ordenadas para transmitir significado. Este es el único medio a través del cual somos capaces de comunicarnos mediante el lenguaje. Sin embargo, con él somos capaces de formar un número prácticamente infinito de frases para expresar todo lo que deseamos.

La Manera en que Discovery puede ser usado

Gestión del Conocimiento

Dependiendo de su finalidad, un sistema ordinario de gestión de la información administra sólo un rango específico de datos. Nuevos datos pueden añadidos en un sistema de este tipo, pero a menos que sus desarrolladores lo actualicen consistentemente, los elementos de información almacenados, para los cuales fue diseñado, son fijos e inalterables.

En contraste, Discovery se sale de esa "camisa de fuerza" de información. Un software capaz de analizar oraciones en inglés permitiría la creación de sistemas de gestión de información que pudieran administrar la información sobre prácticamente cualquier tema expresable en Inglés. Las jerarquías o estructuras tipo árbol con las que Discovery diagrama enunciados proporcionan un medio para el almacenamiento y recuperación de dichos datos dentro de una estructura de base de datos relacionales, siendo esta la base de la mayoría de los sistemas de gestión de información actuales.

Traducción de idiomas

En el mejor de los casos, al traducir texto de un idioma a otro, los programas tales como Google Translate simplemente hacen su mejor conjetura acerca de las palabras traducibles y la estructura de los enunciados.

El alcance de la capacidad de Discovery para analizar enunciados, por otro lado, proporciona un medio único para construir programas de traducción con asistencia ocasional—pero más importante mínima—por parte del usuario. El resultado sería traducciones tan precisas como las palabras, gramática y sintaxis de la otra lengua lo permitan.

Existen versiones de la WordNet original en Inglés, ahora utilizada por Discovery, en varios idiomas, incluyendo español. Las asociaciones entre las entradas de palabras directamente traducibles entre estas dos versiones, además de las asociaciones entre las estructuras morfosintácticas en ambos idiomas, proporcionarán los medios para construir un prototipo para traducir de inglés a español y de español a inglés. Como prueba de concepto, podría servir como base para programas de traducción a otros idiomas.

Reconocimiento de voz

La misma capacidad de análisis de enunciados también puede servir para aumentar la precisión de programas de reconocimiento de voz, tales como el utilizado en Siri.