lunes 21 de febrero de 2011

IBM: La máquina le gana al hombre, de nuevo...

Bueno, es oficial: una computadora de IBM puede jugar Jeopardy mejor que cualquier ser humano.

Watson, una supercomputadora de IBM, participó en el programa Jeopardy la semana pasada, contra dos de los jugadores más exitosos de todos los tiempos. En dos días, logró acumular ganancias por $74.000, casi el triple de lo que obtuvieron los dos jugadores humanos.

Jeopardy es un programa parecido a Quien Quiere Ser Millonario. Existe un tablero con 30 casillas, cada casilla con un valor en dólares. El jugador selecciona una casilla, y se muestra una pregunta temática. Quien logre contestar la pregunta, gana el valor de la casilla, o si la contesta incorrectamente pierde ese valor.

IBM puso a concursar a Watson para demostrar los avances que había logrado en años recientes en procesamiento de consultas de lenguaje natural. Watson automáticamente seleccionaba una categoría y casilla a partir de varios algoritmos de probabilidad. El texto de la pregunta era recibido por Watson al mismo tiempo que se mostraba a los demás jugadores, y si Watson lo consideraba viable, contestaba la pregunta. Incluso para ser justos con los humanos, Watson estaba conectado a un dedo robot que activaba el botón para contestar (eso para evitar que la computadora tuviera algunos milisegundos de ventaja en su tiempo de reacción).

Lo más sorprendente es que Jeopardy utiliza preguntas a lo Trivia: algunas son directas, otras utilizan sentido figurado, lo cual significa que Watson tenía que ser capaz de discriminar entre uno y otro. La construcción de las preguntas también varía, algunas usan el formato típico del inglés, otras le dan vuelta a las diferentes partes de la oración, y otras simplemente son fragmentos aislados de oración, y a partir del nombre de la categoría temática se deduce la pregunta.

Watson pudo de primera entrada con muchas de las preguntas que se le hicieron. En otras, simplemente se mantuvo en silencio (tenía la respuesta correcta, pero el algoritmo no logró suficiente probabilidad de estar correcto como para contestar). Y un par de preguntas (incluyendo una de la final) las voló olímpicamente.

Cómo funciona? De acuerdo con IBM, Watson es simplemente una base de datos gigante de documentos y contenidos. Separa la pregunta en palabras y fragmentos clave, que asocia a documentos. Luego empieza un proceso cíclico de análisis que conecta esos documentos con otros documentos. Cada ciclo que se completa aumenta la probabilidad de que la respuesta encontrada sea correcta, hasta que se supera un cierto límite y la computadora indica que desea contestar.

En ese sentido, Watson es simplemente un buscador más inteligente: una versión de Google pero capaz de entender mejor el lenguaje natural. Puede llegar a una conclusión respecto a una pregunta que se le hace en menos de 3 segundos, y para hacerlo ocupa 90 servidores IBM Power 750, con 2880 cores, y 16 TB de RAM. La base de datos que utiliza ocupa 4 Tb de discos duros, y contiene mas de 200 millones de documentos, incluyendo el texto completo de Wikipedia.

Y, para qué va a servir Watson ahora? IBM planea desarrollar diferentes paquetes de consulta en lenguaje natural. En los próximos 24 meses, pondran en el mercado un sistema de referencia médico, que tome preguntas en lenguaje común y le permita a las clínicas y hospitales lograr diagnósticos más acertados.

De ahí, planean ramificar los sistemas a servicios automatizados de atención al cliente.

Según los expertos, al paso que va la cosa en unos 3 a 5 años tendremos una versión de Watson en la computadora de la casa. Y en unos 7, un Watson versión teléfono celular.