El nuevo hype de la inteligencia artificial

La inteligencia artificial es una de esas cosas que se ponen de moda más o menos cada lustro, como la realidad aumentada o la internet de las cosas. Esta vez ha salido en Wired lo que implica que ahora mismo existe un ejército de emprendedores que no tienen ni idea de que va realmente la inteligencia artificial pero ya están intentando emular el caso de IBM con su sistema de diagnóstico médico basado en Watson, cogiendo cualquier idea y añadiéndole el mojo “inteligencia artificial” lo mismo que hasta ahora se le añadía “movilidad”.

No todo será humo no obstante. Es probable que las infraestructuras cloud de lenguajes basados en bases de datos de conocimiento sean la próxima gran cosa. La clave está en convertir la inteligencia artificial en una utility.

Las dos plataformas que llevan la delantera son Watson y Wolfram Language, esta última me impresiona y creo que si no fuese tan privativa rápidamente se popularizaría. Aunque por supuesto hay que esperar a ver qué próximo movimiento hacen Google y Amazon en Inteligencia Artificial aplicada al procesamiento de texto. Sobre todo, no hay que perder de vista la capacidad de Google para entrenar a su inteligencia artificial. Cada vez que un usuario busca algo y hace click en un enlace le está diciendo a Google cual cree que es la respuesta más correcta a su pregunta original.

Muy resumidamente, Watson es un base de datos de 4Tb de texto de diferentes fuentes que se explota con tres ontologías (DBpedia, WordNet, y Yago) y un centenar de algoritmos diferentes que trabajan en paralelo.

Watson obtuvo sus resultados más espectaculares en dignóstico médico de muchas enfermedades incluído el cancer. IBM también anunció que colaborará con Repsol para buscar petróleo con Watson, y también que lo aplicaría al estudio de problemas sociodemográficos en África.

El software de IBM DeepQA está basado en UIMA (liberado por IBM a través de Apache en 2007) y en Hadoop. La estrategia consiste en aplicar diferentes algoritmos para tratar de hallar la respuesta a una pregunta y luego combinar los resultados para hallar el más probablemente correcto. La estrategia comercial de IBM es, por ahora, licenciar el software y vender hardware con procesadores POWER7 para ejecutarlo u ofrecer infraestructura en la nube por cantidades millonarias a grandes empresas. Esta estrategia sólo es sostenible en el corto-medio plazo y será reemplazada por un acercamiento basado en hardware commodity 100% distribuido lo mismo que la estrategia de Altavista basada en grandes servidores fue superada por los clones de Google. Existen varios catalizadores tecnológicos que indican que estamos a las puertas de un gran avance en inteligencia artificial. Watson necesitó almacenar toda su base de datos en RAM para responder con suficiente rapidez a las preguntas de la competición televisada Jeopardy para la que fue inicialmente diseñado. La simulación de redes de neuronas (un componente esencial en sistemas como Watson) era demasiado costosa antes de que se idease como implementarlas con GPUs y Geoff Hinton introdujese el deep learning.

Asistiremos también a enfoques híbridos hombre-máquina. Tras perder contra Deep Blue en el 97, Kasparov se dio cuenta de que podría ganar a la máquina si él también tenía acceso a la misma base de datos de movimientos previos que Deep Blue y recibir recomendaciones que seguir o modificar de vez en cuando según su propio criterio. Yo estoy convencido de que los militares estadounidenses aplican inteligencia artificial al análisis de informes sobre operaciones militares como el Kabul War Diary. En este caso, la forma de la redacción está claramente pensada para que se pueda procesar y entender automáticamente con facilidad. Esto mismo sucede con los traductores. Si metes un artículo como este en Google Translator obtendrás una traducción buena al 80% pero nunca la traducción que haría un humano. Para algunas frases el traductor puede llegar a poner en el otro idioma incluso justo lo contrario. Pero se puede redactar en español de una forma que Google pueda traducirlo correctamente, si sabes de antemano cuales son las limitaciones del traductor automático. Lo mismo que eliminamos las vocales e inventamos los emoticonos para comunicarnos por SMS, no sería raro que empezásemos a modificar nuestro lenguaje natural dejando de utilizar las expresiones que confunden a las máquinas.

Por supuesto, no todo en inteligencia artificial es comprensión lectora y búsqueda de respuestas. La propia Google parece estar públicamente más interesada en cosas como coches que se conducen solos que en su core business (aunque yo creo que eso son sólo señuelos de relaciones públicas por ahora). El reconocimiento de imágenes también ha experimentado un avance espectacular con sistemas que pueden reconocer no sólo una forma o una cara igual de bien que un humano como DeepFace, sino también incluso determinar lo que está pasando en un video. El reconocimiento de voz merecería asimismo un post entero aparte.

Posts relacionados:
Wolfram|Alpha vs. IBM Jeopardy.
Proyecto Kittyhawk: Toda la Internet en un Blue Gene/P

Artículo relacionado: A New Era in Semantic Web History (Nova Spivack)

Seminario sobre Wolfram Language:
Stanford Seminar – Stephan Wolfram of Wolfram Research

Compartir:
  • Twitter
  • Meneame
  • Facebook
  • Google Bookmarks
Esta entrada fue publicada en Computación en la Nube, Disrupción, Minería de Datos, ¿Dónde estamos? ¿Hacia dónde vamos?. Guarda el enlace permanente.

3 respuestas a El nuevo hype de la inteligencia artificial

  1. Pingback: Repaso didáctico sobre machine learning | La Pastilla Roja

  2. Pingback: De la inteligencia artesanal a la inteligencia industrial | La Pastilla Roja

  3. Pingback: Google y Microsoft liberan herramientas de inteligencia artificial | La Pastilla Roja

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *