Bebés y la inteligencia artificial
Es posible que superen al gran maestro Kasparov en el ajedrez, ¿pero podrán las máquinas en algún momento ser tan inteligentes como un niño de tres años?
“En lugar de tratar de producir un programa para estimular la mente adulta, ¿por qué no mejor tratar de producir una que simule la de un niño?” Alan Turing, 1950.
En la charla “Laboratorio de ideas” el 20 de enero en Davos, cuatro académicos de Berkeley, mi universidad, debatirán si es que las computadoras pueden (o si lo harán; o si podrían hacerlo en algún momento en el futuro; o si es imposible que logren) tomar decisiones de una mejor manera que las personas (los tiempos verbales son gran parte del debate).
El grupo incluye a un experto en robótica, un científico en informática, un neurocientífico y a mí, una psicóloga del desarrollo. ¿Por qué estaré yo ahí? Resulta que los niños son una parte crucial pero subestimada del debate acerca de la inteligencia artificial.
La prueba de inteligencia de Turing
Todos recordamos que Alan Turing propuso el juego de la imitación para probar si una máquina era inteligente. Si una persona se sentaba frente a un teclado y no podía distinguir si estaba hablando con una máquina o con una persona, entonces la máquina habría pasado “la prueba de Turing”.
Casi nadie recuerda que en el mismo artículo Turing sugirió que la clave para lograr la inteligencia sería diseñar una máquina que fuera como un niño, no como un adulto. Señaló, de manera profética, que el verdadero secreto de la inteligencia humana es nuestra habilidad de aprender. El aprendizaje ha estado en el centro del nuevo renacimiento de la Inteligencia Artificial (IA). Durante aproximadamente los últimos 15 años, los científicos de informática y los científicos de desarrollo cognitivo han estado tratando de comprender la manera en la que los niños aprenden tanto y tan rápido, y cómo diseñar una máquina que pueda hacer lo mismo.
La historia de la IA es fascinante porque ha sido difícil predecir cuáles aspectos del pensamiento humano serían fáciles de simular y cuáles serían difíciles. Al principio pensamos que actividades como jugar ajedrez o comprobar teoremas –las corridas del machismo nerd– serían lo más difícil para las computadoras. De hecho, resultaron ser fáciles. Las cosas que cualquier tonto puede hacer, como reconocer una taza o levantarla, resultaron mucho más difíciles. Y resulta mucho más sencillo simular el razonamiento de un adulto altamente capacitado que imitar el aprendizaje ordinario de los bebés. Dado todo esto, ¿en qué áreas están las máquinas poniéndose al día con los niños y qué tipos de aprendizaje todavía siguen fuera de su alcance?
Bebés increíbles
En los últimos 15 años hemos descubierto que incluso los bebés son sorprendentemente buenos para detectar patrones estadísticos. Las máquinas también se han vuelto extraordinariamente aptas en el aprendizaje estadístico. Técnicas como el “aprendizaje profundo” pueden detectar incluso regularidades estadísticas muy complicadas en enormes conjuntos de datos. El resultado es que las computadoras de repente se han vuelto aptas para hacer cosas que eran imposibles anteriormente, como etiquetar imágenes en Internet de manera precisa.
Pero el problema de este tipo de aprendizaje de máquinas puramente estadístico es que depende de enormes cantidades de datos, y de datos que ya han sido predigeridos por el cerebro humano. Y aún así, incluso con toda esa ayuda, las máquinas necesitan aún gigantescos conjuntos de datos y computaciones extremadamente complejas para poder examinar una nueva fotografía y decir “¡gatito!”: algo que todos los bebés pueden hacer después de unos cuantos ejemplos.
Más profundamente, uno sólo puede generalizar a partir de este tipo de aprendizaje estadístico de una manera muy limitada, independientemente de si se es bebé, computadora o científico. Una manera más poderosa de aprender es formulando hipótesis acerca de la naturaleza del mundo y probarlas con datos. En el siglo XVI, Tycho Brahe, el Google Scholar de su época, fusionó un enorme conjunto de datos de observaciones astronómicas, y los pudo usar para predecir la futura posición de las estrellas. Pero el siguiente siglo, las hipótesis heliocéntricas de Johannes Kepler le permitieron hacer predicciones inesperadas, amplias y completamente nuevas que iban mucho más allá del conocimiento de Brahe. Los niños de edad preescolar pueden hacer lo mismo.
Uno de los otros grandes avances en el aprendizaje de máquinas ha sido formalizar y automatizar este tipo de prueba de hipótesis. La introducción de la teoría de la probabilidad bayesiana ha sido particularmente importante. Podemos describir matemáticamente una hipótesis causal, por ejemplo, y después calcular cuáles son las probabilidades de que dicha hipótesis sea verdadera, dados los datos que podemos observar. Las máquinas se han vuelto capaces de probar hipótesis extremadamente bien usando datos de esta manera, con resultados para todos los campos, desde el diagnóstico médico a la meteorología. Cuando estudiamos a los niños pequeños, nos damos cuenta que razonan de manera similar, y eso ayudaría a explicar cómo aprenden tanto.
Tres diferencias entre los niños y las computadoras
Pero hay tres cosas que incluso los niños humanos muy pequeños hacen que todavía están muy lejos de cualquier cosa que las computadoras puedan hacer, o que incluso podamos visualizarlas hacer en el cercano futuro. Y eso hace del golfo entre la inteligencia artificial y la inteligencia humana algo particularmente vívido.
Las computadoras se han vuelto extremadamente hábiles para hacer inferencias a partir de hipótesis estructuradas, sobre todo inferencias probabilísticas. Pero el problema verdaderamente difícil es decidir cuáles hipótesis, de toda la infinidad de posibilidades, vale la pena probar. Incluso los niños preescolares son extremadamente aptos para crear conceptos nuevos, improvisados e hipótesis de una manera creativa y después ponerlos a prueba. De alguna manera, para hacerlo combinan la racionalidad y la irracionalidad, la sistematicidad y el azar, de tal forma que todavía no comenzamos siquiera a entender.
En otra parte ignorada de este artículo fundamental, Turing argumentó proféticamente que sería bueno si su computadora niño actuara al azar, por lo menos parte del tiempo. Y el pensamiento y las acciones de los niños de tres años a menudo parecen ser al azar, incluso locos: sólo hay que jugar a imaginar con ellos para darse cuenta de eso. Es exactamente por eso que los psicólogos como Piaget pensaban que los niños eran irracionales e ilógicos. Pero también tienen una misteriosa capacidad para concentrarse en el tipo correcto de hipótesis extraña: de hecho, las investigaciones en nuestro laboratorio han demostrado que pueden hacer esto mucho mejor que los adultos.
Por ejemplo, en un experimento les dimos un aparato a niños de cuatro años de edad y a estudiantes de licenciatura de Berkeley: una máquina que prende cuando se le ponen ciertas cosas encima pero no otras. Les mostramos a los niños y a los adultos la máquina funcionando de una manera obvia o de una manera más inusual, y después los dejamos que ellos mismos investigaran cómo hacerla prender con unos nuevos bloques. Los niños rápido aprendieron la hipótesis inusual, pero los adultos se quedaron atorados en la idea obvia, a pesar de los datos. Esto puede resultar sorprendente al principio. Pero quizá no si, como yo, alguien ha observado a su nieto de tres años aprender a manejar un teléfono inteligente rápida y espontáneamente, lo cual a mí me llevó un mes aprender.
Pensamos que los niños estaban explorando posibilidades de una manera más amplia e impredecible que los adultos, justo como lo hacen cuando “se meten en todas partes” en sus juegos de exploración, o se imaginan distorsionadas alternativas de la realidad durante sus juegos. Pero casi no tenemos idea de cómo este azar racional, esta creatividad limitada, es posible.
Una segunda área donde los niños superan a las computadoras es en su habilidad de salir y explorar el mundo en torno a ellos. Turing se refiere a esto como “la habilidad de ir por la cubeta del carbón” y sugiere que las computadoras pueden prescindir de ello. Pero, después de todo, la experimentación es crucial y, algo que resulta misterioso, es también parte del aprendizaje científico.
Más y más estudios demuestran que incluso los bebés muy pequeños activamente exploran el mundo de sus entornos, y este tipo de actividad de exploración es crucial para el aprendizaje. De manera sistemática, los bebés observan por periodos muy prolongados los eventos en sus entornos que pueden resultarles más informativos, y juegan con objetos de la manera que les sirve para aprender más. Esta habilidad de poder extraer la información correcta del mundo, más que tan sólo procesar la información recibida, es algo muy poderoso. También incluye la misma tensión entre la racionalidad y el azar como la generación creativa de hipótesis de los niños. Esto está mucho más allá de la capacidad de cualquier máquina conocida.
Una tercera manera en que los niños aprenden es obteniendo información de las otras personas a su alrededor. La mayoría de las personas no alcanzan a comprender que muchos de los éxitos recientes del aprendizaje de las máquinas también dependen profundamente de la información proveniente de los humanos. Las computadoras sólo pueden reconocer imágenes en Internet porque millones de personas han reducido la increíblemente compleja información de sus retinas a una imagen en instagram altamente estilizada, limitada y simplificada de su lindo gatito, y además también han identificado claramente la imagen con un nombre. (De ciertas maneras, la ficción distópica de “The Matrix” es un hecho sencillo: todos les estamos ayudando a las computadoras a volverse más poderosas, bajo el espejismo de que estamos divirtiéndonos con “lol cats”.) Y se pueden traducir, más o menos, porque pueden aprovechar enormes bases de datos de traducción humana.
Las computadoras no pueden poner los ojos en blanco
Pero las computadoras actuales usan la información de las personas de manera relativamente sencilla y sin esfuerzo. Nuevos estudios demuestran que, en contraste, incluso los niños de tres años pueden evaluar el testimonio de otras personas de una manera sorpresivamente sofisticada. Pueden decir si una persona es confiable o sospechosa, ingenua o experta. Pueden incluso usar señales para determinar si un adulto simplemente está diciendo lo que piensa o si está tratando de darles una lección deliberada. Y los niños muy pequeños aprenden de manera diferente, dependiendo de qué es lo que piensan sobre la persona que les está hablando. (Incluso las computadoras más sofisticadas tienen todavía que dominar la habilidad de poner los ojos en blanco ante la fatuidad de un adulto).
Por supuesto, la gran idea de Turing era que una vez que tuviéramos una explicación detallada de cualquier proceso podríamos programarlo en una computadora. Es aquí donde los tiempos verbales entran: en el momento en que es cuestión de fe si es que tal explicación de la inteligencia humana será posible o cuál será el resultado. Como científicos, es natural querer avalar esa fe, y esperar que dicha explicación será posible, aunque, en este momento, no sea más que fe.
Y, después de todo, sabemos que existen sistemas físicos inteligentes que pueden hacer todo esto. De hecho, la mayoría de nosotros hemos creado dichos sistemas y también hemos disfrutado al hacerlo (bueno, al menos en las etapas tempranas). Los conocemos como nuestros hijos. La computación todavía es la mejor, de hecho, la única explicación que poseemos de cómo un objeto físico como el cerebro puede actuar de manera inteligente. Pero, al menos por ahora, casi no tenemos idea de cómo el tipo de inteligencia que observamos en los niños es posible. Hasta que lo sepamos, las más grandes y poderosas computadoras no podrán todavía igualar a los más pequeños y débiles humanos.
Autora: Alison Gopnik es profesora de psicología y profesora afiliada de filosofía en Tolman Hall University of California at Berkeley. Está participando en el la Reunión Anual 2015 del Foro Económico Mundial en Davos. Este texto es una versión más larga de un artículo publicado en el sitio web Edge.
Imagen: REUTERS
No te pierdas ninguna actualización sobre este tema
Crea una cuenta gratuita y accede a tu colección personalizada de contenidos con nuestras últimas publicaciones y análisis.
Licencia y republicación
Los artículos del Foro Económico Mundial pueden volver a publicarse de acuerdo con la Licencia Pública Internacional Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0, y de acuerdo con nuestras condiciones de uso.
Las opiniones expresadas en este artículo son las del autor y no del Foro Económico Mundial.
La Agenda Semanal
Una actualización semanal de los temas más importantes de la agenda global
Puedes anular tu suscripción en cualquier momento utilizando el enlace que figura en nuestros correos electrónicos. Para obtener más información, consulta nuestro Política de privacidad.