'Corporeizar' la IA: ¿Cómo pueden los robots aprender a integrarse en la sociedad humana?

¿Cómo garantizamos que los robots con 'IA corporeizada' se integren en la sociedad humana de forma segura, ética e inclusiva? Image: Getty Images/iStockphoto
- Los grandes modelos de lenguaje como ChatGPT han acaparado la atención del mundo por su capacidad para escribir textos, resumir estudios e incluso programar.
- Pero, ¿qué ocurre cuando un robot impulsado por IA va más allá de responder con texto e interactúa con nosotros de una forma natural y aceptable?
- El futuro de la IA 'corporeizada' en forma física, como los robots, requiere replantearse cómo las máquinas aprenden, no solo de Internet, sino también de los humanos.
Los grandes modelos de lenguaje como ChatGPT, Claude o DeepSeek han captado la atención del mundo. Al predecir la siguiente palabra más probable en una frase, pueden redactar ensayos, resumir investigaciones e incluso escribir código.
Estos sistemas demuestran hasta dónde ha llegado la IA en el procesamiento y la generación de texto. Pero, ¿qué sucede cuando la IA adquiere un cuerpo?
¿Qué está haciendo el Foro Económico Mundial en el ámbito de la cuarta revolución industrial?
Imagina un robot con inteligencia artificial que no solo predice la siguiente palabra, sino también la siguiente acción más adecuada. En lugar de responder con texto, podría saludarte, entregarte un objeto o acompañarte a una sala de reuniones de una manera que te pareciera natural y aceptable.
Esta visión de una "IA corporeizada" plantea nuevas preguntas: ¿cómo pueden los robots aprender a comportarse en un mundo mucho más rico e impredecible que el texto? ¿Y cómo podemos garantizar que se integren en la sociedad humana de forma segura, ética e inclusiva?
Por qué entrenar robots es más difícil que entrenar chatbots
Los grandes modelos de lenguaje (LLM) de hoy en día se entrenan con billones de palabras extraídas de Internet, libros y conversaciones.
Aprenden patrones estadísticos en el lenguaje y luego se ajustan con retroalimentación humana para mejorar la seguridad y la relevancia. Según se informa, el entrenamiento de ChatGPT-4 requirió aproximadamente un petabyte de datos, lo que equivale a ver más de 13 años de video continuo en alta definición.
Sin embargo, incluso esa cantidad es insignificante en comparación con lo que se necesitaría para los robots. El mundo físico es mucho más complejo que el texto. Para navegar por él, un robot necesitaría predecir no solo la siguiente palabra, sino también el siguiente evento o entrada sensorial posible.
Consideremos un ejemplo sencillo: un robot frente a la puerta de una casa. El robot tiene que saber que las puertas se abren con bisagras, que los timbres permanecen fijos y que las paredes no desaparecen de repente. Para ello, necesita un modelo del mundo basado en la física, los objetos y las normas sociales.
Aunque estos modelos se pueden construir en entornos controlados, como almacenes o cadenas de montaje, no funcionan en la vida cotidiana, con sus infinitas variaciones e incertidumbres.
Para ponerlo en perspectiva, a los cuatro años, un niño ya ha procesado un equivalente estimado de 10 terabytes de información sensorial visual, lo que se acerca a la escala de datos utilizada para entrenar a ChatGPT-4.
Y eso solo contando la visión, sin sumarle la información auditiva, táctil, gustativa, propioceptiva y olfativa. Este aprendizaje corpoeizado permite a los niños comprender cómo funciona el mundo de una manera que los sistemas de IA actuales no pueden igualar.
Qué podemos aprender de los humanos sobre el aprendizaje de los robots
Los humanos somos aprendices eficaces no solo por nuestro cerebro y por aprender a través de nuestro cuerpo, sino porque aprendemos nuestras culturas.
El filósofo Daniel Dennett sostiene que la enculturación —es decir, el aprendizaje de las normas, los valores y los comportamientos culturales a través de la observación, la experiencia y la instrucción— explica por qué los humanos utilizan tan eficazmente las "herramientas de pensamiento" de su cerebro y se han desarrollado mucho más que otros primates.
Los chimpancés también aprenden socialmente, pero sin enseñanza activa. Por ejemplo, un chimpancé niño tarda años en aprender a romper una nuez con una piedra a partir de la observación pasiva y la imitación, porque los chimpancés adultos no enseñan activamente a los niños cómo abrir nueces.
Los niños humanos, por el contrario, se benefician de la enseñanza intencional de otros. A lo largo de generaciones, estas adaptaciones culturales se innovan y acumulan, impulsando el extraordinario éxito de nuestra especie.
Si queremos que los robots aprendan de manera eficaz, podemos aprovechar nuestra destreza para el aprendizaje social y la enseñanza activa y considerar un modelo en el que combinemos el aprendizaje corpoeizado con la interacción social y la transmisión cultural a través de una enseñanza activa.
De las señales sociales a la enseñanza activa
Hay dos enfoques principales sobre cómo podría producirse ese aprendizaje, siendo que la mejor opción es una combinación de ambos:
- Aprendizaje por refuerzo social: A diferencia de los chimpancés, los humanos pueden enseñar y aprender socialmente de forma activa a lo largo de generaciones. Los robots podrían aprender de esta retroalimentación enculturada humana en tiempo real, interpretando señales sociales como sonrisas, ceños fruncidos, miradas de sorpresa, voces elevadas o alejamiento de las personas. Estas señales podrían guiar a los robots hacia comportamientos más aceptables, al igual que los niños aprenden de la aprobación y desaprobación social.
- Enseñanza activa: Más allá de la observación pasiva, los humanos podrían desempeñar un papel activo en la enseñanza a los robots. Esto podría incluir métodos tradicionales, como aprender a partir de demostraciones, y explorar métodos más basados en lo social, como reacciones negativas sutiles ante errores que las personas perciben de manera más subconsciente. También se podría elegir activamente la acción más adecuada de entre un conjunto de opciones que el robot genera en un contexto determinado. El entrenamiento podría realizarse en entornos reales (como hospitales o escuelas) o en simulaciones.
Con el tiempo, estos métodos ayudarían a los robots a desarrollar patrones de comportamiento adecuados a sus contextos específicos de implementación. Un robot de hospital, por ejemplo, podría aprender gradualmente el protocolo de atención al paciente, mientras que un robot de logística podría perfeccionar su forma de interactuar con los trabajadores de un almacén.
Planificación y complejidad
Aun con el aprendizaje social, los robots se enfrentan a un reto adicional: la planificación jerárquica.
Consideremos el objetivo aparentemente sencillo de acompañar a alguien a la estación de tren. Esto requiere gestionar múltiples capas de subobjetivos: salir del edificio, cerrar la puerta con llave, tomar el autobús, ir al andén correcto. Cada paso implica obstáculos impredecibles, desde el tráfico hasta las interacciones humanas.
Un robot no puede prever de forma realista cada pequeño movimiento con antelación, hasta el control individual de cada músculo. En su lugar, debe combinar el entrenamiento previo con la capacidad de adaptar los objetivos secundarios a medida que surgen las situaciones.
La enseñanza activa por parte de los humanos, ya sea a través de demostraciones o de retroalimentación en línea o fuera de línea, puede ser esencial para ayudar a los robots a navegar por esta complejidad.
Por qué esto es relevante ahora
Los robots ya no son solo fantasía de ciencia ficción. Ahora reparten comida en las ciudades, ayudan en los almacenes e incluso hacen compañía en las residencias de ancianos. A medida que la IA generativa empieza a corporeizarse en máquinas físicas, las implicaciones se multiplican:
- Oportunidades: Los robots pueden realizar tareas arriesgadas en la construcción o la minería, ayudar en el cuidado de personas mayores o responder a desastres climáticos.
- Riesgos: Sin un diseño cuidadoso, pueden desplazar puestos de trabajo, agravar las desigualdades o incluso convertirse en armas. La privacidad, la seguridad y la confianza están en juego.
- Decisiones: Los líderes deben decidir dónde pueden utilizarse los robots, quién se beneficia de su implementación y cómo crear sistemas que generen la confianza del público.
Un llamamiento a la robótica cultural
El futuro de la IA en forma física no puede resolverse solo con una mayor cantidad de datos.
Es necesario replantearse cómo aprenden las máquinas, no solo de Internet, sino también de nosotros. Si los robots van a compartir nuestros hogares, nuestras oficinas y nuestras calles, tendrán que ser enculturados: deben aprender a través de la interacción corporeizada, las señales sociales y la enseñanza activa, de formas que complementen el desarrollo humano.
Se trata de un enorme desafío, pero también de una oportunidad. Al agregar el aprendizaje cultural en el entrenamiento de los robots, podemos crear sistemas autónomos que vayan más allá de realizar tareas y se integren de manera responsable en el tejido social de nuestras vidas.
La cuestión no es si la IA adquirirá un cuerpo, sino cómo le enseñaremos a pertenecer a nuestro mundo.
No te pierdas ninguna actualización sobre este tema
Crea una cuenta gratuita y accede a tu colección personalizada de contenidos con nuestras últimas publicaciones y análisis.
Licencia y republicación
Los artículos del Foro Económico Mundial pueden volver a publicarse de acuerdo con la Licencia Pública Internacional Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0, y de acuerdo con nuestras condiciones de uso.
Las opiniones expresadas en este artículo son las del autor y no del Foro Económico Mundial.
Mantente al día:
Cuarta Revolución Industrial
La Agenda Semanal
Una actualización semanal de los temas más importantes de la agenda global
Más sobre Tecnologías emergentesVer todo
Inna Tokarev Sela
13 de noviembre de 2025






