¿Qué significa el motor de búsqueda web de ChatGPT para el desarrollo de agentes de IA?
Con la búsqueda web, ChatGPT pasa al siguiente nivel.
Image: Unsplash/D koi
Mantente al día:
Generative Artificial Intelligence
- El uso de herramientas de búsqueda en Internet, junto con el desarrollo de agentes basados en grandes modelos lingüísticos (LLM), tiene enormes consecuencias para la mejora de las capacidades de la IA.
- La capacidad de búsqueda por Internet de ChatGPT es un paso adelante para frenar la tendencia del modelo a "alucinar" y ampliar su base de conocimientos.
- Al igual que otras herramientas, la búsqueda en Internet hace que ChatGPT sea más potente, pero nos corresponde garantizar que esa potencia se dirija en una dirección positiva.
ChatGPT, la aplicación basada en modelos como GPT4, incorpora ahora procesamiento de imágenes, reconocimiento de voz y búsqueda en Internet. Mientras que el procesamiento de imágenes demuestra el poder de la multimodalidad y el reconocimiento de voz apunta a la próxima generación de interactividad entre humanos e inteligencia artificial, la búsqueda en la web parece más habitual.
Aunque menos novedosa, la búsqueda en la web es emblemática de una tendencia impactante en el desarrollo de sistemas de IA: el uso de herramientas. El uso de herramientas y el correspondiente desarrollo de agentes basados en grandes modelos de lenguaje (LLM) tienen enormes consecuencias para la mejora de las capacidades de la IA. Son fundamentales para lo que Andrey Karpathy, de OpenAI, denomina un nuevo sistema operativo, que contribuye a un cambio de paradigma en la ingeniería que abre una nueva era de aplicaciones.
Búsqueda por Internet en ChatGPT
La capacidad de búsqueda por Internet de ChatGPT es un paso adelante para frenar la tendencia del modelo a alucinar y ampliar su base de conocimientos. Las alucinaciones, es decir, las respuestas erróneas formuladas a partir de la propia imaginación de los modelos, suponen un reto cuando es primordial disponer de información precisa y actualizada. La búsqueda en la web permite a ChatGPT acceder a datos actuales, alimentando su "ventana contextual" con información precisa y reduciendo así las alucinaciones.
ChatGPT puede obtener la información más reciente y relevante de la web cuando se plantea una consulta, en lugar de basarse únicamente en sus datos de preentrenamiento. Esta función no sólo mejora la precisión, sino que también enriquece la profundidad y amplitud de la información que ChatGPT puede proporcionar, allanando el camino para interacciones más informadas y precisas.
El mecanismo subyacente, que indica a ChatGPT cuándo debe iniciar una búsqueda en Internet, es una mezcla de protocolos programados y evaluación heurística. Aunque el usuario puede indicarle que realice una búsqueda en la web, también dispone de una heurística integrada para calibrar cuándo puede ser beneficiosa una búsqueda en la web. Por ejemplo, ante una consulta sobre acontecimientos recientes o sobre datos específicos, ChatGPT puede iniciar automáticamente una búsqueda en Internet para colmar la laguna en su propio conocimiento.
¿Has leído?
Ampliando el horizonte de los agentes mediante el uso de herramientas
Aunque potente, la búsqueda en la web es sólo un ejemplo del uso de herramientas de IA, que tendrá implicaciones de largo alcance que complementarán y ampliarán la evolución de las capacidades impulsada por la sofisticación de los propios modelos.
Los grandes modelos lingüísticos, como ChatGPT, interactúan ahora con herramientas externas, convirtiéndose en motores de razonamiento fundamentales para sistemas de IA capaces. Estas interacciones se orquestan a través de API, que permiten a los grandes modelos lingüísticos emitir órdenes, recibir respuestas y realizar un sinfín de funciones. Algunas herramientas son muy específicas, mientras que otras, como la búsqueda en Internet, tienen un enorme impacto en las capacidades del sistema de IA.
Por ejemplo, sistemas de memoria sofisticados dan a un sistema de IA la capacidad de utilizar fuentes de datos externas y desarrollar su propio repositorio de memorias al que recurrir. La evaluación de código es quizá el propósito más general de la herramienta y se ha incorporado a potentes sistemas de IA, por ejemplo, el plugin Code Interpreter de Open, un intérprete de código (o su análogo de código abierto).
Con Code Interpreter, vemos el siguiente nivel de sofisticación en el uso de herramientas de IA. Code Interpreter es algo más que una herramienta: es una especie de agente que puede perseguir un objetivo de orden superior (como analizar un conjunto de datos) y razonar y emprender acciones de forma iterativa (mediante herramientas) hasta alcanzarlo.
¿Qué está haciendo el Foro Económico Mundial en el ámbito de la cuarta revolución industrial?
Aunque Code Interpreter se anuncia como depurador y herramienta de análisis de datos, los "agentes" pueden orientarse hacia diversas tareas, en función de las herramientas a las que puedan acceder. Ejecutar código arbitrario es increíblemente general, pero pueden preferirse conjuntos de herramientas más específicos para cada caso de uso dependiendo de la aplicación. Como ya se ha mencionado, con una herramienta de navegación web, un gran modelo lingüístico, como ChatGPT, puede obtener, filtrar y sintetizar información de la web de forma autónoma en respuesta a la consulta de un usuario.
En el contexto de los agentes, el bucle de acción no tiene por qué terminar con simples consultas. En su lugar, pueden perseguirse objetivos de investigación a más largo plazo, desbloqueando la realidad de los asistentes de investigación de IA. Desplegar otras instancias de agentes de IA es una poderosa herramienta que puede utilizarse, permitiendo que un agente de IA actúe como una especie de gestor sobre subtareas, integrando el trabajo de muchos otros agentes inteligentes (un prototipo temprano de esta idea fue popularizado por AutoGPT).
Aunque en cierto sentido la palabra "agente" es antropomorfizar demasiado (haciéndonos preguntar si estos sistemas tienen objetivos como los humanos o incluso como los sistemas de aprendizaje por refuerzo), el término es apropiado en el sentido de que estos sistemas actúan como si descompusieran objetivos de orden superior en subobjetivos y realizaran las acciones pertinentes para alcanzarlos.
Esto tiene implicaciones significativas para el futuro de las capacidades de la IA. Las nuevas herramientas pueden desarrollarse más rápido y de forma más democratizada que los sistemas de IA de frontera, pero pueden tener un efecto proporcional en la generalidad y sofisticación de estos sistemas. La inteligencia general artificial (AGI) es un término nebuloso, pero el rendimiento comparable al humano en diversas tareas puede ser desbloqueado por sistemas con capacidades similares a GPT4 enredados en sistemas de IA agéntica más sofisticados.
Agentes de IA y supervisión humana
A medida que estos agentes de IA aumentan sus capacidades y pasan de ser meras herramientas a entidades capaces de perseguir objetivos de orden superior de forma autónoma, la supervisión humana se vuelve compleja pero fundamental. Tener un humano en (o sobre) el bucle se refiere a sistemas IA-humano, en los que los humanos pueden entender, supervisar y dirigir los sistemas de IA a medida que estos realizan acciones. Sin embargo, a medida que los agentes de IA se vuelven expertos en tareas más abstractas, la granularidad y la frecuencia de la intervención humana están a punto de cambiar.
Como hemos visto, los agentes de IA pueden realizar tareas cada vez más abstractas, reduciendo la necesidad práctica de supervisión humana y difuminando el concepto de decisión única. Evaluar un currículo es un tipo de decisión; evaluar una pila de currículos y sacar a la luz los mejores candidatos es otra, y decidir los criterios de evaluación antes de filtrar el conjunto de candidatos es otra.
El panorama de la supervisión humana se irá transformando a medida que los agentes de IA asciendan en la escala de abstracción de la gestión de tareas. Con cada peldaño, reducen la necesidad práctica de supervisión humana, redefiniendo potencialmente el concepto de decisión única. Los incentivos del mercado pueden acelerar aún más este cambio, reduciendo con el tiempo la supervisión a medida que confiamos a los sistemas de IA objetivos más abstractos. En los casos en que creamos que esto sería perjudicial, ya sea por preocupaciones de sesgo de la IA, alineación de valores o solidez, debemos asegurarnos de que la supervisión humana sea fácilmente operativa y esté debidamente incentivada.
La búsqueda en Internet, como otras herramientas, hace que ChatGPT sea más poderoso. Nos corresponde a nosotros asegurarnos de que ese poder se dirige en una dirección positiva.
Accept our marketing cookies to access this content.
These cookies are currently disabled in your browser.
No te pierdas ninguna actualización sobre este tema
Crea una cuenta gratuita y accede a tu colección personalizada de contenidos con nuestras últimas publicaciones y análisis.
Licencia y republicación
Los artículos del Foro Económico Mundial pueden volver a publicarse de acuerdo con la Licencia Pública Internacional Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0, y de acuerdo con nuestras condiciones de uso.
Las opiniones expresadas en este artículo son las del autor y no del Foro Económico Mundial.
Temas relacionados:
La Agenda Semanal
Una actualización semanal de los temas más importantes de la agenda global
Más sobre Tecnologías emergentesVer todo
Leila Takayama
13 de diciembre de 2024
Devanand Ramiah
13 de diciembre de 2024
Sander van't Noordende
13 de diciembre de 2024