El GPT-4 puede analizar imágenes y tiene una mayor capacidad de razonamiento. Según sus creadores, la actualización de ChatGPT es capaz de procesar preguntas y órdenes así como generar respuestas más largas, hasta ocho veces más que la primera versión. Los expertos señalan que no debemos dejarnos engañar por su fluidez, ya que siguen basándose en correlaciones estadísticas.
La compañía OpenAI, que adquirió fama con ChatGPT, un chatbot impulsado por inteligencia artificial (IA), ha lanzado GPT-4, una actualización más potente de su modelo anterior que puede analizar imágenes y tiene una mayor capacidad de razonamiento.
La empresa de investigación de inteligencia artificial indicó que GPT-4 “supera a ChatGPT en sus capacidades de razonamiento avanzadas”.
La nueva versión es capaz de procesar preguntas y órdenes así como generar respuestas más largas, de hasta 25.000 palabras, esto es, ocho veces más que la primera versión de ChatGPT.
El presidente y cofundador de OpenAI, Greg Brockman, ejemplificó en un evento virtual que esta novedosa herramienta puede desde crear una página web a partir de la foto de un borrador escrito a mano de esa misma web hasta resolver preguntas complejas relacionadas con la declaración de impuestos.
“GPT no es un profesional de impuestos certificado, ni yo tampoco, por lo que siempre debe consultar con su asesor fiscal. Pero puede ser útil para comprender un contenido complejo y poder empoderarse con el fin de resolver problemas”, según explicó Brockman en una presentación.
En lo referente a los posibles errores, el directivo de la compañía recalcó que no es una herramienta perfecta, así como nadie es perfecto, graficó, para resaltar la contribución de "esta herramienta de amplificación".
Otra novedad es que GPT-4 cuenta con la capacidad de describir, analizar y entender imágenes gracias al útil informático Be My Eyes.
Por ejemplo, Brockman preguntó a GPT-4 por qué era gracioso un dibujo de una ardilla sonriente, haciendo fotos, y el chatbot le contestó: “La imagen es graciosa porque muestra a una ardilla sosteniendo una cámara y fotografiando una nuez como si fuera un fotógrafo profesional. Es una situación graciosa porque las ardillas generalmente comen nueces y no esperamos que usen una cámara o actúen como humanos”.
Según Mike Wooldridge, catedrático de informática de la Universidad de Oxford y director de Investigación Fundacional sobre IA del Instituto Alan Turing, en declaraciones al SMC UK, “la mayor novedad de GPT-4 es que es multimodal: puede tratar no solo texto, sino también imágenes”. Wolldridge destaca, asimismo, "las impresionantes capacidades lingüísticas de ChatGPT, que nos abrieron los ojos a toda una serie de nuevas posibilidades: la IA generativa multimodal va a multiplicarlas”.
Por su parte, el catedrático de IA de la Universidad de Bath, Nello Cristianini, indica que la nueva herramienta “da un paso más hacia una IA más realista, explotando las correlaciones entre distintas 'modalidades' de datos, como imágenes y texto. Llamarlos 'modelos lingüísticos' ya no es apropiado, pues también son modelos de visión, como mínimo”.
Sin embargo, tal y como expresa Cristianini, “debemos recordar que los modelos lingüísticos como GPT-4 no piensan de forma similar a los humanos, y no debemos dejarnos engañar por su fluidez con el lenguaje. Siguen basándose en correlaciones estadísticas descubiertas en los datos, un atajo que les evita la necesidad de representaciones explícitas del mundo. Esto no significa que no puedan ser útiles, al contrario, seguro que lo serán”.
Los modelos lingüísticos como GPT-4 no piensan de forma similar a los humanos. Siguen basándose en correlaciones estadísticas descubiertas en los datos
De otro lado, Peter Bannister, presidente ejecutivo de Sanidad de la Institution of Engineering and Technology, afirma que “GP4 incluye varias funciones nuevas, entre ellas la capacidad de generar respuestas escritas similares a las humanas a consultas que vienen en forma de imágenes, no sólo de texto, y ya está integrado en el navegador web de Microsoft”.
Sin embargo, tal como recuerda Bannister, los creadores de OpenAI advierten de que “la tecnología aún puede producir respuestas que, aunque muy convincentes, contengan errores". Y añade: “Por eso es aún más importante que se creen, a un ritmo tan sorprendente como este, mecanismos para gestionar el riesgo de desinformación, así como educar a los usuarios para garantizar que sean conscientes de las limitaciones de estas herramientas de inteligencia artificial y acerca de cómo emplearlas con eficacia”.
El experto enfatiza en que “deberíamos insistir en que se realicen pruebas continuas con las fuentes de información existentes y validadas para garantizar que no se erosiona la precisión de nuestra base colectiva de conocimientos”.
El nuevo modelo está disponible para el público en general a través de ChatGPT Plus, la suscripción mensual de ChatGPT de 20 dólares de OpenAI y es la herramienta que está detrás del chatbot de Microsoft, Bing, según los medios especializados.
OpenAI anunció también que se ha asociado con varias empresas, como Duolingo, Stripe y Khan Academy, para integrar GPT-4 en sus productos.
Además, y en el campo de los chatbots impulsados por IA, el gigante Google anunció un conjunto de próximas funciones generativas de inteligencia artificial para Google Docs, Gmail, Sheets y Slides. Las funciones que ofrecerán serán similares a las que brinda ChatGPT de OpenAI, pero usando otra tecnología.
Asimismo, los usuarios podrán servirse de IA para obtener resúmenes o ideas en Google Docs o generar correos electrónicos completos en Gmail, entre otras cosas.