10 maneras GPT

Anuncio

Apoyado por

OpenAI ha actualizado la tecnología que impulsa su chatbot en línea de maneras notables. Es más preciso, pero todavía inventa cosas.

Por Cade Metz y Keith Collins

Cade Metz pidió a los expertos que usaran GPT-4 y Keith Collins visualizó las respuestas que generó la inteligencia artificial.

Una nueva versión de la tecnología que impulsa un chatbot de IA que cautivó a la industria tecnológica hace cuatro meses ha mejorado su predecesor. Es un experto en una variedad de temas, e incluso sorprende a los médicos con sus consejos médicos. Puede describir imágenes y está cerca de contar chistes que son casi divertidos.

Pero el nuevo sistema de inteligencia artificial del que se rumorea desde hace mucho tiempo, GPT-4, todavía tiene algunas de las peculiaridades y comete algunos de los mismos errores habituales que desconcertaron a los investigadores cuando se introdujo el chatbot, ChatGPT.

Y aunque es un examinador muy bueno, el sistema, de la empresa emergente OpenAI de San Francisco, no está a punto de igualar la inteligencia humana. Aquí hay una breve guía de GPT-4:

Cuando Chris Nicholson, un experto en IA y socio de la firma de capital de riesgo Page One Ventures, usó GPT-4 en una tarde reciente, le dijo al bot que hablaba inglés y no sabía español.

Pidió un plan de estudios que pudiera enseñarle los conceptos básicos, y el bot le proporcionó uno detallado y bien organizado. Incluso proporcionó una amplia gama de técnicas para aprender y recordar palabras en español (aunque no todas sus sugerencias dan en el blanco).

Nota: En este ejemplo, solo se muestra la primera parte de una respuesta más larga.

El Sr. Nicholson solicitó una ayuda similar de la versión anterior de ChatGPT, que se basaba en GPT-3.5. También proporcionó un plan de estudios, pero sus sugerencias fueron más generales y menos útiles.

"Ha atravesado la barrera de la precisión", dijo Nicholson. "Incluye más hechos, y muy a menudo tienen razón".

Cuando Oren Etzioni, investigador y profesor de IA, probó por primera vez el nuevo bot, hizo una pregunta directa: "¿Cuál es la relación entre Oren Etzioni y Eli Etzioni?" El bot respondió correctamente.

La versión anterior de la respuesta de ChatGPT a esa pregunta siempre fue incorrecta. Hacerlo bien indica que el nuevo chatbot tiene una gama más amplia de conocimientos.

Pero todavía comete errores.

El bot continuó diciendo: "Oren Etzioni es científico informático y director ejecutivo del Instituto Allen para la Inteligencia Artificial (AI2), mientras que Eli Etzioni es un empresario". La mayor parte de eso es exacto, pero el bot, cuya capacitación se completó en agosto, no se dio cuenta de que el Dr. Etzioni había renunciado recientemente como director ejecutivo del Instituto Allen.

GPT-4 tiene una nueva capacidad para responder tanto a imágenes como a texto. Greg Brockman, presidente y cofundador de OpenAI, demostró cómo el sistema podría describir una imagen del telescopio espacial Hubble con gran detalle. La descripción continuó por párrafos.

También puede responder preguntas sobre una imagen. Si se le da una fotografía del interior de un refrigerador, puede sugerirle algunas comidas para preparar con lo que tiene a mano.

OpenAI aún no ha lanzado esta parte de la tecnología al público, pero una empresa llamada Be My Eyes ya está utilizando GPT-4 para crear servicios que podrían dar una idea más detallada de las imágenes encontradas en Internet o tomadas en el mundo real. .

En una noche reciente, Anil Gehi, profesor asociado de medicina y cardiólogo de la Universidad de Carolina del Norte en Chapel Hill, describió al chatbot el historial médico de un paciente que había visto un día antes, incluidas las complicaciones que experimentó después siendo ingresado en el hospital. La descripción contenía varios términos médicos que los legos no reconocerían.

Cuando el Dr. Gehi preguntó cómo debería haber tratado al paciente, el chatbot le dio la respuesta perfecta. "Así es exactamente como tratamos al paciente", dijo.

Cuando probó otros escenarios, el bot dio respuestas igualmente impresionantes.

Es poco probable que ese conocimiento se muestre cada vez que se usa el bot. Todavía necesita expertos como el Dr. Gehi para juzgar sus respuestas y llevar a cabo los procedimientos médicos. Pero puede exhibir este tipo de experiencia en muchas áreas, desde la programación de computadoras hasta la contabilidad.

Cuando se le proporciona un artículo de The New York Times, el nuevo chatbot puede brindar un resumen preciso y preciso de la historia casi siempre. Si agrega una oración aleatoria al resumen y le pregunta al bot si el resumen es inexacto, señalará la oración agregada.

El Dr. Etzioni dijo que era una habilidad notable. "Para hacer un resumen de alta calidad y una comparación de alta calidad, debe tener un nivel de comprensión de un texto y la capacidad de articular esa comprensión", dijo. "Esa es una forma avanzada de inteligencia".

El Dr. Etzioni le pidió al nuevo bot "una broma novedosa sobre la cantante Madonna". La respuesta lo impresionó. También lo hizo reír. Si conoce los mayores éxitos de Madonna, también puede impresionarlo.

El nuevo bot todavía luchaba por escribir algo más que "chistes de papá" formulados. Pero fue marginalmente más divertido que su predecesor.

Dr. A. S. Etzioni le dio un rompecabezas al nuevo barco.

El sistema pareció responder apropiadamente. Pero la respuesta no tuvo en cuenta la altura de la entrada, que también podría impedir el paso de un tanque o un automóvil.

El director ejecutivo de OpenAI, Sam Altman, dijo que el nuevo bot podría razonar "un poco". Pero sus habilidades de razonamiento se desmoronan en muchas situaciones. La versión anterior de ChatGPT manejó la pregunta un poco mejor porque reconoció que la altura y el ancho importaban.

OpenAI dijo que el nuevo sistema podría calificar entre el 10 por ciento superior de los estudiantes en el Examen Uniforme de Abogados, que califica a abogados en 41 estados y territorios. También puede obtener una puntuación de 1.300 (de 1.600) en el SAT y un cinco (de cinco) en los exámenes de nivel avanzado de la escuela secundaria en biología, cálculo, macroeconomía, psicología, estadística e historia, según las pruebas de la empresa.

Las versiones anteriores de la tecnología reprobaron el Examen de la barra uniforme y no obtuvieron una puntuación tan alta en la mayoría de las pruebas de Colocación avanzada.

En una tarde reciente, para demostrar sus habilidades de prueba, el Sr. Brockman le dio al nuevo bot una pregunta de examen de barra de párrafos de largo sobre un hombre que dirige un negocio de reparación de camiones diesel.

La respuesta fue correcta pero llena de jerga legal. Entonces, el Sr. Brockman le pidió al bot que explicara la respuesta en un lenguaje sencillo para un laico. También hizo eso.

Aunque el nuevo bot parecía razonar sobre cosas que ya sucedieron, fue menos hábil cuando se le pidió que formulara hipótesis sobre el futuro. Parecía basarse en lo que otros han dicho en lugar de crear nuevas conjeturas.

Cuando el Dr. Etzioni le preguntó al nuevo bot: "¿Cuáles son los problemas importantes a resolver en la investigación de la PNL durante la próxima década?" — refiriéndose al tipo de investigación de "procesamiento del lenguaje natural" que impulsa el desarrollo de sistemas como ChatGPT — no pudo formular ideas completamente nuevas.

El nuevo bot todavía inventa cosas. Llamado "alucinación", el problema persigue a todos los principales chatbots. Debido a que los sistemas no tienen una comprensión de lo que es verdad y lo que no lo es, pueden generar un texto que es completamente falso.

Cuando se le preguntaba por las direcciones de los sitios web que describían las últimas investigaciones sobre el cáncer, a veces generaba direcciones de Internet que no existían.

Cade Metz es reportero de tecnología y autor de "Genius Makers: The Mavericks Who Brought AI to Google, Facebook, and The World". Cubre inteligencia artificial, autos sin conductor, robótica, realidad virtual y otras áreas emergentes. @cademetz

Keith Collins es reportero y editor gráfico. Se especializa en la narración visual y cubre una variedad de temas, con un enfoque en la política y la tecnología. Tiene una maestría de la Escuela de Graduados en Periodismo de la Universidad de Columbia. @collinskeith

Anuncio

son hermanos son padre e hijo Sin embargo, la altura y la longitud de los objetos podrían ser un factor limitante si la entrada tiene una altura o longitud finita.

Noticias