Lanzamiento del Modelo de OpenAI GPT o1

 


OpenAI presentó hace un par de días atrás su nueva serie de modelos llamada o1, diseñada para manejar tareas complejas de razonamiento. Este modelo, que es una mejora con respecto a GPT-4, utiliza un enfoque de razonamiento tipo "chain of thought", lo que le permite reflexionar más profundamente antes de responder. OpenAI afirma que o1 puede resolver problemas más difíciles, particularmente en campos como las matemáticas, la física y la biología, con un rendimiento comparable al de estudiantes de doctorado. Por ejemplo según dice la documentación, en una competencia de matemáticas, resolvió el 83% de los problemas, superando significativamente a los modelos anteriores.

El modelo o1 se encuentra actualmente en fase de prueba y está siendo evaluado para mejorar la seguridad, especialmente para prevenir brechas como intentos de jailbreaking. Está disponible en el servicio de pago de ChatGPT y a través de la API de OpenAI.

Aunque o1 aún no cuenta con algunas de las funciones más prácticas de la versión ChatGPT 4o, como la navegación web o la carga de archivos, es por otro lado, un gran avance en las capacidades de razonamiento de la IA que la harían especialmente diseñado para “… resolver tareas complejas en ciencia, matemáticas y programación” . Además, OpenAI está trabajando en una versión más pequeña y rentable llamada o1-mini, diseñada para tareas de codificación a un precio más accesible.

 

¿Cuál es la diferencia entre la versión o1 y ChatGPT- 4o?

OpenAI o1 está diseñado para sobresalir en tareas de razonamiento complejas. Dedica más tiempo a pensar antes de responder, lo que le permite resolver problemas más difíciles y brindar explicaciones más detalladas. Es especialmente adecuado para tareas como investigación científica, codificación y matemáticas.

Por su parte, ChatGPT-4o es un modelo de lenguaje de uso más general que resulta excelente para una amplia gama de tareas, como generar formatos de texto creativos, traducir idiomas, escribir distintos tipos de contenido creativo y responder a sus preguntas de forma informativa. Actualmente, es masivo su uso en tareas y automatizaciones para atención al cliente, creación de contenido y recuperación de información general.

En general y resumiendo, GPT-4o es un modelo de IA amplio y de propósito general, mientras que o1 está más especializado y se centra en tareas científicas como investigación, codificación y matemáticas.

Puntos principales acerca de OpenAI o1

Los principales aspectos que podrían destacarse de la información oficial de OpenAI son:

Nueva Serie de Modelos de IA: Son modelos diseñados para dedicar más tiempo a pensar antes de responder, lo que les permite resolver tareas complejas en ciencia, matemáticas y programación de manera más eficiente que los modelos anteriores.

Rendimiento en Tareas Complejas: Ha mostrado un rendimiento sobresaliente, similar al de estudiantes de doctorado en disciplinas como física, química y biología. En matemáticas, durante un examen clasificatorio para la Olimpiada Internacional de Matemáticas, el modelo de razonamiento resolvió el 83% de los problemas, superando ampliamente el 13% resuelto por modelos previos.

Capacidades Avanzadas de Razonamiento: Este modelo es un avance significativo para tareas que requieren razonamiento complejo. Aunque aún no cuenta con algunas de las características de ChatGPT, como la navegación web, representa una nueva era en la capacidad de la IA para resolver problemas complicados.

Seguridad Mejorada: OpenAI ha implementado un nuevo enfoque de entrenamiento en seguridad que aprovecha las capacidades de razonamiento de los modelos para aplicar de manera más efectiva las reglas de seguridad. En pruebas para evitar brechas de seguridad, el modelo o1 obtuvo una puntuación de 84 en comparación con el 22 de GPT-4o.

Colaboraciones en Seguridad: OpenAI ha firmado acuerdos con los Institutos de Seguridad en IA de EE.UU. y el Reino Unido para garantizar la evaluación rigurosa y pruebas de los modelos antes de su lanzamiento público, mostrando su compromiso con la seguridad y el alineamiento ético.

Usos Potenciales: Son especialmente útiles en campos como la investigación científica, la programación y las matemáticas avanzadas. Ejemplos incluyen desde el análisis de datos de secuenciación celular hasta la generación de fórmulas matemáticas complejas para la óptica cuántica.

Modelo o1-mini: Simultáneamente OpenAI ha lanzado el o1-mini, un modelo más pequeño y rápido diseñado para la generación y depuración de código complejo. Es un 80% más económico que el modelo o1-preview, ofreciendo una solución eficiente y rentable para tareas que requieren razonamiento, pero no un amplio conocimiento general.

Disponibilidad para usuarios de ChatGPT: Los usuarios de ChatGPT Plus y Team pueden acceder a los modelos o1-preview y o1-mini, con límites semanales de 30 mensajes para o1-preview y 50 para o1-mini. Los usuarios de ChatGPT Enterprise y Edu tendrán acceso la próxima semana. Los usuarios free todavía no pueden utilizar los modelos comentados.

 

Acceso para desarrolladores: Los desarrolladores en el nivel 5 del uso de la API pueden comenzar a trabajar con ambos modelos, aunque inicialmente con un límite de 20 RPM (requests per minute). OpenAI está trabajando para aumentar estos límites a medida que continúan las pruebas.

Futuras actualizaciones: Se espera añadir nuevas funciones como navegación, carga de archivos e imágenes para hacer los modelos más útiles. Además, planean lanzar futuros modelos tanto de la serie GPT como de la nueva serie o1.

Tips de Prompt para OpenAI o1

Evitar el uso de “Chain of Thought”: Debido a que la técnica de Chain of Thought es ya parte del razonamiento del modelo, al utilizar en el prompt del usuario esta técnica podría obstaculizar el rendimiento óptimo de la respuesta.

Instrucciones sencillas: Este modelo está entrenado para funcionar mejor si el prompt del usuario es sencillo y directo; es decir, no necesita una guía intensiva de instrucciones debido a que el modelo puede encontrar la ruta más óptima por sí mismo. Esto sería interesantemente contrario sobre el hecho de que hasta el modelo actual GPT- 4o, en el prompt se recomienda cierto detalle y adecuada estructura según el caso para mejores resultados.

Utilizar delimitadores: Según las recomendaciones de prompt engineering, para una mejor calidad en la escritura del prompt del usuario se debería utilizar delimitadores como son por ejemplo: "###", etiquetas XML o títulos de sección, para indicar claramente las secciones del prompt.

Limitar el contexto adicional: Si el usuario desea añadir más contexto a su prompt mediante la técnica denominada RAG (Retrieval-Augmented Generation) para mejorar la precisión y fiabilidad con información externa al modelo, se recomienda incluir sólo la más relevante; el proporcionar mucha información en el momento de la inferencia puede hacer que el modelo "piense demasiado" (overthink)y tome más tiempo para llegar a la respuesta.

 

Cristóbal Morocho Moreno

PMP-DASM-Author

Enthusiastic evangelizer of the AI

Septiembre 2024

Fuente: https://openai.com/index/introducing-openai-o1-preview/


Comentarios

Entradas populares