Lanzamiento del Modelo de OpenAI GPT o1
OpenAI presentó hace un par de días atrás su nueva serie de modelos llamada o1, diseñada para manejar tareas complejas de razonamiento. Este modelo, que es una mejora con respecto a GPT-4, utiliza un enfoque de razonamiento tipo "chain of thought", lo que le permite reflexionar más profundamente antes de responder. OpenAI afirma que o1 puede resolver problemas más difíciles, particularmente en campos como las matemáticas, la física y la biología, con un rendimiento comparable al de estudiantes de doctorado. Por ejemplo según dice la documentación, en una competencia de matemáticas, resolvió el 83% de los problemas, superando significativamente a los modelos anteriores.
El
modelo o1 se encuentra actualmente
en fase de prueba y está siendo evaluado para mejorar la seguridad,
especialmente para prevenir brechas como intentos de jailbreaking. Está
disponible en el servicio de pago de ChatGPT y a través de la API de OpenAI.
Aunque
o1 aún no cuenta con algunas de las
funciones más prácticas de la versión ChatGPT 4o, como la navegación web o la
carga de archivos, es por otro lado, un gran avance en las capacidades de
razonamiento de la IA que la harían especialmente diseñado para “…
resolver tareas complejas en ciencia, matemáticas y programación” .
Además, OpenAI está trabajando en una versión más pequeña y rentable llamada
o1-mini, diseñada para tareas de codificación a un precio más accesible.
¿Cuál es la diferencia entre la
versión o1 y ChatGPT- 4o?
OpenAI o1 está diseñado para sobresalir en tareas de
razonamiento complejas. Dedica más tiempo a pensar antes de responder, lo que
le permite resolver problemas más difíciles y brindar explicaciones más
detalladas. Es especialmente adecuado para tareas como investigación
científica, codificación y matemáticas.
Por
su parte, ChatGPT-4o es un modelo de
lenguaje de uso más general que resulta excelente para una amplia gama de
tareas, como generar formatos de texto creativos, traducir idiomas, escribir
distintos tipos de contenido creativo y responder a sus preguntas de forma
informativa. Actualmente, es masivo su uso en tareas y automatizaciones para
atención al cliente, creación de contenido y recuperación de información
general.
En
general y resumiendo, GPT-4o es un modelo de IA amplio y de propósito general,
mientras que o1 está más especializado y se centra en tareas científicas como
investigación, codificación y matemáticas.
Puntos principales acerca de OpenAI
o1
Los
principales aspectos que podrían destacarse de la información oficial de OpenAI
son:
Nueva Serie de Modelos de IA: Son modelos diseñados para dedicar más tiempo a
pensar antes de responder, lo que les permite resolver tareas complejas en
ciencia, matemáticas y programación de manera más eficiente que los modelos
anteriores.
Rendimiento en Tareas Complejas: Ha mostrado un rendimiento sobresaliente,
similar al de estudiantes de doctorado en disciplinas como física, química y
biología. En matemáticas, durante un examen clasificatorio para la Olimpiada
Internacional de Matemáticas, el modelo de razonamiento resolvió el 83% de los
problemas, superando ampliamente el 13% resuelto por modelos previos.
Capacidades Avanzadas de
Razonamiento: Este modelo es un
avance significativo para tareas que requieren razonamiento complejo. Aunque
aún no cuenta con algunas de las características de ChatGPT, como la navegación
web, representa una nueva era en la capacidad de la IA para resolver problemas
complicados.
Seguridad Mejorada: OpenAI ha implementado un nuevo enfoque de
entrenamiento en seguridad que aprovecha las capacidades de razonamiento de los
modelos para aplicar de manera más efectiva las reglas de seguridad. En pruebas
para evitar brechas de seguridad, el modelo o1 obtuvo una puntuación de 84 en
comparación con el 22 de GPT-4o.
Colaboraciones en Seguridad: OpenAI ha firmado acuerdos con los Institutos de
Seguridad en IA de EE.UU. y el Reino Unido para garantizar la evaluación
rigurosa y pruebas de los modelos antes de su lanzamiento público, mostrando su
compromiso con la seguridad y el alineamiento ético.
Usos Potenciales: Son especialmente útiles en campos como la
investigación científica, la programación y las matemáticas avanzadas. Ejemplos
incluyen desde el análisis de datos de secuenciación celular hasta la
generación de fórmulas matemáticas complejas para la óptica cuántica.
Modelo o1-mini: Simultáneamente OpenAI ha lanzado el o1-mini, un modelo más pequeño y rápido
diseñado para la generación y depuración de código complejo. Es un 80% más
económico que el modelo o1-preview, ofreciendo una solución eficiente y
rentable para tareas que requieren razonamiento, pero no un amplio conocimiento
general.
Disponibilidad para usuarios de
ChatGPT: Los usuarios de
ChatGPT Plus y Team pueden acceder a los modelos o1-preview y o1-mini,
con límites semanales de 30 mensajes para o1-preview y 50 para o1-mini. Los
usuarios de ChatGPT Enterprise y Edu tendrán acceso la próxima semana. Los
usuarios free todavía no pueden utilizar los modelos comentados.
Acceso para desarrolladores: Los desarrolladores en el nivel 5 del uso de la
API pueden comenzar a trabajar con ambos modelos, aunque inicialmente con un
límite de 20 RPM (requests per minute). OpenAI está trabajando para aumentar
estos límites a medida que continúan las pruebas.
Futuras actualizaciones: Se espera añadir nuevas funciones como
navegación, carga de archivos e imágenes para hacer los modelos más útiles.
Además, planean lanzar futuros modelos tanto de la serie GPT como de la nueva
serie o1.
Tips de Prompt para OpenAI o1
Evitar el uso de “Chain of Thought”: Debido a que la técnica de Chain of Thought es ya parte del razonamiento del modelo, al
utilizar en el prompt del usuario esta técnica podría obstaculizar el
rendimiento óptimo de la respuesta.
Instrucciones sencillas: Este modelo está entrenado para funcionar mejor
si el prompt del usuario es sencillo y directo; es decir, no necesita una guía
intensiva de instrucciones debido a que el modelo puede encontrar la ruta más
óptima por sí mismo. Esto sería interesantemente contrario sobre el hecho de
que hasta el modelo actual GPT- 4o, en el prompt se recomienda cierto detalle y
adecuada estructura según el caso para mejores resultados.
Utilizar delimitadores: Según las recomendaciones de prompt engineering, para una mejor
calidad en la escritura del prompt del usuario se debería utilizar
delimitadores como son por ejemplo: "###", etiquetas XML o títulos de
sección, para indicar claramente las secciones del prompt.
Limitar el contexto adicional: Si el usuario desea añadir más contexto a su prompt
mediante la técnica denominada RAG (Retrieval-Augmented
Generation) para mejorar la precisión y fiabilidad con información externa
al modelo, se recomienda incluir sólo la más relevante; el proporcionar mucha
información en el momento de la inferencia puede hacer que el modelo
"piense demasiado" (overthink)y
tome más tiempo para llegar a la respuesta.
Cristóbal Morocho Moreno
PMP-DASM-Author
Enthusiastic evangelizer of the
AI
Septiembre
2024
Fuente: https://openai.com/index/introducing-openai-o1-preview/
Comentarios
Publicar un comentario
Gracias por sus comentarios que permitan al contenido de éste Blog y al Autor mejorar continuamente.