• IA al día
  • Posts
  • 🤖 GPT-5 ya está aquí (y no es lo que esperabas)

🤖 GPT-5 ya está aquí (y no es lo que esperabas)

In partnership with

Después de meses de especulación, GPT-5 finalmente llegó. OpenAI eliminó todos sus modelos anteriores y los unificó en uno solo. El resultado: un sistema inteligente que decide cuándo pensar profundamente y cuándo responder al instante.

¿Las buenas noticias? Es más barato, programa mejor y resuelve problemas que O3 no podía. ¿Las malas? No es el salto revolucionario que todos esperábamos, y tiene algunos fallos molestos.

Hoy analizamos qué funciona realmente, qué decepciona, y por qué OpenAI apostó por la unificación en lugar de la supremacía técnica.

¿Te parece útil? Compártelo con alguien que debería saberlo. Botón de abajo, 3 segundos.

La revolución no televisada

GPT-5 no es un modelo. Es un sistema.

OpenAI hizo algo radical: eliminar la confusión. Se acabó elegir entre GPT-4o, O3, O4-mini. Ahora hay un solo GPT-5 que internamente decide si tu pregunta necesita:

  • Respuesta rápida → GPT-5 (equivalente al viejo GPT-4o mejorado)

  • Razonamiento profundo → GPT-5 Thinking (equivalente a O3/O4)

El enrutador automático es quien toma la decisión. Le dices "Hola" y responde instantáneamente. Le dices "Resuelve esta ecuación diferencial" y activa el modo pensamiento.

Los números que importan

Precios que rompen esquemas:

  • GPT-5: $1.25 input / $10 output por millón de tokens

  • GPT-4.5 (anterior): $75 input / $300 output

  • Reducción del 98% en costes vs el modelo anterior

Límites para usuarios Plus ($20/mes):

  • 80 mensajes cada 3 horas con GPT-5

  • 200 prompts semanales para forzar GPT-5 Thinking

  • Degradación automática a GPT-5 Mini si superas límites

La diferencia está en cómo lo uses

Si quieres aprovechar realmente esta nueva potencia, HubSpot tiene una guía práctica con 100 prompts testeados específicamente para casos de uso reales. Totalmente gratis.

Want to get the most out of ChatGPT?

ChatGPT is a superpower if you know how to use it correctly.

Discover how HubSpot's guide to AI can elevate both your productivity and creativity to get more things done.

Learn to automate tasks, enhance decision-making, and foster innovation with the power of AI.

Lo que realmente mejoró

Programación: donde GPT-5 brilla

Benchmark SWE-Bench: 74.9% (vs competencia en 60-70%) Velocidad de generación: Notablemente más rápida.

Matemáticas y razonamiento

Humanity's Last Exam: 35% (vs O3 con 24.3%) AIME 2025: 100% cuando usa Python ARC-AGI-1: Competitivo con Grok 4

El nuevo modelo resuelve en 16 segundos problemas que O3 Pro no pudo en 15 minutos.

Menos alucinaciones

80% menos errores factuales vs modelos anteriores. Cuando no sabe algo, lo dice claramente en lugar de inventar.

Los problemas que nadie quiere mencionar

El enrutador imperfecto

Problema real: GPT-5 sin razonamiento sigue cometiendo errores tontos en 2025.

Ejemplo: "¿Qué pesa más, 20 kilos de ladrillos o 20 kilos de plumas?"

  • GPT-5 automático: Respuesta incorrecta

  • GPT-5 Thinking forzado: Respuesta correcta en 10 segundos

La trampa: El enrutador a veces manda preguntas con truco al modelo rápido para ahorrar costes, cuando debería usar el modelo razonador.

Límites más estrictos

Antes tenías múltiples modelos de respaldo. Ahora, cuando se agotan los 80 mensajes de GPT-5, solo tienes GPT-5 Mini (más limitado).

Truco útil: Añade "piensa tu respuesta en profundidad" a cualquier prompt. El enrutador lo detecta como complejo y usa GPT-5 Thinking.

Errores básicos persistentes

Primera conversación con GPT-5: pregunta si 9.11 es mayor que 9.9. Respuesta: "Sí, 9.11 es mayor que 9.9... aunque visualmente puede parecer lo contrario... oh espera, en realidad 9.9 es mayor que 9.11."

Para 2025, estos errores deberían estar superados.

La estrategia detrás de GPT-5

No es el modelo más potente, es el más práctico

ARC-AGI-2 (benchmark duro):

  • Grok 4: 15.9%

  • GPT-5 High: 9.9%

OpenAI no busca dominar benchmarks. Busca optimizar su modelo de negocio con un sistema que:

  • Reduce costos operativos (98% más barato)

  • Mejora experiencia de usuario promedio

  • Mantiene competitividad en programación

  • Simplifica la oferta (un solo modelo)

El error de nomenclatura

La decisión más controvertida: El verdadero salto fue O1 Preview (primer modelo razonador). Ese debería haber sido GPT-5.

Ahora GPT-5 es una mejora incremental que no justifica el salto numérico históricamente significativo.

Comparación honesta con la competencia

Dónde gana GPT-5:

  • Precio más competitivo

  • Programación mejorada

  • Experiencia unificada

  • Velocidad de respuesta

Dónde pierde:

  • Grok 4 sigue siendo más potente en benchmarks duros

  • Claude mantiene ventaja en escritura

  • El enrutador introduce inconsistencias

Posición actual: Empate técnico con ventaja económica.

Lo que viene después

El patrón de OpenAI

Históricamente, cada GPT representaba un salto generacional:

  • GPT-2: Texto legible

  • GPT-3: Escritura humana

  • GPT-4: Duplicó capacidades

GPT-5 rompe este patrón siendo más evolución que revolución.

Las expectativas vs realidad

Lo que esperábamos: AGI, superar a todos los competidores, cambio paradigmático Lo que obtuvimos: Sistema práctico, mejoras incrementales, precio competitivo

No está mal. Solo no era lo que el hype prometía.

Conclusión: ¿Vale la pena?

Para usuarios nuevos: Definitivamente. Obtienes acceso a razonamiento avanzado sin conocer la complejidad técnica.

Para usuarios avanzados: Es complicado. Pierdes control sobre selección de modelos pero ganas eficiencia y precio.

Para programadores: Sí, es una mejora clara sobre la oferta anterior de OpenAI.

La realidad incómoda: GPT-5 no es el salto que necesitaba OpenAI para distanciarse. Es una jugada inteligente de producto que consolida su posición sin establecer supremacía técnica.

Pero quizás eso sea exactamente lo que necesitaban hacer.

¿Te ha gustado el email de hoy?

Iniciar Sesión o Suscríbete para participar en las encuestas.

P.D.: Ver a GPT-5 resolver en segundos lo que O3 Pro no pudo en minutos, pero fallar en "9.11 vs 9.9" resume perfectamente el estado actual de la IA.