• IA al día
  • Posts
  • 🤖 ChatGPT Agents: ¿Asistente estrella o becario torpe?

🤖 ChatGPT Agents: ¿Asistente estrella o becario torpe?

In partnership with

OpenAI acaba de lanzar ChatGPT Agents: agentes que navegan por internet, hacen clics, rellenan formularios y ejecutan tareas complejas por ti. En teoría.

En la práctica, hemos probado la herramienta a fondo y los resultados son... mixtos. Algunas tareas las resuelve brillantemente en minutos. Otras las abandona después de 2 horas de trabajo infructuoso.

Pero también hay noticias épicas: OpenAI acaba de ganar una medalla de oro en las Olimpiadas Internacionales de Matemáticas. Un hito que en 2021 nadie creía posible hasta la próxima década.

Hoy repasamos qué funciona, qué no, y por qué este es solo el comienzo de algo mucho más grande.

¿Te parece útil? Compártelo con alguien que debería saberlo. Botón de abajo, 3 segundos.

ChatGPT Agents: El Operator integrado

La promesa: Un agente que navega por internet, entiende interfaces, hace clics precisos y completa tareas complejas mientras tú haces otras cosas.

La realidad: Una herramienta funcional pero temperamental que a veces sorprende gratamente y otras te deja con ganas de hacerlo tú mismo.

Cómo funciona (cuando funciona)

ChatGPT Agents integra la tecnología de Operator directamente en ChatGPT. Ahora puedes combinar navegación web con razonamiento profundo, intérprete de código, conectores de terceros y todas las herramientas del ecosistema OpenAI.

Disponibilidad:

  • Pro ($200/mes): 400 prompts disponibles

  • Plus ($20/mes): 40 prompts, llegando próxima semana

  • Europa: Bloqueado por regulación (necesitas VPN)

Las pruebas que importan

Vamos a analizar algunas tareas que le hemos dado a este nuevo agente.

Tarea exitosa: Análisis de Twitter

  • Objetivo: Extraer métricas de mis últimos 10 tweets, crear tabla Excel

  • Tiempo: 7 minutos

  • Intervención humana: Solo login

  • Resultado: Perfecto

Tarea fallida: Registro de factura

  • Objetivo: Subir factura OpenAI a plataforma contable

  • Tiempo: 2 horas antes de fallar

  • Problema: Se atascó con la interfaz, no entendía cómo completar formularios

Tarea exitosa: Pedido supermercado

  • Objetivo: Repetir pedido semanal, quitar productos innecesarios

  • Tiempo: 20 minutos

  • Resultado: Funcionó, pero gastó 12-13 créditos por conversación

Los problemas reales

1. CAPTCHAs son kryptonita La IA se para en seco cuando encuentra un CAPTCHA. Éticamente correcto, prácticamente frustrante.

2. Precisión de clics inconsistente En ajedrez online, quería mover un peón específico pero clicaba el de al lado. Estrategia arruinada.

3. Trabajo de 27 minutos, resultado pobre Pidió análisis completo de un canal YouTube. Trabajó media hora, generó Excel con datos incompletos y superficiales.

4. Conteo de créditos agresivo Cada interacción cuenta como prompt usado. Una conversación compleja puede gastar 25% de tu cuota mensual.

¡Juntos con 1440!

Si te gusta esta newsletter y además hablas ingles, te recomiendo que le eches un vistazo a 1440, ¡es gratis!

Looking for unbiased, fact-based news? Join 1440 today.

Join over 4 million Americans who start their day with 1440 – your daily digest for unbiased, fact-centric news. From politics to sports, we cover it all by analyzing over 100 sources. Our concise, 5-minute read lands in your inbox each morning at no cost. Experience news without the noise; let 1440 help you make up your own mind. Sign up now and invite your friends and family to be part of the informed.

El hito que nadie vio venir

Mientras ChatGPT Agents tropieza con formularios web, OpenAI acaba de lograr algo histórico.

Medalla de oro en Olimpiadas de Matemáticas

Un modelo de OpenAI ganó medalla de oro en las Olimpiadas Internacionales de Matemáticas. Con las mismas condiciones que los humanos:

  • 4.5 horas para resolver problemas

  • Sin herramientas externas (calculadoras, compiladores)

  • Solo un LLM puro generando texto

¿Por qué es épico? En 2023 decíamos "los LLMs no pueden hacer matemáticas, necesitan calculadoras." Ahora uno acaba de superar a los matemáticos más brillantes del mundo usando solo razonamiento puro.

Segundo puesto en competición de programación

10 horas de competición autónoma. Sin intervención humana. Resolviendo problemas complejos, adaptándose a estrategias de otros participantes.

El agente de OpenAI quedó segundo, solo superado por un humano. Probablemente la última vez en la historia que esto ocurra.

La paradoja del progreso

Aquí está lo fascinante: OpenAI puede entrenar IA que gana olimpiadas matemáticas, pero ChatGPT Agents se confunde con formularios de facturas.

¿Por qué? Porque son problemas completamente diferentes:

Matemáticas olimpícas:

  • Entorno controlado

  • Reglas claras

  • Problemas bien definidos

  • Verificación automática

Web scraping real:

  • Interfaces inconsistentes

  • CAPTCHAs deliberadamente anti-bot

  • Cambios de UI constantes

  • Edge cases infinitos

El futuro que se materializa

La progresión es clara:

2021: "IA nunca ganará olimpiadas matemáticas esta década" 2024: "Medalla de oro conseguida"

2023: "Agentes autónomos son investigación, no productos" 2025: "ChatGPT Agents disponible para usuarios Plus"

Los benchmarks de agentes muestran efectividad del 50% en tareas de 10+ horas. Cada iteración mejora. O1 Preview salió hace 10 meses y ya estamos en Chat GPT Agents.

Lo que viene después

OpenAI confirma que esta innovación matemática no estará en GPT-5. Es algo diferente que veremos "a finales de año."

Translation: Tienen algo gordo cocinándose que va más allá de los roadmaps conocidos.

La reflexión incómoda

ChatGPT Agents está a medio cocinar. Es funcional para tareas específicas pero frustrante para uso general. Como un Ferrari con frenos de bicicleta.

Pero la trayectoria es innegable:

  • Los modelos razonadores mejoran exponencialmente

  • Las capacidades de largo plazo se disparan

  • La integración de herramientas se sofistica

El patrón histórico: Cada demo "impresionante pero limitada" de OpenAI se convierte en herramienta mainstream 12-18 meses después.

ChatGPT Agents hoy es como ChatGPT en noviembre 2022: prometedor, limitado, pero obviamente el futuro.

Consejos prácticos si lo pruebas

Tareas que funcionan bien:

  • Extracción de datos de webs estáticas

  • Análisis y compilación de información

  • Tareas repetitivas con pocos edge cases

Tareas que evitar:

  • Formularios complejos con validaciones

  • Sitios con CAPTCHAs frecuentes

  • Interfaces que requieren precisión pixel-perfect

Gestión de créditos:

  • Planifica conversaciones completas

  • Evita preguntas de seguimiento innecesarias

  • Usa versión Pro si dependerás de ello profesionalmente

Encuesta de la semana

Ya que hablamos de IA que crea y automatiza...

¿Qué opinas del arte generado por IA?

Iniciar Sesión o Suscríbete para participar en las encuestas.

revelaremos los resultados en la newsletter de la siguiente semana.

La era de agentes, inaugurada

2025 será recordado como el año que los agentes autónomos se volvieron reales. No perfectos, no completamente fiables, pero reales.

ChatGPT Agents tropieza con CAPTCHAs hoy. El año que viene probablemente maneje tu contabilidad completa.

La brecha entre "IA que gana olimpiadas matemáticas" y "IA que no puede rellenar formularios" se cerrará más rápido de lo que esperamos.

Porque al final, los dos problemas son el mismo: enseñar a máquinas a navegar complejidad real. Y OpenAI acaba de demostrar que puede hacerlo a nivel olímpico.

🛠️ Herramientas IA

Mientras esperamos agentes perfectos, estas herramientas ya están resolviendo problemas específicos:

 Deepgram transcribe y analiza audio en más de 36 idiomas o genera voces IA indistinguibles de humanas en segundos. Para cuando necesitas procesar ese podcast de 3 horas que llevas posponiendo.

 Rytr revoluciona la escritura de biografías, anuncios y landing pages. Porque escribir sobre ti mismo siempre es más incómodo que dejar que lo haga una IA.

 Seedance transforma ideas en videos atractivos con IA. La democratización del contenido audiovisual que tu competencia aún no usa.

 Pagey crea portafolios y CVs en minutos. Para cuando tienes talento pero tu diseño gráfico es del 2010.

 Callab despliega agentes de voz que hacen llamadas telefónicas con voz humana. Básicamente, telemarketers que nunca se cansan ni se toman descansos.

La especialización gana mientras esperamos la generalización. Estas herramientas hacen una cosa específica extraordinariamente bien.

¿Te ha gustado el email de hoy?

Iniciar Sesión o Suscríbete para participar en las encuestas.