Qué son las aplicaciones en ChatGPT y cómo usarlas: Apps nativas, Agent Kit y MCP del OpenAI Dev Day
Tiempo de lectura: 12 minutos
Puntos clave
- Las “aplicaciones en ChatGPT” traen servicios como Spotify, Canva o Expedia dentro del chat, con vistas ricas y permisos claros.
- Son una evolución de los “plugins”: más conversación, menos formularios; más contexto compartido y acciones seguras vía function calling.
- El protocolo abierto Model Context Protocol (MCP) estandariza cómo el modelo “habla” con herramientas y datos.
- Con Agent Kit puedes construir agentes conversacionales que consultan tus fuentes y ejecutan acciones con control.
- Despliegue progresivo: acceso inicial fuera de Europa y llegada por oleadas a planes Gratis, Go, Plus y Pro.
- Mejor práctica: diseña para conversación, pide solo el contexto necesario y aplica el principio de menor privilegio en permisos.
Tabla de contenidos
- Introducción
- Qué es y cómo funcionan las aplicaciones en ChatGPT
- Casos de uso ilustrados (demos)
- Para desarrolladores: oportunidad y kit
- Capacidades del SDK de Apps
- Publicación, descubrimiento y recomendaciones
- Buenas prácticas iniciales
- Model Context Protocol (MCP)
- Consejo de enfoque
- Limitaciones y estado de despliegue
- Agent Kit: creación de agentes conversacionales
- Conectores iniciales
- Diferencias frente a N8n, Zapier o Make
- Limitaciones actuales y lo que falta
- Otras novedades del OpenAI Dev Day
- Impacto estratégico y recomendaciones
- Conclusión y próximos pasos
- Preguntas frecuentes (FAQ)
Introducción
OpenAI Dev Day marcó un antes y un después. Las nuevas aplicaciones en ChatGPT llevan la IA a otro nivel: ahora puedes “traer” servicios como Spotify, Canva o Expedia a tu chat y pedirles cosas en lenguaje natural. Esto multiplica los casos de uso dentro de la misma interfaz conversacional.
¿Por qué importa? Porque no saltas entre pestañas ni copias/pegas datos. Hablas con ChatGPT y, cuando hace falta, este invoca la app adecuada, con tu permiso, y te muestra vistas ricas (vídeo, previsualizaciones, pantalla completa) sin salir del chat. Según el anuncio, el despliegue es gradual, con acceso inicial fuera de Europa, y llegará a planes Gratis, Go, Plus y Pro en oleadas.
Si te dedicas a producto, educación, marketing o desarrollo, esto te toca de cerca. Vamos por partes para que lo pruebes bien desde el día uno.
Qué es y cómo funcionan las “aplicaciones en ChatGPT”
Una “aplicación en ChatGPT” es una app que vive dentro del chat. Se ejecuta en la misma conversación, entiende tu intención y devuelve resultados con su propia UI integrada.
- Definición simple: es como tener “mini apps” que responden a tus pedidos dentro del chat. No abres otra web; la app viene a ti.
- Cómo se invocan:
- ChatGPT las sugiere según el contexto del mensaje.
- También puedes llamarlas por su nombre: “Spotify, crea una playlist para mi fiesta de 90’s”.
- La primera vez, das permiso (consentimiento) para conectar tu cuenta/servicio.
- Interfaz y UX:
- Vistas integradas con previsualizaciones.
- Vídeo embebido y Picture‑in‑Picture para seguir viendo mientras conversas.
- Modo pantalla completa cuando necesitas foco.
- Partners y ejemplos iniciales:
- Viajes y ocio: Booking, Expedia, Spotify.
- Diseño y productividad: Canva, Figma.
- Educación y vivienda: Coursera, Zillow.
- Base técnica:
- SDK de Apps: define cómo renderizar contenido y cómo exponer capacidades de la app al modelo.
- Model Context Protocol (MCP): un estándar para que el modelo “hable con aplicaciones” de forma segura y con contexto compartido. MCP no es una marca de un solo proveedor; es un protocolo abierto para herramientas y datos.
Si vienes del mundo “plugins”, piensa en una evolución: menos formularios, más conversación; menos “corta y pega”, más contexto compartido. Esto se apoya en técnicas como function calling y assistants que coordinan herramientas de forma orquestada.
Casos de uso ilustrados (demos)
Aprendizaje con Coursera
- Qué ocurre: estás viendo un curso y haces una pregunta. ChatGPT entiende el vídeo (tema, minuto, ejemplo) y te responde con el contexto exacto de la lección.
- Beneficio: no pierdes el hilo. Es la diferencia entre “buscar en todo internet” y “preguntar al profe justo en esta diapositiva”.
- Ejemplo: “Explícame la derivada que usa a los 3:42 y dame un ejercicio corto”. La app devuelve una explicación paso a paso y un ejercicio autocorregible sin salir del chat.
Diseño con Canva
- Qué ocurre: pides un diseño (“un flyer para la feria del libro en tonos verdes”).
- Interfaz: ves el resultado dentro del chat, haces ajustes rápidos (tipografía, colores, imágenes) y previsualizas en tiempo real.
- Beneficio: iteras en minutos y no alternas entre webs.
- Nota: ya existe historial de integraciones de Canva con ChatGPT/GPTs, útil como referencia de flujo y permisos: Canva ChatGPT plugin.
Viajes y ocio con Expedia/Booking; música con Spotify
- Planificación: “Organiza 4 días en Kioto con ryokan, presupuesto medio, y anota los traslados entre barrios”.
- Detalles en contexto: fechas, precios, mapas y opciones se muestran como tarjetas dentro del chat.
- Spotify: “Crea una playlist de 2 horas con pop latino 2010–2015, sube el tempo tras 45 minutos”. Ajustas sobre la marcha como si conversaras con un DJ.
Productividad y diseño con Figma; inmobiliario con Zillow
- Figma: “Crea un wireframe de onboarding con 3 pantallas y CTA claro”. Recibes una propuesta y la ajustas con prompts cortos.
- Zillow: “Muéstrame pisos con 2 habitaciones en Seattle, walking score alto, y compara con barrios cercanos”. Ves fichas con filtros sin salir del chat.
Mezcla de múltiples apps en una misma conversación
- Ejemplo largo:
- Pides ideas de viaje (Expedia).
- Generas un itinerario visual (Canva).
- Creas una playlist para el roadtrip (Spotify).
- Guardas todo en un doc compartido y lo envías al equipo (app de productividad).
- Moraleja: en vez de 5 pestañas, mantienes un hilo. El contexto se hereda y la fricción baja.
Sigue bajando: ahora pasamos del “qué puedo hacer” al “cómo se construye y cómo se publica”.
Para desarrolladores: oportunidad y kit
Para devs, este es un canal directo a una audiencia masiva desde el “marketplace” de ChatGPT. Más que otra app aislada, aquí construyes experiencias conversacionales con señal de intención muy clara. Revisa detalles del lanzamiento en OpenAI Dev Day.
Capacidades del SDK de Apps
- Renderizar contenido web:
- Tarjetas enriquecidas, vistas de detalle, formularios ligeros.
- Vídeo embebido, Picture‑in‑Picture y pantalla completa para tareas inmersivas.
- Exponer contexto de la app al modelo:
- Pasa “lo que la app sabe” al modelo para respuestas más precisas.
- Usa contratos de herramientas al estilo function calling para acciones seguras.
- Consentimiento y permisos:
- Solicita el acceso mínimo necesario (principio de menor privilegio).
- UX explícita: el usuario ve qué datos se comparten y puede revocar.
Publicación, descubrimiento y recomendaciones
- Publicación: define tu app, scopes y UI; sube descripciones orientadas a intención (“reservar mesa”, “generar avatar”).
- Descubrimiento: ChatGPT sugiere tu app cuando el prompt coincide con la intención resuelta por tu servicio.
- Recomendaciones: si tu app es útil y confiable, el sistema la muestra más; si genera fricción, cae en sugerencias. Piensa en SEO conversacional: claridad de propósito y calidad de respuesta.
Buenas prácticas iniciales
- Diseña para conversación:
- Respuestas breves, opciones claras y siguiente paso sugerido.
- Ejemplo: “¿Quieres ver más opciones, comparar precios o reservar ahora?”.
- Manejo de contexto:
- Pide solo lo necesario: “fechas”, “presupuesto”, “estilo”.
- Recuerda el estado del usuario (con consentimiento) para evitar preguntas repetidas.
- Privacidad y guardrails:
- Minimiza datos personales; cifra en tránsito y, cuando aplique, en reposo.
- Límites de acción: confirma antes de ejecutar operaciones sensibles (“comprar”, “borrar”, “enviar”), idealmente con function calling.
- Observabilidad:
- Registra métricas de fricción: prompts que no resuelve, pasos sin clicks, abandonos.
- Itinerancia de errores: fallback a texto claro si falla la vista enriquecida.
Model Context Protocol (MCP) en dos líneas
- Qué es: un protocolo abierto para que modelos y herramientas compartan contexto y capacidades de forma segura y estándar.
- Por qué importa: evita integraciones ad‑hoc frágiles; favorece portabilidad y auditoría. Ideal para ecosistemas con varias apps y fuentes de datos. Más info en Model Context Protocol.
Consejo de enfoque
- No busques “meter todo” en una app. Haz una cosa bien y habla el idioma del usuario:
- Una app de rutas de viaje que clava “fechas + presupuesto + transporte + clima”.
- Una app de diseño que brilla en “iterar 5 variantes útiles en 30 segundos”.
- Pro tip: empieza con intents frecuentes, latencia baja y feedback claro. Luego añade profundidad.
Limitaciones y estado de despliegue
- Disponibilidad por regiones: el lanzamiento es escalonado. Usuarios fuera de Europa tienen acceso antes; la llegada a Europa y a cuentas empresariales puede tardar semanas. Revisa anuncios en OpenAI Dev Day y el banner en el chat.
- Invocación por prompt inestable al principio: si no ves sugerencias, invoca por nombre (“Canva, genera un moodboard”) y comprueba los permisos.
- Consentimiento y permisos: cada app pide acceso la primera vez. Si notas resultados “vacíos”, revisa el panel de permisos y reconecta.
- Latencia y vistas enriquecidas: vídeo, PiP o pantalla completa pueden tardar más. Si falla el render, debería caer a texto claro; repórtalo.
- Catálogo en expansión: no todas las marcas están desde el día uno; habrá rotación y pruebas A/B.
- Privacidad y guardrails: confirma acciones sensibles y limita el contexto compartido. Usa contratos seguros con function calling.
Agent Kit: creación de agentes conversacionales basados en tus datos
Qué es y para qué sirve
Agent Kit es una forma de construir agentes que conversan, recuerdan el contexto y operan con herramientas y datos propios. Piensa en un “asistente” que responde dudas de clientes, guía a tu equipo interno o consulta documentación y bases de conocimiento sin salir del chat. Está orientado a interacción continua y decisiones paso a paso, no solo a lanzar una automatización.
Casos típicos:
- Atención al cliente con políticas y artículos indexados.
- Soporte interno con FAQs, manuales y catálogos.
- Operaciones guiadas: checklists, reservas, seguimiento de pedidos.
Cómo se construye un agente (paso a paso)
- Define el rol y el tono: breve, claro y con objetivos medibles (p. ej., “resolver el 80% de dudas de envío sin escalar”).
- Conecta las fuentes de conocimiento: sube PDFs, URLs o repositorios. Etiqueta por tema y caducidad.
- Añade herramientas seguras:
- Lectura de documentos y búsqueda semántica.
- Acciones concretas vía function calling: “crear ticket”, “agendar cita”, “enviar confirmación” con confirmación del usuario.
- Diseña la UI mínima: opciones rápidas, estados visibles (“leyendo documento”, “confirmar envío”), y logs de acciones.
- Prueba con diálogos reales: 20–30 conversaciones de ejemplo cubriendo lo frecuente y lo difícil.
- Observa e itera: mide tiempos, re‑preguntas y errores; ajusta prompts del sistema, permisos y reglas.
Conectores iniciales
De inicio, el foco está en datos y colaboración:
- Fuentes de archivos: Google Drive, Dropbox y SharePoint para adjuntar y buscar.
- Comunicación: Microsoft Teams y otros canales para publicar respuestas o recibir consultas.
- Proveedores MCP: herramientas y datos expuestos mediante Model Context Protocol para compartir contexto de forma estándar.
Nota: los conectores “accionables” complejos (ERP, pagos, logística profunda) pueden requerir integraciones a medida o llegar más adelante.
Diferencias frente a N8n, Zapier o Make
- Enfoque: Agent Kit prioriza conversación y toma de decisiones con contexto. N8n/Zapier/Make optimizan flujos ETL/automatización con cientos de conectores.
- Orquestación: en Agent Kit, el modelo decide cuándo invocar herramientas y qué pedir. En plataformas de automatización, el humano diseña el flujo de punta a punta.
- UX: con Agent Kit, la interacción es dialogada en el chat; con Zapier/Make, el usuario rara vez “conversa”, dispara flujos por triggers o formularios.
- Complementariedad: usa Agent Kit para interfaz conversacional y razonamiento; conecta con N8n/Make para procesos largos, batch o conectores nicho.
Limitaciones actuales y lo que falta
- Catálogo de conectores: aún limitado para acciones empresariales críticas. Se esperan más integraciones y políticas granulares de seguridad.
- Control de versiones y pruebas: necesitas disciplina de prompts y datos para evitar regresiones. Agrega entornos de staging y conjuntos de pruebas.
- Gobernanza: define quién puede publicar agentes, qué datos pueden leer y cómo se auditan acciones. Esto madurará con el tiempo en políticas y tooling. Revisa Assistants overview.
Otras novedades del OpenAI Dev Day
- Codex asíncrono: un agente de código más eficiente, orientado a tareas de desarrollo que requieren pasos encadenados sin bloquear la sesión. Útil para refactors, pruebas y migraciones. Detalles en OpenAI Dev Day.
- Sora 2 con acceso por API: generación de vídeo con más control creativo, mejor consistencia de escenas y posibilidad de integrarlo en apps multimedia o flujos de marketing. Más en OpenAI Dev Day.
Ambas piezas encajan con el mismo patrón: herramientas especializadas que el modelo invoca y coordina según la intención del usuario, reforzando el ecosistema de aplicaciones en ChatGPT.
Impacto estratégico y recomendaciones
Para empresas
- Prioriza dos o tres casos de alto valor: soporte, formación interna y ventas asistidas.
- Crea una política de datos: qué puede leer el agente, cómo se tokeniza y por cuánto tiempo.
- Implementa guardrails: confirmación de acciones sensibles y registros para auditoría.
Para creadores educativos
- Estructura cursos “conversables”: vídeos con timestamps, transcripciones limpias y objetivos por sección.
- Usa agentes para feedback inmediato y ejercicios autocorregibles.
- Mide lo que importa: dudas resueltas, minutos de retención y tasa de finalización.
Para producto y marketing
- Prototipa rápido con Canva y Figma en ChatGPT y valida en días, no semanas.
- Diseña flujos multiapp: itinerarios + checklist + playlist + documento compartido en un solo hilo.
- Define métricas de fricción: clicks innecesarios, tiempos de espera y abandonos.
Para desarrolladores
- Empieza con intents claros y de alta frecuencia. Optimiza prompts y contratos de herramientas.
- Exponte al descubrimiento: descripciones orientadas a intención y UX de primer uso sin fricción.
- Usa MCP para integraciones portables y auditables; evita acoplamientos ad‑hoc.
Conclusión y próximos pasos
Las aplicaciones en ChatGPT cambian la forma de trabajar: menos saltos entre pestañas, más foco y resultados visibles en el mismo hilo. Con Agent Kit puedes sumar agentes que entienden tus datos y actúan de forma segura. Y con piezas como Sora 2 y Codex asíncrono, el ecosistema se expande hacia vídeo y desarrollo con más control. Más detalles del anuncio en OpenAI Dev Day.
Siguiente paso para equipos:
- Elige un caso de valor.
- Diseña una app con intents claros y vistas simples.
- Añade un agente con Agent Kit para cubrir dudas y acciones típicas.
Siguiente paso para desarrolladores:
- Expón herramientas con function calling y MCP para integrar fuentes de datos con menos fricción.
El mejor momento para experimentar con aplicaciones en ChatGPT es ahora: cada semana verás más partners, mejor descubrimiento y más casos de uso reales.
Preguntas frecuentes (FAQ)
¿Cómo activar las aplicaciones en ChatGPT?
- Abre una conversación nueva y escribe una tarea que implique un servicio (p. ej., “genera un flyer con Canva”).
- Acepta el consentimiento cuando ChatGPT proponga la app.
- Gestiona permisos desde la configuración de ChatGPT si necesitas reconectar o revocar. Más contexto en OpenAI Dev Day.
¿Está disponible en Europa? ¿En qué planes?
El despliegue es gradual y comenzó fuera de Europa. Llegará a planes Gratis, Go, Plus y Pro en oleadas. Revisa tu cuenta periódicamente o las notas de OpenAI Dev Day.
¿Puedo alternar varias apps en una misma conversación?
Sí. El modelo mantiene el contexto y puede invocar varias apps según la intención. También puedes llamarlas por nombre para forzar una acción específica. Asegúrate de haber concedido permisos a cada una.
¿Qué es el Model Context Protocol (MCP) y por qué importa?
MCP es un protocolo abierto que permite a modelos y herramientas compartir contexto y capacidades de forma segura y estandarizada. Reduce integraciones frágiles, facilita portabilidad y mejora auditoría en ecosistemas con muchas apps.
¿En qué se diferencia Agent Kit de N8n/Zapier/Make?
- Agent Kit: conversación continua, decisiones del modelo, acceso a datos y herramientas con razonamiento.
- N8n/Zapier/Make: automatizaciones declarativas, muchos conectores, triggers y acciones sin conversación.
Lo ideal es combinarlos: interfaz conversacional con Agent Kit y procesos robustos en tu plataforma de automatización.
¿Qué permisos se solicitan al conectar apps como Coursera o Spotify?
Suelen pedir acceso mínimo para:
- Leer contenido necesario (curso, listas, bibliotecas).
- Crear o modificar elementos (playlists, borradores).
Siempre verás un cuadro claro de qué se comparte y podrás revocar después. Aplica el principio de menor privilegio. Más referencias de permisos en Canva ChatGPT plugin.
¿Cómo publico mi propia app en ChatGPT?
- Define capacidades y vistas con el SDK de Apps.
- Expón herramientas seguras con function calling.
- Prepara descripciones enfocadas en intención y casos de uso.
- Sube para revisión y cuida la UX de primer uso. El descubrimiento mejora con utilidad y fiabilidad. Ver OpenAI Dev Day.
¿Cómo manejo errores y caídas de vistas enriquecidas?
- Implementa fallback a texto claro.
- Muestra estados visibles (“conectando…”, “cargando resultados”).
- Registra errores y latencia para priorizar mejoras. Un buen fallback evita abandonos.
¿Puedo integrar mis propios datos internos con seguridad?
Sí. Usa repositorios controlados, autentica el acceso y limita el contexto compartido. Considera MCP para exponer datos de forma estándar y auditable, y añade confirmaciones para acciones sensibles.
