Gemini 3.5 Flash is GA today — frontier intelligence with agentic execution, 4× faster than competing frontier models. Gemini 3.5 Flash llega hoy en GA — inteligencia frontier con ejecución agentica, 4× más rápido que los modelos frontier comparables.
At I/O on May 19, Google unveiled the Gemini 3.5 family. Flash combines frontier-level intelligence with agentic execution — Google's own benchmarks place its output at 4× the tokens-per-second of comparable frontier models and beat Gemini 3.1 Pro on coding, agentic and multimodal evals. Flash is generally available today in the Gemini app, Vertex AI, AI Studio and the API. (Pro stays in internal testing — see Rumors.) En I/O el 19 mayo, Google presentó la familia Gemini 3.5. Flash combina inteligencia frontier con ejecución agentica — los benchmarks del propio Google la sitúan en 4× los tokens-por-segundo de los modelos frontier comparables y supera a Gemini 3.1 Pro en coding, agentic y multimodal. Flash entra en GA hoy en la app Gemini, Vertex AI, AI Studio y la API. (Pro sigue en testing interno — ver Rumores.)
If you build with the Claude or GPT API, the math just changed: Flash is positioned as a Claude Opus / GPT-5 competitor at materially lower latency, which means agentic chains that today run in 90 seconds can drop under 30. For Hispanic SMBs running customer-facing chat, lead-triage or invoice-processing agents, that's the difference between "background job" and "real-time UX". Si construyes con la API de Claude o GPT, las cuentas acaban de cambiar: Flash compite con Claude Opus / GPT-5 a una latencia mucho menor, lo que significa que cadenas agenticas que hoy tardan 90 segundos pueden bajar de 30. Para pymes hispanas con agentes de chat, triage de leads o procesamiento de facturas en cara al cliente, esa es la diferencia entre "job en background" y "UX en tiempo real".
Run a 24-hour A/B this week on one production prompt: same input, Flash vs. your current model. Measure latency, cost and output quality. If Flash wins two of three on your real traffic, draft the migration plan before Pro lands next month and disrupts your benchmark again. Corre un A/B de 24 horas esta semana sobre un prompt en producción: mismo input, Flash vs. tu modelo actual. Mide latencia, coste y calidad. Si Flash gana dos de tres con tu tráfico real, redacta el plan de migración antes de que Pro aterrice el mes que viene y vuelva a mover el benchmark.