Chrome Prompt API y la integración nativa de Gemini Nano 2.5
Google ha estabilizado en Chrome 138 la interfaz que permite ejecutar inferencia de LLM directamente en el hardware del cliente sin coste de tokens. La comunidad técnica analiza esta API por su capaci

El Pitch
Google ha estabilizado en Chrome 138 la interfaz que permite ejecutar inferencia de LLM directamente en el hardware del cliente sin coste de tokens. La comunidad técnica analiza esta API por su capacidad para mover tareas de resumen y clasificación al navegador, eliminando latencias de red y gastos de infraestructura (fuente: Chrome Developer Docs).
Bajo el capó
La API permite llamadas directas a Gemini Nano 2.5, procesando datos localmente para mejorar la privacidad y reducir la carga en el backend (fuente: GitHub). Actualmente es estable para extensiones de Chrome, aunque el acceso desde sitios web convencionales se mantiene bajo flags experimentales (fuente: blink-dev).
Mozilla ha emitido una opinión negativa formal sobre esta propuesta (Issue #1213, abril 2026). La organización critica que Google obligue a los desarrolladores a aceptar su "Política de Usos Prohibidos", lo que permite a la empresa filtrar contenidos generados localmente basándose en criterios corporativos y no solo legales (fuente: Mozilla).
El despliegue exige un hardware mínimo de 16GB de RAM y 22GB de almacenamiento disponible para el modelo (fuente: Chrome Dev Docs). Estos requisitos actúan como un filtro que deja fuera a gran parte de los usuarios de dispositivos móviles y portátiles de gama media en 2026.
Todavía no sabemos cuál será la posición de WebKit, por lo que Safari sigue siendo una incógnita para la estandarización de esta tecnología (fuente: Dossier UsedBy). Tampoco hay comparativas de rendimiento fiables entre Gemini Nano 2.5 y las implementaciones manuales mediante WASM sobre hardware de última generación (fuente: Dossier UsedBy).
La opinión de Diego
No utilices esta API en entornos de producción que requieran portabilidad. Es un movimiento claro de vendor lock-in: si optimizas tus prompts para las peculiaridades de Gemini Nano, tu aplicación solo funcionará correctamente en Chromium. La exigencia de 22GB de disco es desproporcionada para el beneficio que aporta frente a un modelo ligero servido vía API como Claude 4 Sonnet o GPT-4o. Es una herramienta curiosa para extensiones de navegador con usuarios cautivos, pero para la web abierta, el control de políticas que ejerce Google sobre el output local es un riesgo de censura inaceptable.
Código limpio siempre,
Diego.

Diego Navarro - Early Adopter Tech Analyst at UsedBy.ai
Artículos relacionados

Audiomass: Edición de audio multitrack en 100KB de vanilla JS
Audiomass es un editor de audio basado en web que prescinde de backend y plugins, ejecutándose totalmente en el cliente mediante Web Audio API. En un 2026 saturado de aplicaciones pesadas, esta utilid

Protocolo Ético Magnifica Humanitas: La Interpretabilidad Mecanicista como Imperativo Moral
El documento establece que la tecnología nunca es neutral y que los ingenieros cargan con una responsabilidad directa sobre el impacto de sus arquitecturas. Basándose en la participación de figuras cl

El estado de la búsqueda web en 2026: Kagi, Uruky y el modelo de suscripción
Google ha consolidado su transición de buscador a motor de respuestas con Gemini 3.5, capturando el 60% de las consultas sin que el usuario haga un solo clic (fuente: The Next Web). Ante este panorama
Mantente al día con las tendencias de adopción de IA
Recibe nuestros últimos informes y análisis en tu correo. Sin spam, solo datos.