Google AI Edge Eloquent: así es la app de dictado con IA que se adelanta al resto

Última actualización: abril 9, 2026
Autor: Isaac
  • Google lanza Google AI Edge Eloquent, su app de dictado con IA enfocada al uso sin conexión y a la privacidad.
  • La aplicación limpia muletillas, reescribe frases y ofrece formatos como resumen, texto formal o puntos clave.
  • Funciona de forma local con modelos Gemma y permite un modo en la nube con Gemini para pulir más el texto.
  • Está disponible gratis en iOS, solo en inglés y con restricciones en Europa mientras se resuelven trámites regulatorios.

Aplicación de dictado con IA de Google

Google ha decidido mover ficha en el terreno del dictado por voz con el lanzamiento silencioso de Google AI Edge Eloquent, una nueva app que apuesta por la inteligencia artificial ejecutada directamente en el móvil. Se trata de una herramienta pensada para quienes dictan textos a menudo y se cansan de tener que corregir cada muletilla, frase a medias o error de puntuación tras la transcripción.

La aplicación, disponible de momento solo en iOS y en inglés, combina modelos de IA locales con la opción de usar la nube de Google para afinar todavía más los resultados. Su enfoque en el procesamiento sin conexión y la privacidad la coloca como una alternativa seria frente a servicios de dictado tradicionales y frente a soluciones más recientes basadas en IA generativa.

Qué es Google AI Edge Eloquent y qué la hace diferente

Interfaz de app de dictado con IA de Google

Google AI Edge Eloquent es una aplicación de dictado con inteligencia artificial diseñada para cerrar la distancia entre la forma en la que hablamos y el tipo de texto que solemos necesitar en contextos profesionales o académicos. En lugar de limitarse a transcribir palabra por palabra, intenta entender lo que el usuario quiere decir y produce un texto ya pulido.

Durante el dictado, la app muestra una transcripción en tiempo real, pero el resultado final no es una copia literal de cada vacilación. Cuando se detiene la grabación, el sistema reescribe el contenido para darle una estructura más clara, coherente y legible, algo especialmente útil para correos largos, informes o notas de trabajo.

Frente a aplicaciones clásicas de voz a texto (como los dictados integrados en móviles o apps de notas sencillas), Eloquent incorpora una capa adicional de edición automática basada en IA. Esa es la pieza clave que la diferencia y que la acerca más a un asistente de redacción que a un simple transcriptor.

Google define la herramienta como un modo de generar “texto profesional” a partir de un habla natural, sin obligar al usuario a vocalizar como si estuviera dictando una carta formal línea por línea, algo que hasta ahora frenaba bastante el uso masivo del dictado digital.

Dictado limpio: cómo la IA corrige muletillas y errores al hablar

Procesamiento de voz a texto con IA de Google

Uno de los puntos más llamativos de Google AI Edge Eloquent es su capacidad para limpiar automáticamente el habla cotidiana. La aplicación detecta muletillas como “eh”, “mmm”, “um”, “ah” y otras vacilaciones típicas, y las elimina del texto sin que el usuario tenga que repasarlo a mano.

Además de las muletillas, la IA intenta corregir frases cortadas, repeticiones y autocorrecciones a mitad de oración. Si el usuario empieza una frase, la abandona y vuelve a arrancar, la app trata de reconstruir una versión coherente, algo que hasta ahora obligaba a dedicar bastante tiempo a la edición posterior.

Esta “reescritura sobre la marcha” no solo se limita a borrar ruido: también ajusta puntuación, concordancia y gramática para que el resultado se parezca mucho más a un texto que podríamos enviar directamente por correo o pegar en un documento, en lugar de a un simple volcado de lo que se ha dicho al pie de la letra.

El modelo está entrenado para reconocer que nadie habla como escribe, y precisamente ahí intenta marcar la diferencia con otros sistemas de dictado que arrastraban el problema de la literalidad excesiva. La idea es que la persona se pueda expresar con naturalidad, sin tener que pensar en cómo quedará escrito cada trozo de frase.

Formatos de texto: resúmenes, puntos clave y tono formal o breve

Formatos de texto en app de dictado de Google

Una vez completado el dictado, Eloquent ofrece varias opciones para transformar el texto según lo que haga falta en cada momento. Desde la propia interfaz es posible convertir la transcripción en una lista de “Puntos clave”, generar un texto más “Formal” o ajustar la longitud con versiones “Corta” o “Larga”.

Estas plantillas de salida permiten, por ejemplo, dictar de forma más desordenada una reunión o una lluvia de ideas y obtener luego un resumen estructurado por apartados, o un texto extendido con más contexto si se va a compartir con otras personas. Es un enfoque que encaja bien con periodistas, profesionales que toman notas rápidas o estudiantes que quieren repasar contenidos.

El usuario puede ir probando diferentes formatos hasta dar con el que mejor encaje en cada situación, sin necesidad de repetir el dictado. La propia app se encarga de aplicar la IA generativa para reorganizar y reescribir el contenido original a partir de las mismas palabras pronunciadas.

Más allá de estos modos predefinidos, Google está posicionando Eloquent como una solución de productividad versátil, capaz de cubrir desde borradores de correos hasta apuntes de clase o guiones para contenido digital, todo a partir del mismo flujo de dictado.

Modelos Gemma en el dispositivo y opción de nube con Gemini

La arquitectura técnica de la aplicación se basa en una combinación de modelos locales y en la nube. Para el funcionamiento sin conexión, Eloquent descarga al iPhone modelos de reconocimiento de voz y lenguaje basados en Gemma, la familia de modelos abiertos de Google pensada para ejecutarse en dispositivos propios.

La primera vez que se abre la app, el sistema instala estos modelos en el móvil y, a partir de ahí, puede convertir voz en texto y limpiarlo sin necesidad de conexión a Internet. Esto reduce tanto la latencia como la dependencia de los servidores de Google, algo que puede ser clave en desplazamientos, zonas sin cobertura o simplemente para quienes prefieren no enviar audio a la nube.

Gemma comparte base tecnológica con Gemini, pero está diseñada para que desarrolladores y empresas puedan ejecutarla localmente, afinarla y desplegarla en móviles, portátiles y otros dispositivos. Esa capacidad de correr directamente en el hardware de usuario es la que aprovecha Eloquent para su modo offline.

Junto al procesamiento local, la app incluye un modo “Cloud” que, si se activa, envía las transcripciones a modelos Gemini alojados en la nube para un refinado extra, especialmente en frases complejas o textos que requieren un acabado más fino. El resultado es un enfoque híbrido: el usuario decide si prioriza privacidad total y rapidez en el dispositivo, o una capa adicional de calidad apoyándose en la nube.

Privacidad, diccionario personalizado e integración con Gmail y Workspace

Uno de los mensajes que Google destaca con Eloquent es que, cuando se usa el modo local, el audio y el texto no salen del dispositivo. Al no depender de servidores remotos para el reconocimiento de voz básico, se minimiza el envío de información sensible y se refuerza la sensación de control sobre los datos personales.

La aplicación incorpora también un diccionario de contexto personalizable. El usuario puede añadir manualmente términos técnicos, nombres propios o jerga específica para mejorar la precisión de las transcripciones, algo muy útil en ámbitos como sanidad, derecho, tecnología o cualquier sector con vocabulario poco común.

Además, Eloquent ofrece la posibilidad (opcional) de importar palabras y nombres desde la cuenta de Gmail o desde el entorno Workspace. Si se activa esta función, la IA tiene en cuenta los contactos, proyectos y términos habituales del usuario para entender mejor lo que dicta y escribirlo correctamente a la primera.

Google insiste en que esta integración es configurable y que el usuario puede decidir si concede o no esos permisos. La combinación de procesamiento local y ajustes de contexto apunta a un equilibrio entre privacidad, personalización y comodidad, aspectos cada vez más revisados por reguladores y usuarios en Europa.

Historial, métricas y enfoque en productividad diaria

Más allá del dictado puntual, Google AI Edge Eloquent incluye funciones orientadas a un uso continuado. La app mantiene un historial de sesiones de transcripción que permite volver a textos antiguos, buscar información dentro de dictados anteriores y reutilizar contenido sin tener que repetir grabaciones.

También muestra algunas métricas sobre la actividad, como la velocidad en palabras por minuto, el recuento total de palabras dictadas o el volumen de texto producido en sesiones recientes. Estas estadísticas pueden ayudar a quienes usan la voz como principal herramienta de redacción a entender sus hábitos y ritmo de trabajo.

Este planteamiento convierte a Eloquent en algo más que un teclado de dictado: se acerca a una plataforma de escritura por voz con funciones de archivo, seguimiento y revisión que encajan bien en flujos de trabajo intensivos, tanto personales como profesionales.

En el nicho de la productividad, Google sitúa la app frente a alternativas como Wispr Flow, SuperWhisper o Willow, que también han ido ganando tracción gracias a la mejora de los sistemas de voz a texto, pero que en muchos casos dependen por completo del procesamiento en la nube.

Disponibilidad, idioma y situación en España y el resto de Europa

Por el momento, Google AI Edge Eloquent se puede descargar de forma gratuita en la App Store de Apple y no requiere suscripción ni planes de pago. Eso sí, la versión actual está enfocada al idioma inglés, lo que limita de entrada su adopción generalizada entre usuarios hispanohablantes.

En el caso concreto de España y el Espacio Económico Europeo, la aplicación se enfrenta a restricciones adicionales. Google ha indicado que tanto Eloquent como la app AI Edge Gallery se encuentran actualmente limitadas en territorios como Reino Unido, Suiza y el propio EEE debido a requisitos de aprobación regulatoria.

La compañía señala que está trabajando para obtener las autorizaciones necesarias y poder ampliar el lanzamiento a estas regiones, aunque no ha dado fechas concretas. Este tipo de frenos regulatorios es cada vez más habitual en Europa cuando se trata de servicios basados en IA que manejan datos de voz y texto potencialmente sensibles.

Mientras tanto, los usuarios europeos interesados en este tipo de soluciones siguen recurriendo a otras herramientas disponibles en el mercado, a la espera de que Google desbloquee oficialmente la descarga en la región y, previsiblemente, amplíe también el soporte a más idiomas, incluido el español.

Relación con AI Edge Gallery y el ecosistema de modelos Gemma

Junto a Eloquent, Google ofrece en la App Store otra aplicación llamada AI Edge Gallery, pensada más como entorno de pruebas que como herramienta de uso diario. Esta segunda app permite ejecutar en el dispositivo distintas variantes de los modelos Gemma, incluidos los más recientes Gemma 3n y Gemma 4, orientados a desarrolladores y perfiles técnicos.

AI Edge Gallery incorpora funciones como AI Chat & Thinking, un laboratorio de prompts y herramientas de benchmarking para comparar el rendimiento de modelos de “pesos abiertos” en el hardware del usuario. No está dirigida específicamente al dictado, pero sí muestra hasta qué punto Google quiere acercar la IA avanzada al borde, es decir, a móviles y equipos locales.

Gemma 4, por ejemplo, se ha lanzado como una familia de modelos abiertos con tamaños optimizados tanto para teléfonos móviles como para ordenadores de sobremesa, y con ventanas de contexto amplias que permiten manejar grandes volúmenes de texto. Eloquent se apoya en esta misma filosofía de IA ejecutada en el dispositivo, llevada a un uso mucho más cotidiano.

Para el usuario final, la existencia de AI Edge Gallery es una pista de por dónde puede ir el futuro del ecosistema: más funciones de IA directa en el móvil, menos dependencia del servidor y, en el caso del dictado, un salto cualitativo en la calidad del texto generado a partir de la voz.

Planes para Android e impacto en el mercado de dictado por voz

Aunque de momento Eloquent se ha estrenado solo en iOS, en la propia descripción de la app se hace referencia a una futura versión para Android. Google sugiere que, cuando llegue, podría integrarse de forma más profunda en el sistema operativo, llegando incluso a configurarse como teclado predeterminado para dictar en cualquier campo de texto.

Se ha mencionado también la posibilidad de incorporar un botón flotante similar al de algunas apps de la competencia en Android, lo que permitiría iniciar una transcripción desde cualquier pantalla del dispositivo sin tener que abrir manualmente la aplicación cada vez.

Si ese tipo de integración se consolida, el impacto en el mercado de dictado podría ser notable. Una solución gratuita, con IA local y firmada por Google, pondría presión sobre servicios de pago como Wispr Flow o SuperWhisper, que tendrían que diferenciarse aún más en precisión, funciones extra o nichos muy concretos.

En paralelo, la combinación de modelos Gemma para el dispositivo y Gemini en la nube apunta a una estrategia más amplia por parte de Google: llevar capacidades avanzadas de IA a la experiencia diaria del móvil, con la posibilidad de que ciertas funciones de transcripción mejorada terminen integrándose directamente en Android en el futuro.

La aparición de Google AI Edge Eloquent encaja en una tendencia clara: cada vez más usuarios y profesionales quieren convertir su voz en textos listos para usar, sin depender siempre de la nube y sin pasarse luego media hora corrigiendo. Con una app gratuita, centrada en la ejecución local y con opciones avanzadas de limpieza y formato, Google se posiciona en un segmento de dictado por voz que está ganando fuerza tanto en Europa como en el resto del mundo, a la espera de que las restricciones regulatorias y de idioma se vayan despejando para que herramientas de este tipo sean realmente accesibles al gran público.