O Google Chrome está se transformando de um simples navegador em uma poderosa plataforma de Inteligência Artificial. Durante o Search Central Live Brasil 2026, Mari Viana, do time do Chrome, apresentou um conjunto de novas APIs de IA que rodam diretamente no dispositivo do usuário (on-device). A grande estrela é a Prompt API Multimodal, que permite que aplicações web recebam entradas de áudio e imagem, além de texto. Essas inovações, focadas em privacidade, performance e custo zero, prometem democratizar o acesso à IA e abrir um leque de novas possibilidades para desenvolvedores e usuários.
A IA do Lado do Cliente
A estratégia do Chrome com as novas APIs de IA é clara: levar o poder dos modelos de linguagem para o lado do cliente, processando as informações diretamente no navegador. Essa abordagem, chamada de on-device AI, contrasta com o modelo tradicional baseado em nuvem, onde os dados precisam ser enviados para um servidor externo para processamento.
“A ideia é democratizar um pouco mais o acesso da inteligência artificial tanto para os desenvolvedores quanto para os usuários”, afirmou Mari Viana.
As vantagens desse modelo são significativas:
- Privacidade: Os dados do usuário nunca saem do seu dispositivo, garantindo um nível de segurança e privacidade muito superior.
- Performance: A ausência de uma viagem de ida e volta para o servidor resulta em uma latência muito menor e respostas quase instantâneas.
- Custo Zero: Como o processamento utiliza os recursos locais do dispositivo, não há custos de inferência por chamada de API, tornando a tecnologia acessível para todos.
A Estrela do Show: Prompt API Multimodal
Enquanto a API de Prompt original já permitia o envio de solicitações de texto para o modelo Gemini Nano rodando no navegador, a nova versão multimodal expande radicalmente essa capacidade. Agora, as aplicações web podem aceitar entradas de áudio e imagem diretamente do dispositivo do usuário.
Casos de Uso da API Multimodal:
- Descrição de Imagens: Um usuário pode enviar uma foto e pedir à IA que a descreva, gere uma legenda otimizada para SEO ou sugira tags relevantes. Isso pode ser integrado a um CMS para automatizar a criação de atributos alt em imagens, por exemplo.
- Transcrição de Áudio: A API pode capturar áudio do microfone do usuário e transcrevê-lo em tempo real, criando legendas para vídeos, notas de reuniões ou comandos de voz para a aplicação.
- Busca Visual e por Voz: Abre a possibilidade de criar experiências de busca dentro de um site onde o usuário pode pesquisar usando uma imagem ou uma pergunta falada.
Atualmente, a Prompt API Multimodal está em Origin Trial, o que significa que os desenvolvedores precisam se inscrever para testá-la em produção, mas seu uso é gratuito.
Um Ecossistema de APIs de IA
Além da API Multimodal, Mari Viana apresentou um conjunto de outras APIs de IA, cada uma com um propósito específico, que rodam on-device:
- API de Resumo (Summarizer): Gera resumos de textos em diferentes formatos (lista, manchete) e comprimentos. Um parceiro do Google já utiliza a API para resumir avaliações de usuários sobre linhas de ônibus em seu site.
- API de Tradução e Detecção de Idioma: Permitem a tradução simultânea de textos, como em um chat de suporte, sem que os dados da conversa saiam do navegador. A API de detecção identifica o idioma e a de tradução realiza a conversão em tempo real.
- API de Escrita e Reescrita: Auxiliam o usuário a criar e refinar textos. É possível definir o tom (formal, casual) e o comprimento, além de reescrever trechos para melhorar a clareza ou ajustar o estilo. Um dos exemplos mostrados foi o uso da API para identificar comentários tóxicos e sugerir versões mais amigáveis.
A Web Mais Inteligente e Privada
O movimento do Chrome para integrar IA diretamente no navegador é um passo fundamental para o futuro da web. Ao focar em privacidade e performance, o Google não está apenas criando ferramentas poderosas para desenvolvedores, mas também construindo uma web mais inteligente e segura para os usuários. A Prompt API Multimodal e suas companheiras são apenas o começo de uma nova era de aplicações web que serão mais interativas, acessíveis e personalizadas, transformando a maneira como interagimos com a informação e os serviços online.
Perguntas frequentes
As APIs de IA do Chrome funcionam em todos os navegadores?
Não. Essas APIs são específicas do Chrome e navegadores baseados em Chromium. Outros navegadores podem implementar funcionalidades similares, mas não são compatíveis com essas APIs específicas do Google.
Preciso de uma chave de API para usar a Prompt API Multimodal?
Não. A Prompt API Multimodal roda on-device e é gratuita. Você só precisa se inscrever no Origin Trial para testá-la em produção.
Os dados do usuário são enviados para servidores do Google?
Não. Todas essas APIs rodam on-device, o que significa que os dados nunca saem do navegador do usuário. Isso garante privacidade completa.
Qual é o impacto dessas APIs para SEO?
O impacto é indireto, mas significativo. Essas APIs permitem criar experiências de usuário melhores (busca por voz/imagem, descrição automática de imagens), o que pode melhorar o engajamento e, indiretamente, o SEO.
Quando essas APIs estarão disponíveis para todos?
Estão em Origin Trial agora. O cronograma para disponibilidade geral dependerá do feedback dos desenvolvedores e da maturidade das APIs.



