Google, dos EUA, lança três modelos de imagem AI Nano Banana_Boletins

Google, dos EUA, lança três modelos de imagem AI Nano Banana

2026-06-11 14:11

Favoritos

De acordo com pt.wedoany.com-A Google lançou uma série de modelos de geração e edição de imagens AI chamados Nano Banana, construídos com base na arquitetura Gemini 3. O Nano Banana não é uma ferramenta de texto para imagem independente, mas sim um sistema de execução visual que trabalha em conjunto com o cérebro cognitivo subjacente do Gemini, capaz de transformar conjuntos de dados densos, kits de marca e layouts complexos em saída em nível de pixel.

Atualmente, a linha de produtos inclui três modelos:

Modelo	Nome Oficial	Velocidade	Melhor Uso
Nano Banana	Gemini 2.5 Flash Image	Rápido	Edição diária, geração básica
Nano Banana Pro	Gemini 3 Pro Image	Mais lento	Trabalho de marca, impressão, saída precisa
Nano Banana 2	Gemini 3.1 Flash Image	Mais rápido (3× Pro)	Iteração rápida, conteúdo social, modelos

O Nano Banana 2 não é uma versão inferior do Pro, mas sim uma ferramenta diferente construída para trabalhos diferentes — velocidade e quantidade vs. refinamento e precisão.

Os utilizadores podem aceder a estes modelos através das seguintes plataformas:

Plataforma	Conteúdo Disponível
Gemini App (iOS/Android/Web)	Acesso completo, incluindo nível gratuito — o ponto de partida mais simples
Google Search (Modo AI)	Geração rápida nos resultados de pesquisa
Google Lens	Criar imagens através da funcionalidade Lens Create
Google AI Studio	Testes para programadores e experimentação de prompts
Gemini API / Vertex AI	Implantação em produção, fluxos de trabalho em lote, controlo de governança
Google Slides ("Help me visualize")	Geração visual inline em apresentações de slides

O Nano Banana 2 e o Nano Banana Pro estão disponíveis gratuitamente através da aplicação Gemini, mas o Pro tem um limite de geração; ao atingir o limite, a aplicação volta automaticamente para o modelo base.

Em termos de especificações principais: O Nano Banana 2 (Gemini 3.1 Flash Image) gera cada imagem em 2 a 5 segundos, com resolução máxima de 4K (4096×4096), oferecendo opções nativas de 512px, 1K e 2K, suporta 15 proporções de aspeto (incluindo formatos extremos como 8:1 e 1:8), até 4 personagens numa série, até 14 referências de objetos num único prompt, limite de tokens de entrada de 131.072, limite de tokens de saída de 32.768, precisão de renderização de texto de aproximadamente 87%, funcionalidade de pesquisa na web em tempo real, e custo por imagem cerca de 75% mais barato que o Pro. O Nano Banana Pro (Gemini 3 Pro Image) gera cada imagem em aproximadamente 10 a 15 segundos, resolução nativa de 4K, proporções de aspeto padrão (1:1, 16:9, 9:16, 4:3, 3:4, 21:9, etc.), até 5 personagens, até 14 referências de objetos, limite de tokens de entrada de 65.536, limite de tokens de saída de 32.768, precisão de renderização de texto de aproximadamente 64%, também suporta pesquisa na web em tempo real e funcionalidade de bloqueio de estilo. Ambos os modelos partilham C2PA Content Credentials, marca d'água digital invisível SynthID, geração de texto multilíngue (mais de 10 idiomas), data de corte de conhecimento em janeiro de 2025, complementada por pesquisa em tempo real.

A Google forneceu cinco estruturas de prompt para obter os melhores resultados. Primeiro, texto para imagem (sem referência), fórmula: sujeito + ação + local/fundo + composição + estilo. Exemplo de prompt: "Um engenheiro de software exausto, com cerca de 30 anos, olheiras sob os olhos, sentado numa secretária desorganizada, rodeado de chávenas de café vazias. Ela está a olhar fixamente para um monitor que emite um brilho verde fraco. Plano médio de ângulo baixo. Tom cinematográfico, tons suaves de azul esverdeado, iluminação documental."

Segundo, geração multimodal (com imagem de referência), fórmula: imagem de referência + indicador de relação + novo cenário. Exemplo de prompt: "Usando a foto do produto anexada como objeto e o moodboard anexado como referência de estilo, coloque o produto num ambiente de café à beira-mar ensolarado. Mantenha as proporções do produto precisas. Foto de cena da vida real, qualidade de edição."

Terceiro, edição de imagem (conversacional), cinco verbos de edição principais: Adicionar (Add), Remover (Remove), Substituir (Replace), Alterar (Change), Fazer (Make). Dica profissional: diga sempre ao modelo o que manter e o que alterar; adicionar "mantenha o rosto e as roupas do sujeito completamente inalterados" reduz a deriva na saída.

Quarto, visualização de dados em tempo real. O Nano Banana 2 pode extrair informações em tempo real da web e visualizá-las. Exemplo de prompt: "Pesquise o índice de qualidade do ar de Londres hoje. Represente os dados como um painel de instrumentos limpo e ilustrado num modelo de UI de smartphone. Use um sistema de ícones simples — verde para bom, âmbar para moderado, vermelho para mau. Inclua nomes de distritos e carimbo de data/hora."

A funcionalidade de dados em tempo real é promissora, mas não infalível; sabe-se que datas e informações estatísticas podem ser desatualizadas; verifique antes de publicar.

Quinto, escreva prompts como um diretor criativo. Pode especificar opções de iluminação (luz de preenchimento suave, dramática, natural quente, produto limpo), linguagem de câmara e lente (por exemplo, "fotografado com Fujifilm X100V, ciência de cor natural"), atalhos de gradação de cor (nostálgico, cinematográfico emotivo, comercial limpo), dicas de materiais e texturas (por exemplo, "jaqueta jeans vintage oversized, índigo pré-lavado, marcas de tensão nas costuras").

Em termos de renderização de texto, a precisão de texto do Nano Banana 2 é atualmente uma das melhores entre todos os modelos de imagem AI. Para maximizar o efeito: use sempre aspas para o texto a ser renderizado; indique a fonte ou descrição; especifique a cor e a relação de tamanho; use o truque de prioridade de texto — primeiro peça ao Gemini para gerar uma cópia do texto e, em seguida, peça uma imagem que inclua essa cópia; especifique diretamente o idioma alvo para localização; não é recomendado confiar nele para gerar texto longo de corpo.

Referência rápida de proporções de aspeto: 1:1 para posts do Instagram, fotos de perfil; 16:9 para miniaturas do YouTube, apresentações; 9:16 para Reels, TikTok, Stories, anúncios móveis; 4:5 para feed do Instagram (melhor formato de interação); 21:9 para ecrã panorâmico de cinema, banners de herói de site; 8:1 (apenas Nano Banana 2) para cabeçalhos de site extra largos, banners de e-mail; 1:8 (apenas NB2) para materiais de aplicação móvel vertical, gráficos de barra lateral; 3:2 para padrão de fotografia de impressão; 4:3 para slides de apresentação.

Guia de seleção de modelo: Cenários para escolher Nano Banana 2 — iteração rápida, redes sociais, gráficos web, necessidade de texto legível (sua precisão de texto é superior ao Pro), sensibilidade a custos (75% mais barato), necessidade de proporções de aspeto extremas, construção em lote; Cenários para escolher Nano Banana Pro — impressão ou exibição de grande formato, cenas complexas com múltiplos sujeitos que exigem máximo realismo, consistência de marca importante em grandes volumes de imagens, fotografia de produto de alto nível, prompts longos e altamente específicos.

Falhas comuns e soluções: Fusão ou distorção de rostos (prompt de referência vago, adicione "mantenha cada pessoa visualmente distinta"); dedos a mais (regere ou corte a composição); deriva de estilo (inclua uma frase de estilo consistente no prompt ou faça referência a saídas anteriores); texto ilegível (use aspas, especifique a fonte, mantenha o texto curto); dados em tempo real desatualizados (verifique manualmente); saída ignora parte do prompt (divida em prompts sequenciais); imagem desfocada (adicione "foco nítido, alta definição"); proporção de aspeto volta ao padrão (indique a proporção no início do prompt).

Em relação a marcas d'água e deteção AI, cada imagem gerada pelo Nano Banana carrega duas camadas: SynthID — uma marca d'água digital invisível a nível de pixel, impercetível ao olho humano, mas legível por ferramentas de deteção; a funcionalidade de verificação SynthID na aplicação Gemini já foi usada mais de 20 milhões de vezes; C2PA Content Credentials — um padrão de metadados que regista como a imagem foi criada, incluindo a participação de AI; a funcionalidade de verificação está a ser lançada na aplicação Gemini. Isto significa que as imagens geradas por AI são tecnicamente identificáveis quando se usam as ferramentas corretas, mas as marcas d'água são invisíveis durante a navegação casual em redes sociais.

Os iniciadores de prompt de referência rápida incluem: prompt de modelo de produto, gráfico de redes sociais com texto, slide de infográfico, série de personagens consistente, restauração de fotos, materiais de marketing localizados, etc.

Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com

EUA