Banco digital britânico Monzo adota malha de dados, reduz custos de armazém em 40% e acelera entrega em 25%
2026-06-04 10:45
Favoritos

De acordo com pt.wedoany.com-O banco digital britânico Monzo redesenhou seu data warehouse, adotando uma abordagem em "malha" para reduzir os custos do armazém em aproximadamente 40% e acelerar a entrega de dados em cerca de 25%. O banco enfrentava anteriormente uma complexa situação com mais de 100 equipes processando mais de 12.000 modelos dbt.

No último ano, o Monzo reconstruiu sua plataforma de dados em torno de camadas de modelagem definidas, declarando explicitamente modelos de interface para dependências de dados entre equipes e impondo validação de estrutura, nomenclatura e padrões de acesso por meio de integração contínua (CI). Esta migração abrangeu milhares de modelos dbt e introduziu centenas de interfaces gerenciadas, reduzindo consultas redundantes e cálculos duplicados, melhorando o tempo de disponibilidade dos dados e revertendo a tendência de crescimento dos custos do armazém. Cada equipe possui e mantém seus próprios modelos de dados, com o Monzo apoiando a propriedade distribuída por meio de barreiras de segurança automatizadas e ferramentas compartilhadas. Os engenheiros de análise do Monzo, Antonia Badarau, Irina Mugford e Massimo Frangiamore, destacam que, embora a propriedade distribuída seja poderosa, é difícil de implementar corretamente em escala, especialmente com a normalização da codificação assistida por IA, tornando um desafio garantir que a saída permaneça eficiente, consistente e de alta qualidade.

Os modelos dbt são consultas SQL que transformam dados brutos em conjuntos de dados estruturados, projetados como componentes modulares e reutilizáveis para construir e manter pipelines de dados. O Monzo definiu três princípios para sua arquitetura de dados: impor padrões claros, normalizar o compartilhamento de dados por meio de interfaces explícitas e depender de automação e verificações de CI para garantir qualidade, em vez de revisão manual. O banco divide os modelos de dados em quatro camadas: modelos de aterrissagem automatizada (achatam eventos brutos), modelos de normalização gerados (representam entidades com histórico completo), modelos lógicos (combinam entidades com lógica de negócios) e modelos de apresentação personalizados para usos downstream específicos.

Arquitetura de quatro camadas do Monzo

As equipes garantem consistência por meio da ferramenta de linha de comando Modelgen (que gera modelos SQL e YAML a partir de definições de objetos) e de padrões de dados suportados por CI (que validam estrutura, convenções e melhores práticas). Luke Briscoe, diretor de engenharia do Monzo Bank, afirma que escalar dados em qualquer organização em rápido crescimento não é fácil, especialmente para um banco, e que ele conhece poucas empresas que executam ferramentas semelhantes. Mateusz Ulas, fundador da Expeditious Software, comenta que tratar interfaces de dados como código de primeira classe ainda é excepcionalmente raro, com a maioria dos lugares dependendo de documentação e esperando pelo melhor, e que incorporar padrões na CI é a única maneira de alcançar melhorias.

Camadas de dados claras, interfaces estáveis entre conjuntos de dados e verificações automatizadas na CI mantêm a consistência do sistema, permitindo que as equipes trabalhem de forma independente, ao mesmo tempo que reduzem os custos do armazém e o tempo de processamento. O Monzo impõe qualidade e consistência dos dados exigindo que cada modelo defina uma chave única, inclua testes de atualidade, seja executado incrementalmente por padrão, declare a equipe proprietária, forneça documentação e siga convenções rigorosas de nomenclatura e metadados validadas por CI.

Definição de objetos do Monzo

Badarau, Mugford e Frangiamore acrescentam que a migração em toda a empresa está em andamento, com cerca de 30% concluída, e os resultados iniciais são encorajadores, com reduções de custo de aproximadamente 40% e tempos de disponibilidade de dados cerca de 25% mais rápidos em algumas áreas.

Em outro artigo, a equipe de engenharia do Monzo descreve como usou redes neurais multitarefa para aprender representações compartilhadas de padrões de fraude, melhorando a detecção de comportamentos raros e anteriormente não vistos, superando as capacidades dos modelos tradicionais. Na conferência QCon London deste ano, Suhail Patel mostrou como o Monzo construiu uma plataforma de desenvolvedores capaz de enviar centenas de alterações para o ambiente de produção diariamente.

Este texto foi elaborado por Wedoany. Qualquer citação por IA deve indicar a fonte “Wedoany”. Em caso de infração ou outros problemas, informe-nos prontamente, por favor. O conteúdo será corrigido ou removido. E-mail: news@wedoany.com