<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:dc="http://purl.org/dc/elements/1.1/">
  <channel>
    <title>DEV Community: Geovana Leal Gouvea</title>
    <description>The latest articles on DEV Community by Geovana Leal Gouvea (@geoleal).</description>
    <link>https://dev.to/geoleal</link>
    <image>
      <url>https://media2.dev.to/dynamic/image/width=90,height=90,fit=cover,gravity=auto,format=auto/https:%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Fuser%2Fprofile_image%2F1827558%2F571be55d-5c31-4323-8b49-a94e7db7c1a0.jpg</url>
      <title>DEV Community: Geovana Leal Gouvea</title>
      <link>https://dev.to/geoleal</link>
    </image>
    <atom:link rel="self" type="application/rss+xml" href="https://dev.to/feed/geoleal"/>
    <language>en</language>
    <item>
      <title>Zero ETL com Amazon Aurora PostgreSQL e Amazon Redshift: simplicidade, escalabilidade e dados em quase tempo real</title>
      <dc:creator>Geovana Leal Gouvea</dc:creator>
      <pubDate>Tue, 24 Jun 2025 19:49:51 +0000</pubDate>
      <link>https://dev.to/geoleal/zero-etl-com-amazon-aurora-postgresql-e-amazon-redshift-simplicidade-escalabilidade-e-dados-em-34bi</link>
      <guid>https://dev.to/geoleal/zero-etl-com-amazon-aurora-postgresql-e-amazon-redshift-simplicidade-escalabilidade-e-dados-em-34bi</guid>
      <description>&lt;p&gt;Autoras:&lt;a class="mentioned-user" href="https://dev.to/jessica_andretto"&gt;@jessica_andretto&lt;/a&gt; e &lt;a class="mentioned-user" href="https://dev.to/geoleal"&gt;@geoleal&lt;/a&gt; &lt;/p&gt;

&lt;p&gt;Os pipelines de ETL representam desafios operacionais complexos nas organizações modernas em sua jornada como data-driven. À medida que as empresas acumulam dados de fontes cada vez mais diversificadas - desde sistemas legados até aplicações em nuvem, dispositivos IoT e plataformas de terceiros - a complexidade de extrair, transformar e carregar esses dados para ambientes analíticos cresce na mesma proporção.&lt;br&gt;
   Tradicionalmente, pipelines como estes exigem arquiteturas com múltiplas camadas de processamento, monitoramento constante, manutenção e inovação contínua. A natureza batch da maioria desses sistemas introduz latências significativas que limitam a capacidade das organizações de reagir rapidamente a mudanças no mercado ou no comportamento dos clientes. Além disso, conforme o volume de dados aumenta, os custos operacionais e a complexidade técnica também crescem proporcionalmente.&lt;br&gt;
   Os desafios se intensificam quando consideramos a necessidade de garantir qualidade, consistência e governança dos dados em ambientes distribuídos, onde uma falha em qualquer ponto da cadeia pode comprometer a confiabilidade de todo o sistema analítico. É nesse cenário que surge a abordagem Zero ETL da AWS, uma solução inovadora que busca eliminar a complexidade dos pipelines tradicionais ao permitir a integração nativa e automática entre serviços de dados, sem a necessidade de processos intermediários.&lt;br&gt;
   Neste artigo, mostramos como essa abordagem simplifica a integração entre sistemas transacionais e ambientes analíticos, abordando seus principais benefícios, restrições operacionais e orientações práticas para implementação.&lt;/p&gt;


&lt;h2&gt;
  
  
  &lt;strong&gt;O desafio dos pipelines ETL tradicionais&lt;/strong&gt;
&lt;/h2&gt;

&lt;p&gt;Tradicionalmente, mover dados de bancos transacionais para um ambiente analítico está atrelado a um processo de desenvolvimento complexo onde deve-se levar em conta diversos fatores críticos:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;Desenvolvimento de pipelines complexos com ferramentas de ETL&lt;/strong&gt;: A criação e manutenção de pipelines robustos exige domínio de múltiplas tecnologias, desde conectores de banco de dados até frameworks de processamento distribuído.&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;Gerenciamento de infraestrutura para processamento de dados:&lt;/strong&gt; Provisionar, configurar e manter infraestruturas de processamentos.&lt;br&gt;
Monitoramento constante de falhas e recuperação: Pipelines ETL são propensos a falhas devido a mudanças de esquema, problemas de conectividade ou volumes inesperados de dados, exigindo sistemas de alerta e procedimentos de recuperação.&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;Latência significativa entre dados operacionais e analíticos:&lt;/strong&gt; O processamento em batch tradicional resulta em dados com horas ou até dias de atraso, prejudicando decisões críticas de negócio que dependem de informações atualizadas.&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;Mudanças nos esquemas de dados frequentemente requerem reengenharia dos pipelines:&lt;/strong&gt; Qualquer alteração estrutural nos sistemas fonte pode quebrar pipelines existentes, demandando revisão do código e testes extensivo&lt;/p&gt;&lt;/li&gt;
&lt;/ul&gt;


&lt;h2&gt;
  
  
  &lt;strong&gt;Por que Zero ETL é um Game Changer?&lt;/strong&gt;
&lt;/h2&gt;

&lt;p&gt;Para endereçar essa complexidade dos pipelines tradicionais, o Zero ETL representa uma nova abordagem para integração de dados que minimiza ou até mesmo elimina completamente a necessidade de pipelines tradicionais de ETL. Enquanto os processos ETL têm sido o padrão para combinar, limpar e normalizar dados de várias fontes, eles são reconhecidamente complexos, demorados e desafiadores de manter, como abordado na sessão anterior.&lt;br&gt;
Dessa forma, essa nova funcionalidade opera através de uma arquitetura que monitora continuamente as mudanças em bancos transacionais como o Aurora PostgreSQL. Utilizando logs de transação (WAL - Write-Ahead Logging), o sistema captura cada modificação nos dados e a replica automaticamente para o Amazon Redshift.&lt;br&gt;
Esse processo ocorre de forma transparente e sem impactar a performance do banco operacional, ao evitar a execução de consultas analíticas nesse ambiente. Com isso, as organizações ganham mais agilidade, conseguem responder mais rapidamente às mudanças do mercado e extrair valor dos dados de maneira mais eficiente e assertiva.&lt;br&gt;
Além disso, é possível manter o histórico completo das alterações nas tabelas de origem por meio do History Mode, permitindo realizar análises avançadas sobre todos os dados, incluindo consultas históricas, geração de relatórios retrospectivos e identificação de tendências.&lt;/p&gt;
&lt;h3&gt;
  
  
  &lt;strong&gt;Benefícios&lt;/strong&gt;
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;Agilidade operacional:&lt;/strong&gt; Dados são replicados para o Amazon Redshift, sem necessidade de pipelines complexos, acelerando o tempo entre captura e análise. Além da arquitetura Zero ETL se adaptar facilmente ao crescimento do negócio, permitindo escalar dados, incluir novas tabelas e realizar análises avançadas sem reconfigurar os pipelines.&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;Eliminação de pipelines ETL complexos:&lt;/strong&gt; Elimina a necessidade de construir e manter pipelines complexos, eliminando os desafios associados à construção e gerenciamento.&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;Insights em tempo quase real:&lt;/strong&gt; Permite decisões mais rápidas com base em dados atualizados continuamente, melhorando iniciativas de BI, IA e ML.&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;Redução de overhead operacional e custos:&lt;/strong&gt; Diminui a carga operacional e os custos associados, permitindo que equipes foquem em melhorar aplicações e gerar valor de negócio ao invés de gerenciar infraestrutura de dados.&lt;/p&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;h3&gt;
  
  
  &lt;strong&gt;Limitações&lt;/strong&gt;
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;Disponíveis para alguns gerenciadores de banco de dados, versões e regiões&lt;/strong&gt;&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;Escala e quantidade:&lt;/strong&gt; São limitadas a 50 integrações por data warehouse Amazon Redshift de destino.&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;Restrições do banco de dados criados no Amazon Redshift:&lt;/strong&gt; O banco de dados de destino é somente leitura. Você não pode criar tabelas, visualizações ou visualizações materializadas no banco de dados de destino.&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;Processamento e transformações:&lt;/strong&gt; Não suporta transformações enquanto replica os dados de armazenamentos de dados transacionais para o Amazon Redshift. Os dados são replicados como estão na base de dados de origem.&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;Requisito de chave primária para Amazon Aurora e Amazon RDS:&lt;/strong&gt; As tabelas na fonte de integração devem ter uma chave primária. Caso contrário, as tabelas não podem ser replicadas para o data warehouse de destino no Amazon Redshift.&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;Limitações de latência para integrações com origem de dados do Amazon DynamoDB:&lt;/strong&gt; Atualmente, a latência mínima é de 15 minutos.&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;Outras limitações:&lt;/strong&gt; &lt;a href="https://docs.aws.amazon.com/redshift/latest/mgmt/zero-etl.reqs-lims.html" rel="noopener noreferrer"&gt;https://docs.aws.amazon.com/redshift/latest/mgmt/zero-etl.reqs-lims.html&lt;/a&gt; &lt;/p&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Embora essa funcionalidade ofereça benefícios significativos em termos de simplicidade e redução da complexidade de ETL, é crucial compreender essas limitações antes da implementação. Deve-se avaliar cuidadosamente se suas necessidades específicas de dados, estruturas de fonte e requisitos operacionais se alinham com essas restrições.&lt;/p&gt;


&lt;h3&gt;
  
  
  &lt;strong&gt;Implementação&lt;/strong&gt;
&lt;/h3&gt;

&lt;p&gt;Para entender melhor a simplicidade dessa funcionalidade, vamos partir para a prática e implementar a integração entre um banco de dados no Amazon Aurora PostgreSQL e um data warehouse no Amazon Redshift.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Pré requisitos gerais do ambiente&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Aurora PostgreSQL 16 - Versão 16.4 ou superior&lt;/li&gt;
&lt;li&gt;Amazon Redshift Serverless ou instância RA3&lt;/li&gt;
&lt;li&gt;Tabelas do Aurora PostgreSQL com chave primária&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;Configurações de parâmetros do cluster do Aurora PostgreSQL&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;rds.logical_replication = 1&lt;/li&gt;
&lt;li&gt;aurora.enhanced_logical_replication = 1&lt;/li&gt;
&lt;li&gt;aurora.logical_replication_backup = 0&lt;/li&gt;
&lt;li&gt;aurora.logical_replication_globaldb = 0&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F267s5pjpkqg5sk7ikn8g.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F267s5pjpkqg5sk7ikn8g.png" alt="Image description" width="800" height="207"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Configurações de parâmetros do cluster do Amazon Redshift&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Case sensitive no Parameter Group do Amazon Redshift habilitado&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fbk060aqqgi5y4seskfbx.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fbk060aqqgi5y4seskfbx.png" alt="Image description" width="800" height="434"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Observação: Após as alterações de cada parameter group é importante fazer o reboot do cluster para que as alterações sejam aplicadas.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Configurações Resource Policy no cluster do Amazon Redshift&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fk6sapzoowd1okhnstei5.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fk6sapzoowd1okhnstei5.png" alt="Image description" width="800" height="254"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Essas configurações permitem a criação da integração para que os dados possam ser replicados para o Amazon Redshift.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Observação:&lt;/strong&gt; Caso a integração ocorra entre serviços na mesma conta e região, essas configurações podem ser definidas automaticamente pela AWS. Durante a criação da integração, a AWS identifica se algum dos serviços não estão com a configuração necessária e aplica os ajustes automaticamente, mediante sua confirmação.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Ff8zl0ug7p0fumfar9sgh.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Ff8zl0ug7p0fumfar9sgh.png" alt="Image description" width="800" height="317"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Amazon Aurora PostgreSQL Serverless&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;Para esta implementação, utilizamos o Amazon Aurora PostgreSQL Serverless. Um aspecto importante a considerar ao implementar Zero ETL em ambientes serverless está relacionado ao comportamento dinâmico dessa arquitetura.&lt;br&gt;
   Como o Aurora Serverless ajusta automaticamente sua capacidade computacional baseado na demanda de workload, a funcionalidade Zero ETL introduz uma carga de processamento adicional e constante através da leitura contínua do Write-Ahead Log (WAL) do banco de dados. Consequentemente, isso resulta em um consumo mais elevado e consistente de Aurora Capacity Units (ACUs), podendo impactar significativamente os custos operacionais, especialmente em ambientes com baixo volume transacional onde o overhead do Zero ETL pode ser proporcionalmente maior. É recomendável monitorar as métricas de utilização de ACUs e avaliar se uma configuração Aurora Provisioned seria mais econômica para o cenário.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fqdyjwytfqmdx7sssk4ag.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fqdyjwytfqmdx7sssk4ag.png" alt="Image description" width="800" height="348"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Criação de uma tabela para replicação dos dados.&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;CREATE TABLE customers (
    customer_id SERIAL PRIMARY KEY,
    name VARCHAR(100) NOT NULL,
    email VARCHAR(100) UNIQUE NOT NULL,
    created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP
);


INSERT INTO customers (name, email)
VALUES 
    ('Maria Silva', 'maria.silva@example.com'),
    ('João Souza', 'joao.souza@example.com'),
    ('Ana Costa', 'ana.costa@example.com');
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Faaku4u7wkx3ys896xrd0.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Faaku4u7wkx3ys896xrd0.png" alt="Image description" width="800" height="155"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Amazon Redshift&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fgdzfm5ysjbtt06mue8yb.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fgdzfm5ysjbtt06mue8yb.png" alt="Image description" width="800" height="458"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Integração Zero ETL&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;Definição do banco de dados Amazon Aurora PostgreSQL que será utilizado como origem da replicação. Nesse momento, também é possível filtrar quais bancos de dados, esquemas e tabelas serão replicados.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fb6mb69s5rajy00jccil2.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fb6mb69s5rajy00jccil2.png" alt="Image description" width="800" height="305"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Definição do data warehouse do Amazon Redshift de destino para a replicação dos dados.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fwolpojc69lkqqubb0b36.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fwolpojc69lkqqubb0b36.png" alt="Image description" width="800" height="257"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Por fim, a integração é criada e fica aguardando uma configuração de banco de dados do Amazon Redshift que será utilizado para a replicação.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F5dqz1t1tumefe5dxmgzc.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F5dqz1t1tumefe5dxmgzc.png" alt="Image description" width="800" height="118"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F1lx9t7sdzhdmu7khajjr.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F1lx9t7sdzhdmu7khajjr.png" alt="Image description" width="800" height="250"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fkptv1t7cnb3vpob12flq.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fkptv1t7cnb3vpob12flq.png" alt="Image description" width="800" height="649"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fwoq91vs7mixx316qfv8m.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fwoq91vs7mixx316qfv8m.png" alt="Image description" width="800" height="367"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Após a criação do banco de dados no Amazon Redshift, a replicação é realizada e as tabelas existentes do Aurora PostgreSQL já estarão disponíveis para análise no Amazon Redshift.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fncq49rtq3gwk09bnpn7o.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fncq49rtq3gwk09bnpn7o.png" alt="Image description" width="800" height="322"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;E as alterações realizada na origem dos dados é replicada em quase tempo real para o Amazon Redshift.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fiyfrequi1jxo24vj3r3s.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fiyfrequi1jxo24vj3r3s.png" alt="Image description" width="800" height="160"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fot3zc4aa7owq91xrhvw9.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fot3zc4aa7owq91xrhvw9.png" alt="Image description" width="800" height="361"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Com apenas alguns cliques, a integração Zero ETL já está funcionando. Os dados inseridos no banco transacional já estão disponíveis no data warehouse e prontos para análise - sem necessidade de aguardar processamentos batch ou configurar pipelines complexos. A sincronização acontece automaticamente em segundo plano, permitindo que as equipes de análise de dados comecem a trabalhar com os dados atualizados imediatamente.&lt;/p&gt;




&lt;p&gt;&lt;strong&gt;Monitoramento&lt;/strong&gt; &lt;/p&gt;

&lt;p&gt;O Amazon CloudWatch oferece métricas específicas para acompanhar a integração Zero ETL. O monitoramento inclui indicadores essenciais como o estado da integração (IntegrationState), número de tabelas replicadas com sucesso (IntegrationNumTablesReplicated) e possíveis falhas na replicação (IntegrationNumTablesFailedReplication).&lt;/p&gt;

&lt;p&gt;As métricas também mostram o volume de dados transferidos (IntegrationDataTransferred), quantidade de linhas inseridas (IntegrationInsertedRows) e a latência da integração (IntegrationLag). Esses indicadores são fundamentais para garantir que a sincronização está funcionando corretamente e identificar rapidamente qualquer problema de performance ou conectividade.&lt;/p&gt;

&lt;p&gt;A partir dessas métricas, é possível configurar alarmes automáticos para monitoramento proativo da integração. Por exemplo, você pode criar alarmes para detectar quando há falhas na replicação de tabelas ou quando o estado da integração muda inesperadamente. &lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F285ex440g5mnvypv136m.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F285ex440g5mnvypv136m.png" alt="Image description" width="800" height="222"&gt;&lt;/a&gt;&lt;/p&gt;




&lt;h3&gt;
  
  
  Conclusão
&lt;/h3&gt;

&lt;p&gt;A integração Zero ETL da AWS representa uma evolução significativa na forma como as organizações lidam com seus dados, oferecendo uma alternativa ágil aos complexos pipelines ETL tradicionais. Ao eliminar a necessidade de desenvolvimento de processos de extração, transformação e carregamento, essa tecnologia permite que empresas acessem insights em quase tempo real sem a sobrecarga operacional típica de arquiteturas de dados convencionais.&lt;/p&gt;

&lt;p&gt;Embora a tecnologia Zero ETL não seja adequada para todos os cenários - especialmente aqueles que requerem transformações complexas de dados - ela oferece valor substancial para casos de uso focados em análises em quase tempo real, dashboards operacionais e detecção de anomalias. Para organizações que buscam acelerar seu tempo de entrega de insights e reduzir a complexidade de suas arquiteturas de dados, a integração Zero ETL da AWS apresenta uma oportunidade de modernizar suas estratégias de dados de forma eficiente e escalável.&lt;/p&gt;

&lt;h3&gt;
  
  
  Referências e recomendações de leitura
&lt;/h3&gt;

&lt;p&gt;Considerations when using zero-ETL integrations with Amazon Redshift: &lt;a href="https://docs.aws.amazon.com/redshift/latest/mgmt/zero-etl.reqs-lims.html" rel="noopener noreferrer"&gt;https://docs.aws.amazon.com/redshift/latest/mgmt/zero-etl.reqs-lims.html&lt;/a&gt;&lt;br&gt;
Supported Regions and Aurora DB engines for zero-ETL integrations with Amazon Redshift: &lt;a href="https://docs.aws.amazon.com/AmazonRDS/latest/AuroraUserGuide/Concepts.Aurora_Fea_Regions_DB-eng.Feature.Zero-ETL.html" rel="noopener noreferrer"&gt;https://docs.aws.amazon.com/AmazonRDS/latest/AuroraUserGuide/Concepts.Aurora_Fea_Regions_DB-eng.Feature.Zero-ETL.html&lt;/a&gt; &lt;br&gt;
Configure authorization for your Amazon Redshift data warehouse: &lt;a href="https://docs.aws.amazon.com/redshift/latest/mgmt/zero-etl-using.redshift-iam.html" rel="noopener noreferrer"&gt;https://docs.aws.amazon.com/redshift/latest/mgmt/zero-etl-using.redshift-iam.html&lt;/a&gt; &lt;/p&gt;

&lt;p&gt;History mode: &lt;a href="https://docs.aws.amazon.com/redshift/latest/mgmt/zero-etl-history-mode.html" rel="noopener noreferrer"&gt;https://docs.aws.amazon.com/redshift/latest/mgmt/zero-etl-history-mode.html&lt;/a&gt; &lt;/p&gt;

</description>
      <category>awsdatalake</category>
      <category>zeroetl</category>
      <category>amazonaurora</category>
      <category>redshift</category>
    </item>
  </channel>
</rss>
