<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:dc="http://purl.org/dc/elements/1.1/">
  <channel>
    <title>DEV Community: rafaelbonilha</title>
    <description>The latest articles on DEV Community by rafaelbonilha (@rafaelbonilha).</description>
    <link>https://dev.to/rafaelbonilha</link>
    <image>
      <url>https://media2.dev.to/dynamic/image/width=90,height=90,fit=cover,gravity=auto,format=auto/https:%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Fuser%2Fprofile_image%2F1158370%2F400e2c09-d9c3-428b-a959-a608f9b49fdb.jpeg</url>
      <title>DEV Community: rafaelbonilha</title>
      <link>https://dev.to/rafaelbonilha</link>
    </image>
    <atom:link rel="self" type="application/rss+xml" href="https://dev.to/feed/rafaelbonilha"/>
    <language>en</language>
    <item>
      <title>Conhecendo o LLM Claude</title>
      <dc:creator>rafaelbonilha</dc:creator>
      <pubDate>Mon, 16 Mar 2026 18:21:38 +0000</pubDate>
      <link>https://dev.to/rafaelbonilha/conhecendo-o-llm-claude-520n</link>
      <guid>https://dev.to/rafaelbonilha/conhecendo-o-llm-claude-520n</guid>
      <description>&lt;p&gt;Um dos principais modelos de LLM (Linguagem de Grande Escala), o Claude foi desenvolvido pela &lt;strong&gt;Anthropic&lt;/strong&gt; seguindo princípios de ética e segurança em IA. Apoiada por diversos nomes de destaque da TI como o Google, ele possui diversos recursos semelhantes a outras ferramentas como o Gemini e o ChatGPT.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fus0l1kok8h1iahuk1owr.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fus0l1kok8h1iahuk1owr.png" alt=" " width="800" height="531"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Seu foco é em segurança em AI e desempenho, sendo que a atual versão, a Claude 3.5 se saí melhor que o ChatGPT-4 e o Gemini nos testes de desempenho. Fornecendo recursos como colaboração com usuários, o Claude inicialmente foi liberado como uma ferramenta Alpha para um número limitado de usuários selecionados em 2023.&lt;/p&gt;

&lt;p&gt;Em julho do mesmo ano a ferramenta foi lançada publicamente já como Claude 2. Em março de 2024 foi lançado o Claude 3 com correções em relação a versão anterior, permitindo que tivesse desempenho superior ao Claude 2 e a versão 4 do ChatGPT.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Características&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;O Claude possui diversos recursos, sendo destacados os seguintes.:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;Capacidade de geração&lt;/strong&gt;.: É possível editar, resumir e delinear conteúdos com o Claude, além de ele ser capaz de escrever código de programação usando diversas linguagens ( importante revisar após a escrita).&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;Análise de Imagens&lt;/strong&gt;.: Ao submeter imagens, o Claude pode descrever o conteúdo das imagens, além de interpretar para transcrição de notas ou extrair informações de imagens.&lt;/p&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fviuyj1p9doc1ez3ygx4r.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fviuyj1p9doc1ez3ygx4r.png" alt=" " width="800" height="450"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Conclusões&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;Claude possui diversos recursos e tem obtido bons desempenhos nos testes, mas por outro lado é uma ferramenta de IA nova no mercado, onde não possui tanta robutez e recursos para atender uma gama grande de tópicos em comparação com seus rivais mais velhos com o Copilot, ChatGPT e Gemini.&lt;br&gt;
Claude LLM apresenta perspectivas promissoras para o futuro na área de pesquisa e desenvolvimento de IA. À medida que a tecnologia de IA avança, Claude pode ser ainda mais refinado e aprimorado para oferecer respostas ainda mais poderosas e precisas.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Referências.:&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;&lt;a href="https://textcortex.com/pt/post/how-to-use-claude-3" rel="noopener noreferrer"&gt;https://textcortex.com/pt/post/how-to-use-claude-3&lt;/a&gt;&lt;br&gt;
&lt;a href="https://aipure.ai/br/articles/how-to-use-claude-ai-unlock-advanced-ai-capabilities" rel="noopener noreferrer"&gt;https://aipure.ai/br/articles/how-to-use-claude-ai-unlock-advanced-ai-capabilities&lt;/a&gt;&lt;br&gt;
&lt;a href="https://support.claude.com/pt/" rel="noopener noreferrer"&gt;https://support.claude.com/pt/&lt;/a&gt;&lt;/p&gt;

</description>
      <category>llm</category>
      <category>ia</category>
      <category>cloudnative</category>
      <category>ai</category>
    </item>
    <item>
      <title>Os 4 Sinais Dourados da Google</title>
      <dc:creator>rafaelbonilha</dc:creator>
      <pubDate>Mon, 16 Feb 2026 15:58:05 +0000</pubDate>
      <link>https://dev.to/rafaelbonilha/os-4-sinais-dourados-da-google-206g</link>
      <guid>https://dev.to/rafaelbonilha/os-4-sinais-dourados-da-google-206g</guid>
      <description>&lt;p&gt;Neste artigo iremos abordar um dos maiores marcos para consolidar o SRE que são os 4 sinais dourados do Google, resultado da experiência em manter e escalar um dos ambientes mais desafiadores do mundo.&lt;br&gt;
Estes sinais fornecem insumos para monitoramento que se tornaram padrão na indústria e é amplamente estudado e utilizado para mensurar métricas de ambientes desafiadores em TI.&lt;/p&gt;

&lt;p&gt;Surgido da necessidade prática de monitorar vários serviços diferentes executando em escala global, o time de SRE do Google identificou que não importasse a complexidade do sistema, havia 4 métricas fundamentais &lt;br&gt;
que se monitoradas de forma adequada, forneciam uma visão do status do sistema do ponto de vista do usuário.&lt;/p&gt;

&lt;p&gt;Isso é absurdamente simples e poderoso.: focando em apenas 4 métricas que são importantes para o usuário, o time garante que está concentrado no que importa e diminui a complexidade, evitando gastar tempo e recursos com o monitoramento de várias métricas de forma desordenada ou sem uma estratégia definida.&lt;/p&gt;

&lt;p&gt;Resumindo da seguinte forma a abordagem dos 4 Goldens Signals.: se você só pode monitorar algumas métricas do sistema, concentre-se nas 4 voltadas ao usuário. Garantindo assim que o time está verificando aquilo que realmente impacta o usuário.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fa5rf4xufelcvpc1vj4u3.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fa5rf4xufelcvpc1vj4u3.png" alt=" " width="309" height="180"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Os 4 Sinais Dourados (Golden Signals)&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;Vamos agora abordar de forma mais detalhada os 4 Golden Signals para poder dessa forma ter o entendimento do porque essas métricas são importantes para a saúde do sistema.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;1. Latência.:&lt;/strong&gt;&lt;br&gt;
A latência mede o tempo que o sistema leva para atender um pedido/requisição e é a métrica mais facilmente notada pelos usuários. Mas para poder ter uma monitoração eficaz, é necessário entender&lt;br&gt;
os detalhes que podem ser ignorados, gerando uma métrica imcompleta em uma abordagem simples.&lt;br&gt;
Um exemplo.: deve-se verificar a diferença entre latência de requisições bem-sucedidas e a latência de requisições que falharam. Isto deve ser considerado pois podem ocorrer casos onde falhas são enviadas rapidamente como um erro http 500 de resposta de um servidor quase que imediatamente. &lt;br&gt;
Se você usar apenas a média de latência de todas as requisições, problemas de latência em solicitações bem-sucedidas podem ficar ocultas ou mascaradas.&lt;/p&gt;

&lt;p&gt;Lembrando que o tempo deve ser sempre considerado pois o usuário ficará mais incomodado com a demora em receber uma mensagem de erro do que receber a mensagem de erro imediatamente após fazer a solicitação.&lt;br&gt;
Usar percentis de 95 ou 99 da latência normalmente fornecem uma visão mais realista da experiência que a maioria dos usuários está tendo.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;2. Tráfego.:&lt;/strong&gt;&lt;br&gt;
O tráfego é uma métrica que mede quanta demanda está sendo suportada pelo sistema e normalmente&lt;br&gt;
é medida em dados específicos de cada sistema, por exemplo em um sistema web, usa-se solicitações http por segundo, divididas por seu tipo. Monitorar o tráfego pode trazer informações importantes sobre possíveis problemas que estão começando, como ataques DDoS ou uma instabilidade pode indicar um problema de upstream, impedindo os usuários de usarem o serviço.&lt;br&gt;
O segredo aqui para medir de forma eficaz o tráfego do seu sistema é escolher a métrica que melhor representa a carga que os usuários estão colocando sobre o sistema.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;3. Erros.:&lt;/strong&gt;&lt;br&gt;
Erros é comumente uma das métricas mais importantes e medidas, mas normalmente a métrica de erro se baseia na quantidade de requisições que falham. Mas o ponto de atenção aqui é justamente o que é a &lt;br&gt;
definição de falha aplicada no sistema que está sendo monitorado. Vamos entender melhor isso.: falha pode ser tanto algo facilmente percebível como um erro http 502 ou algo mais sutil, como uma resposta http 200&lt;br&gt;
mas com o conteúdo errado ou mesmo uma falha definida por base em políticas de desempenho como um erro http 429 de rate limit, onde excedeu o limite de conexões acordado.&lt;/p&gt;

&lt;p&gt;Erros explícitos, como código de status http são mais fáceis de mensurar por fornecerem informações claras do que está acontecendo de errado. Erros implícitos requerem mais cuidado por serem mais difíceis de detectar, tornando a experiência de uso do usuário ruim. Um caso comum de erro implícito é o serviço retornar um código http 200 mas com dados corrompidos ou faltando, gerando a necessidade de investigar de forma mais detalhada.&lt;/p&gt;

&lt;p&gt;Erros definidos com base em políticas são reflexos do que foi acordado via SLA ou outros tipos de acordos, por exemplo, se foi definido um tempo x de resposta para uma solicitação e o sistem leva mais do que esse tempo para responder, mesmo sendo uma resposta bem-sucedida, é considerado um erro por não estar cumprindo o tempo determinado pelo acordo/requisito.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;4. Saturação.:&lt;/strong&gt;&lt;br&gt;
A saturação é a métrica que verifica o quanto o sistema está carregado, detalhando os recursos mais utilizados, é a métrica mais complexa de ser implementada por que necessita de um entendimento profundo&lt;br&gt;
dos ofensores do sistema. Em muitos sistemas, a performance começa a cair antes de atingir o 100% de uso de um determinado recurso. Por exemplo, um servidor pode começar a apresentar lentidão com o consumo de 75% da memória, muito antes de atingir os 100%. Então ter alvos de utilização definidos de forma apropriada é de suma importância para uma correta definição da métrica de saturação.&lt;/p&gt;

&lt;p&gt;Sistemas complexos a saturação deve vir acompanhada de métricas de carga de nível superior, onde perguntas sobre níveis de sobrecarga que o sistema pode suportar antes de começar a perder performance ajudam a &lt;br&gt;
fornecer insumos sobre o quanto o sistema aguenta picos de utilização. &lt;br&gt;
Adicionar previsões de saturação é uma forma de monitorar de maneira proativa o sistema, garantindo aos times tempo para tomar ações para mitigar problemas antes que eles comecem de fato. Um exemplo.: métricas de alerta de consumo de espaço em disco ajudam a tomar medidas preventivas antes que os discos fiquem de fato cheios.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Considerações e Limitações dos 4 Golden Signals&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;Os 4 sinais dourados (Golden Signals) são um excelente ponto de partida para construir uma base sólida e confiável de observabilidade de um sistema com sua simplicidade, foco no usuário e que são úteis para a grande maioria dos sistemas. Isso permite que sejam implementados por times com diversos níveis de experiência em monitoramento.&lt;br&gt;
Contudo, os 4 Golden Signals tem seus limites, por ter o foco no usuário, eles podem não ser adequados para sistemas de infraestrutura ou de processamento em lotes (batch). &lt;br&gt;
Também é altamente recomendável que sejam usados com métricas mais específicas e detalhadas para os sistemas, especialmente os complexos.&lt;br&gt;
Tenha em mente que eles são o início, não devendo ser considerados como as únicas métricas que devem ser implementadas e monitoradas.&lt;br&gt;
Os 4 Sinais Dourados tem também sua importância na consolidação da disciplina de SRE dentro das empresas pelo seu impacto na Observabilidade e Monitoramento.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Referências.:&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;&lt;a href="https://www.thetrueengineer.com/p/the-four-golden-signals-what-google" rel="noopener noreferrer"&gt;https://www.thetrueengineer.com/p/the-four-golden-signals-what-google&lt;/a&gt;&lt;br&gt;
&lt;a href="https://www.solarwinds.com/sre-best-practices/golden-signals" rel="noopener noreferrer"&gt;https://www.solarwinds.com/sre-best-practices/golden-signals&lt;/a&gt;&lt;br&gt;
&lt;a href="https://sre.google/sre-book/introduction/" rel="noopener noreferrer"&gt;https://sre.google/sre-book/introduction/&lt;/a&gt;&lt;br&gt;
&lt;a href="https://www.opservices.com.br/4-sinais-de-ouro-do-sre/" rel="noopener noreferrer"&gt;https://www.opservices.com.br/4-sinais-de-ouro-do-sre/&lt;/a&gt;&lt;br&gt;
&lt;a href="https://github.com/cirolini/prometheus-curso-monitoring/blob/main/09_conclusion/01_modelos_de_monitoracao.md" rel="noopener noreferrer"&gt;https://github.com/cirolini/prometheus-curso-monitoring/blob/main/09_conclusion/01_modelos_de_monitoracao.md&lt;/a&gt;&lt;br&gt;
E-book Ós Métodos Red, Use e os 4 Golden Signals para Observabilidade - Jeferson Fernando - LinuxTips&lt;/p&gt;

</description>
      <category>sre</category>
      <category>observability</category>
      <category>infrastructure</category>
      <category>cloud</category>
    </item>
    <item>
      <title>ActivityPub: Protocolo para Redes Descentralizadas</title>
      <dc:creator>rafaelbonilha</dc:creator>
      <pubDate>Sat, 17 Jan 2026 20:14:02 +0000</pubDate>
      <link>https://dev.to/rafaelbonilha/activitypub-protocolo-para-redes-descentralizadas-425e</link>
      <guid>https://dev.to/rafaelbonilha/activitypub-protocolo-para-redes-descentralizadas-425e</guid>
      <description>&lt;p&gt;Para começar o ano, vamos falar sobre um importante protocolo utilizado em redes descentralizadas, o ActivityPub.&lt;br&gt;
Ele é um componente importante do chamado Fediverso, conjunto de recursos 'federados' (descentralizados) para compartilhar informações e recursos entre os usuários.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fl14z0l7iwrmwtwwq71mr.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fl14z0l7iwrmwtwwq71mr.png" alt=" " width="500" height="130"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;O ActivityPub é um protocolo criado em 2018 pelo World Wide Web Consortium (W3C), consórcio internacional responsável pelos padrões de criação e interpretação de interfaces na internet.&lt;br&gt;
Isso foi feito para permitir a comunicação entre as redes sociais abertas e descentralizadas sem que uma grande empresa controle o sistema de forma centralizada e única.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Do que é feito o ActivityPub?&lt;/strong&gt;&lt;br&gt;
O ActivityPub possui dois componentes: Caixa de Entrada e Caixa de Saída, que são endpoints de API que podem ser acessados usando o protocolo HTTP/HTTPS.&lt;br&gt;&lt;br&gt;
Para garantir a privacidade, a localização de ambas as caixas só podem ser recuperadas através do uso do protocolo WebFinger. E para testar os recursos do ActivityPub, basta usar a ferramenta ActivityPub Explorer. &lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Ftfv4h3h304ivcoi99qeb.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Ftfv4h3h304ivcoi99qeb.png" alt=" " width="761" height="333"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Aplicações para o ActivityPub&lt;/strong&gt;&lt;br&gt;
Apesar de ser usado em redes sociais, o ActivityPub tem compatibilidade com diversas aplicações que usam seu protocolo, como por exemplo plataformas de gerenciamento de conteúdo, assim como também ferramentas de colaboração como ferramentas de desenvolvimento colaborativo de software.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Considerações&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;O ActivityPub é um protocolo que já tem mais de 20 milhões de usuários e todo o suporte do W3C, trazendo respaldo para o seu contínuo desenvolvimento. Apesar de ainda possuir problemas técnicos e de design, seu nível de maturidade e desenvolvimento faz com que os problemas existentes sejam possíveis de contornar e com amplo apoio da comunidade.&lt;/p&gt;

&lt;p&gt;Além disso, o ActivityPub possui uma moderação consolidada e funcional, problema comum em outros protocolos utilizados em redes descentralizadas. &lt;br&gt;
Várias redes usam o ActivityPub como o Mastodon, o Organica entre outros, mas o mais importante é o fato do ActivityPub ser desde o começo um protocolo aberto e mantido pela comunidade, o que o torna uma das iniciativas mais interessantes existentes hoje para tornar as redes sociais melhores.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Referências.:&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;&lt;a href="https://activitypub.rocks/" rel="noopener noreferrer"&gt;https://activitypub.rocks/&lt;/a&gt;&lt;br&gt;
&lt;a href="https://pt.wikipedia.org/wiki/ActivityPub" rel="noopener noreferrer"&gt;https://pt.wikipedia.org/wiki/ActivityPub&lt;/a&gt;&lt;br&gt;
&lt;a href="https://elysiatools.com/pt/samples/activitypub" rel="noopener noreferrer"&gt;https://elysiatools.com/pt/samples/activitypub&lt;/a&gt;&lt;br&gt;
&lt;a href="https://canaltech.com.br/redes-sociais/o-que-e-activitypub/" rel="noopener noreferrer"&gt;https://canaltech.com.br/redes-sociais/o-que-e-activitypub/&lt;/a&gt;&lt;br&gt;
&lt;a href="https://medium.com/@campos.felps/construindo-um-servidor-activitypub-minimalista-em-python-695cde9a9965" rel="noopener noreferrer"&gt;https://medium.com/@campos.felps/construindo-um-servidor-activitypub-minimalista-em-python-695cde9a9965&lt;/a&gt;&lt;/p&gt;

</description>
      <category>web3</category>
      <category>fediverse</category>
      <category>cloud</category>
      <category>activitypub</category>
    </item>
    <item>
      <title>Método USE.: O que é e Como Usar</title>
      <dc:creator>rafaelbonilha</dc:creator>
      <pubDate>Fri, 12 Dec 2025 13:31:44 +0000</pubDate>
      <link>https://dev.to/rafaelbonilha/metodo-use-o-que-e-e-como-usar-39a1</link>
      <guid>https://dev.to/rafaelbonilha/metodo-use-o-que-e-e-como-usar-39a1</guid>
      <description>&lt;p&gt;Desenvolvido por Brendan Gregg, o método &lt;strong&gt;USE (Utilização, Saturação e Erros)&lt;/strong&gt; para auxiliar na resolução de problemas de performance em sistemas críticos e complexos. Ele foi pensado para auxiliar profissionais de TI a solucionar problemas comuns de desempenho de forma rápida, sem deixar de lado áreas importantes, sendo construída para ser simples, direta, completa e rápida. Segundo Brendan, o método USE pode ser resumido em.: Para cada recurso, verifique utilização, saturação e erros.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F2o8qqx07gq7zsag3zpsk.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F2o8qqx07gq7zsag3zpsk.png" alt=" " width="800" height="884"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  OS TRÊS PILARES DO MÉTODO USE
&lt;/h2&gt;

&lt;p&gt;A aplicação do método USE de forma efetiva começa com a criação de uma lista para o ambiente do sistema a ser verificado, onde nesta lista deve conter cada recurso considerado importante e as métricas específicas e ferramentas que serão usadas para medir a &lt;strong&gt;utilização&lt;/strong&gt;, &lt;strong&gt;saturação&lt;/strong&gt; e &lt;strong&gt;erros&lt;/strong&gt; deste recurso. O uso de diagrams de blocos funcionais também é recomendado para mostrar os componentes físicos e suas conexões, auxiliando na análise do sistema em busca de falhas ou gargalos. Estes 3 pilares.: Utilização, Saturação e Erros são a base do método USE para análise de problemas de performance em sistemas.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Utilização (Utilization)&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;Utilização é para medir o tempo médio que um recurso é utilizado para atender uma solicitação. Isso permite identificar o tamanho da utilização do recurso num determinado período de tempo. Não é um problema, pois diversos sistemas são projetados para usar o máximo dos &lt;br&gt;
recursos de forma a ganhar a eficiência. Mas utilização de 100% pode indicar de forma geral um gargalo, utilizações superiores a 70% por &lt;br&gt;
períodos longos podem indicar problemas em alguns recursos como discos e CPUs, onde podem ocorrer picos pequenos de 100% de utilização.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Saturação (Saturation)&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;aturação mede o grau que um recurso tem trabalho extra que não pode atender, medida normalmente em uma fila. Ela indica quando um sistema&lt;br&gt;
está perto de usar toda a sua capacidade ou mesmo excedendo essa capacidade para processar de forma eficiente. Ela é mais sensível em&lt;br&gt;
identificar problemas do que a utilização. Pois mesmo recurso tendo utilização moderada, pode apresentar saturação por carga indevidas&lt;br&gt;
de trabalho ou processamento incorreto de solicitações. A saturação é medida de formas diferentes de acordo com o tipo de recurso,&lt;br&gt;
como por exemplo fila de i/o para discos, fila de execução ou latência para cpus ou paginação e swap para memória.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Erros (Errors)&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;Em USE, erros são eventos de erros relacionados a hardware ou sistema operacional. Exemplos de erros em USE são setores defeituosos,&lt;br&gt;
timeouts de I/O, erros de rede, erros de memória e erros de CPU. Esses erros são importantes pois devem ser monitorados pelo seu impacto&lt;br&gt;
na performance do sistema mesmo em caso de falhas pequenas, mas que gera degradação do sistema em atender solicitações ou executar operações.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F9dpqe6f17xz334vl3jma.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F9dpqe6f17xz334vl3jma.png" alt=" " width="800" height="817"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;USE exige uma lista de recursos para examinar, em caso de servidores por exemplo uma lista inclui os seguintes recursos.:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;CPUs&lt;/li&gt;
&lt;li&gt;Memória &lt;/li&gt;
&lt;li&gt;Interfaces de Rede&lt;/li&gt;
&lt;li&gt;Discos &lt;/li&gt;
&lt;li&gt;Controladores&lt;/li&gt;
&lt;li&gt;Interconexões&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;Considerações para o uso do método USE&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;Ele oferece diversos benefícios, onde permite que recursos importantes não deixem de ser analisados durante uma análise de performance.&lt;br&gt;
USE é muito eficaz em identificar gargalos de recursos que não são óbvios ou estão escondidos em algumas métricas do sistema. Também o USE&lt;br&gt;
é extremamente útil em análise de causa raiz em problemas de performance que podem ter relação com recursos. E por fim, USE tem uma &lt;br&gt;
abordagem comum para discussão de problemas entre os times de diferentes áreas para melhoria de performance de sistemas.&lt;br&gt;
Por outro lado, USE tem foco em recursos de sistema, não podendo capturar problemas específicos de performance da aplicação, ela exige &lt;br&gt;
conhecimento significativo da arquitetura do sistema para ser aplicada de forma eficiente. Em alguns ambientes, algumas métricas de USE&lt;br&gt;
podem não ser obtidas ou dificilmente obtidas, isso particularmente em ambientes de nuvem com acesso restrito a métricas do hardware usado.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Referências.:&lt;/strong&gt; &lt;/p&gt;

&lt;p&gt;E-book Os Métodos RED e USE e os 4 Golden Signals para Observabilidade - Jeferson Fernando&lt;br&gt;
&lt;a href="https://www.brendangregg.com/usemethod.html" rel="noopener noreferrer"&gt;https://www.brendangregg.com/usemethod.html&lt;/a&gt;&lt;/p&gt;

</description>
      <category>infrastructure</category>
      <category>cloud</category>
      <category>architecture</category>
      <category>systemdesign</category>
    </item>
    <item>
      <title>Comandos Kubectl para Resolução de Problemas</title>
      <dc:creator>rafaelbonilha</dc:creator>
      <pubDate>Fri, 21 Nov 2025 14:42:56 +0000</pubDate>
      <link>https://dev.to/rafaelbonilha/comandos-kubectl-para-resolucao-de-problemas-1nbg</link>
      <guid>https://dev.to/rafaelbonilha/comandos-kubectl-para-resolucao-de-problemas-1nbg</guid>
      <description>&lt;p&gt;Vamos falar neste artigo de comandos que podem te ajudar a solucionar problemas no Kubernetes. Estamos considerando um cenário de falha em deploys de uma aplicação. Um cenário comum no dia a dia de um profissional DevOps/SRE/Engenheiro de Plataformas.&lt;br&gt;
Antes é necessário conhecer o que compõe um deployment no Kubernetes, para facilitar o entendimento do que será abordado logo mais.&lt;/p&gt;

&lt;h2&gt;
  
  
  Componentes Do Deployment
&lt;/h2&gt;

&lt;p&gt;&lt;strong&gt;Pod.:&lt;/strong&gt; Menor unidade gerenciada no Kubernetes, onde carrega os containeres com a aplicação.&lt;br&gt;
&lt;strong&gt;Deployments.:&lt;/strong&gt; Controlador responsável por gerenciar o pod ou pods da aplicação.&lt;br&gt;
&lt;strong&gt;Services.:&lt;/strong&gt; É a camada de abstração para definir políticas de exposição de um conjunto lógico de Pods.&lt;br&gt;
&lt;strong&gt;ConfigMaps e Secrets.:&lt;/strong&gt; São os locais onde ficam os dados de configuração e segurança da aplicação. Vamos agora aos problemas relacionados a Deploys no Kubernetes.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fjamj6y25z9zpzxln5xib.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fjamj6y25z9zpzxln5xib.png" alt=" " width="800" height="464"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  Pods Não Iniciam
&lt;/h2&gt;

&lt;p&gt;Por alguma razão, o pod não consegue ficar disponível, para entender o que está acontecendo, o ideal é identificar&lt;br&gt;
o que está acontecendo com ele.:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Status do Pod.:&lt;/strong&gt; Valide o status do Pod usando o comando &lt;code&gt;kubectl get pods&lt;/code&gt;, atenção aos que estiverem com o status CrashLoopBackOff ou Pending.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Veja os logs do seu Pod.:&lt;/strong&gt; Sim, os Pods registram as ações que são executadas neles, para isso use o comando &lt;code&gt;kubectl describe pod nomedopod&lt;/code&gt; para identificar possíveis mensagens de erro ou eventos que podem ajudar na identificação do problema.&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  Erro de Pull Image
&lt;/h2&gt;

&lt;p&gt;Tem casos que simplesmente não é possível puxar a imagem do container de forma correta, para este cenário vale a pena verificar os possíveis casos abaixo.:&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Nome da Imagem.:&lt;/strong&gt; Valide se o nome da imagem está correto no seu arquivo dockerfile ou no deployment.&lt;br&gt;
&lt;strong&gt;Registro da Imagem.:&lt;/strong&gt; Importante garantir que a imagem esteja no local correto e que seus nós estão com acesso a ela. Teste as rotas entre seus nós e o registro da imagem para verificar possíveis problemas de bloqueio por regra de firewall também deve ser considerado.&lt;/p&gt;

&lt;h2&gt;
  
  
  Erros de Configuração
&lt;/h2&gt;

&lt;p&gt;Este tópico normalmente costuma nos trazer algumas dores de cabeça para descobrir que faltou alguma config ou deixamos de passar o valor de uma variável. Para ajudar a identificar as causas de problemas, comece olhando com atenção aos itens abaixo.:&lt;/p&gt;

&lt;p&gt;✔&lt;strong&gt;ConfigMaps e Secrets.:&lt;/strong&gt; Analise se ambos estão corretamente configurados. Para isso, o Kubernetes possui deixamos comandos que são úteis para estes casos.&lt;br&gt;
✔&lt;strong&gt;Verificando Configmaps.:&lt;/strong&gt; Execute o &lt;code&gt;kubectl describe configmap nomedoconfigmap&lt;/code&gt;.&lt;br&gt;
✔&lt;strong&gt;Verificando Secres.:&lt;/strong&gt; Use o comando &lt;code&gt;kubectl desccribe secret nomedasecret&lt;/code&gt;.&lt;br&gt;
✔&lt;strong&gt;Variáveis de Ambiente (ENVs).:&lt;/strong&gt; Valide se as variáveis de ambiente estão com os valores corretos no manifesto do deployment.&lt;/p&gt;

&lt;h2&gt;
  
  
  Comandos Úteis
&lt;/h2&gt;

&lt;p&gt;A seguir uma lista de comandos que ajudam a diagnosticar e identificar problemas.:&lt;/p&gt;

&lt;p&gt;&lt;code&gt;kubectl get namespaces.:&lt;/code&gt; valida os namespaces do cluster.&lt;/p&gt;

&lt;p&gt;&lt;code&gt;kubectl get deployment -n namespace.:&lt;/code&gt; verifique o status dos deployments de um namespace especifíco.&lt;/p&gt;

&lt;p&gt;&lt;code&gt;kubectl get pods -n namespace.:&lt;/code&gt; mostra todos os pods do namespace e seus status.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F411j78nr5u46kke9pyc6.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F411j78nr5u46kke9pyc6.png" alt=" " width="491" height="84"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;&lt;code&gt;kubectl logs.:&lt;/code&gt; esse comando permite acessar logs do seus recursos no kubernetes, por exemplo.:&lt;br&gt;
  &lt;code&gt;kubectl logs nomedopod&lt;/code&gt;&lt;br&gt;
  &lt;code&gt;kubectl logs -f -l app=aplicacao -n namespace-prd --all-containers=true&lt;/code&gt; -&amp;gt; para verificar os logs de uma aplicação específica&lt;/p&gt;

&lt;p&gt;&lt;code&gt;kubectl get events.:&lt;/code&gt; para ver os eventos do cluster.&lt;/p&gt;

&lt;p&gt;&lt;code&gt;kubectl describe.:&lt;/code&gt; mostramos bastante esse comando no nosso artigo, ele detalha as informações de um recurso,&lt;br&gt;
permitindo verificar uma possível configuração incorreta ou problemas.&lt;/p&gt;

&lt;p&gt;&lt;code&gt;kubectl exec.:&lt;/code&gt; este comando permite acessar um pod em execução para executar comandos dentro dele para diagnóstico.&lt;br&gt;
ou solução de problemas. Por exemplo.: kubectl exec -it nomedopod /bin/bash (para usar comandos shells no pod).&lt;/p&gt;

&lt;p&gt;&lt;code&gt;kubectl get nodes.:&lt;/code&gt; retorna as informações sobre os nós do cluster, você pode usar ele com o argumento --wide ou -w para retornar informações adicionais.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fo8b5qa5di9rcgmhvunet.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fo8b5qa5di9rcgmhvunet.png" alt=" " width="789" height="200"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  Referências
&lt;/h2&gt;

&lt;p&gt;&lt;a href="https://kubernetes.io/docs/tasks/debug/debug-cluster/kubectl-node-debug/" rel="noopener noreferrer"&gt;https://kubernetes.io/docs/tasks/debug/debug-cluster/kubectl-node-debug/&lt;/a&gt;&lt;br&gt;
&lt;a href="https://kubernetes.io/docs/tasks/debug/debug-application/determine-reason-pod-failure/" rel="noopener noreferrer"&gt;https://kubernetes.io/docs/tasks/debug/debug-application/determine-reason-pod-failure/&lt;/a&gt;&lt;br&gt;
&lt;a href="https://kubernetes.io/docs/tasks/debug/debug-application/debug-pods/" rel="noopener noreferrer"&gt;https://kubernetes.io/docs/tasks/debug/debug-application/debug-pods/&lt;/a&gt;&lt;br&gt;
&lt;a href="https://medium.com/totvsdevelopers/comandos-uteis-e-mais-usados-no-kubernetes-cc764f1a9450" rel="noopener noreferrer"&gt;https://medium.com/totvsdevelopers/comandos-uteis-e-mais-usados-no-kubernetes-cc764f1a9450&lt;/a&gt;&lt;br&gt;
Ebook Resiliência No Kubernetes na Veia - Jeferson Fernando - &lt;a href="https://linuxtips.io/ebooks/" rel="noopener noreferrer"&gt;https://linuxtips.io/ebooks/&lt;/a&gt;&lt;/p&gt;

</description>
      <category>kubernetes</category>
      <category>containers</category>
      <category>cloud</category>
      <category>docker</category>
    </item>
    <item>
      <title>O que é o Método RED para Observabilidade</title>
      <dc:creator>rafaelbonilha</dc:creator>
      <pubDate>Sun, 05 Oct 2025 22:14:28 +0000</pubDate>
      <link>https://dev.to/rafaelbonilha/o-que-e-o-metodo-red-para-observabilidade-3l0i</link>
      <guid>https://dev.to/rafaelbonilha/o-que-e-o-metodo-red-para-observabilidade-3l0i</guid>
      <description>&lt;p&gt;Surgido das experiências adquiridas enquanto trabalhava no Google, &lt;strong&gt;Tom Wilkie&lt;/strong&gt; desenvolveu o método &lt;strong&gt;RED&lt;/strong&gt; (rate, errors &lt;br&gt;
and duration), derivada das práticas adotadas pelo time de SRE da Google. O foco do RED é no que os usuários estão tendo de experiência com a aplicação, focando nos serviços individuais dentro de uma arquitetura distribuída.&lt;br&gt;
Isso se deve ao fato que o método USE atende bem hardware, rede e discos, mas ele não atende bem os cenários de serviços de software, exigindo uma filosofia especifíca para software em microsserviços.&lt;/p&gt;

&lt;p&gt;RED busca garantir que os serviços de software funcionem adequadamente para os usuários, onde as principais métricas dão nome ao método.: &lt;strong&gt;Taxa (Red), Erros (Errors) e Duração (Duration)&lt;/strong&gt;. A seguir iremos falar um pouco de cada uma delas.:&lt;/p&gt;

&lt;p&gt;✔ &lt;strong&gt;Taxa (Rate)&lt;/strong&gt;.: Taxa é utilizada para medir o número de solicitações por segundo que um serviço está processando. &lt;br&gt;
Ela permite entender o comportamento da demanda em cada serviço individual e identificar padrões que podem tanto gerar oportunidades como problemas de otimização.&lt;br&gt;
Medir taxas de solicitações por segundo pode ser útil para a maioria dos serviços de software, mas alguns casos que possuem padrões indefinidos de demanda, olhar médias ao longo de determinados períodos de tempo pode ser mais indicado.&lt;br&gt;
Além disso, a taxa pode ser uma métrica de contexto útil para entender o comportamento de outras métricas em um ambiente complexo e distribuído.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fync6z3r1kortkksz737x.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fync6z3r1kortkksz737x.png" alt=" " width="768" height="822"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;✔ &lt;strong&gt;Erros (Errors)&lt;/strong&gt;.: Dentro da filosofia do método RED, erros são os números de solicitações que tiveram problemas.&lt;br&gt;
É uma métrica importante por que ela analisa algo que impacta diretamente os usuários, pois serviços com erros são percebidos pelos usuários. Solicitações que demoram mais que um tempo limite determinado podem ser considera das erros mesmo que retornem mensagem de sucesso. &lt;br&gt;
Lembrando que é importante não apenas contar a quantidade de erros, mas considerar a taxa de erros como uma % do tráfego. &lt;strong&gt;Por exemplo&lt;/strong&gt;.: taxas de erros de 1% para um serviço pode ser considerada aceitável, mas inaceitável para outro, classificar os tipos de erros é importante e ajuda na criação de alertas mais eficientes e na priorização&lt;br&gt;
de atendimento em caso de incidente.&lt;/p&gt;

&lt;p&gt;✔ &lt;strong&gt;Duração (Duration)&lt;/strong&gt;.:  duração é a métrica que irá medir o tempo que as solicitações são atendidas. É a mais facilmente percebida pelos usuários, quando um serviço fica lento, os usuários logo percebem a lentidão. &lt;br&gt;
Para medir essa métrica, é necessário atenção especial as distribuições para evitar usar apenas média. Médias podem trazer resultados enganosos por causa da influência de determinadas quantidades de solicitações.  Trabalhar com porcentagens como &lt;strong&gt;P95&lt;/strong&gt; por exemplo podem trazer uma foto mais realista do que a maioria dos usuários estão tendo de comportamento do serviço.&lt;br&gt;
Separar o que é a duração de solicitações com sucesso de solicitações com falha é importante pois cada uma gera diferentes impactos para os usuários e para o diagnóstico de problemas.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fs66msi1hml7zwmkh0rqm.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fs66msi1hml7zwmkh0rqm.png" alt=" " width="800" height="601"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Benefícios do Método RED&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;RED fornece diversas vantagens para aplicações construídas em arquitetura de microsserviços. Além de reduzir a carga de trabalho através de uma visão de como cada serviço está agindo, possibilitando a rápida identificação de serviços com problemas ou instáveis.&lt;br&gt;
RED também permite identificar como anda a experiência do usuário, possibilitando ações para manter os usuários satisfeitos com os serviços. Na arquitetura de microsserviços, a metodologia RED permite abstrair de forma eficiente o que está de errado com um serviço, permitindo ações mais eficientes e rápidas de correção.&lt;br&gt;
Finalmente, RED permite a automação de tarefas e alertas, gerando aos times alertas e dashboards padronizados, o que torna os times mais efetivos.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Limitações e Considerações Finais&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;Apesar de ser muito bom para a arquitetura de microsserviços, RED tem algumas limitações que devem ser levadas em conta. Ele é muito bom para serviços orientados a solicitações, serviços que usam processamento em lotes ou streaming ele pode não ser tão efetivo. Outro ponto.: ele foca em solicitações síncronas, podendo não ser muito adequado para serviços assíncronos ou orientados a eventos. &lt;/p&gt;

&lt;p&gt;Outra limitação é que RED não possui insights para problemas em recursos específicos, por exemplo.: um aumento no tempo de resposta de solicitação de forma ligeira pode ocorrer e você não ter as métricas internas do serviço para determinar as causas.&lt;br&gt;
Em cenários de serviços que fazem muitas solicitações de downstream, RED pode ter suas métricas influenciadas por dependências, o que torna difícil identificar problemas no serviço.&lt;/p&gt;

&lt;p&gt;O próprio criador do método, &lt;strong&gt;Tom Wikie&lt;/strong&gt; recomenda que RED deva ser usada em conjunto com outras métricas, pois RED não foi pensada para cobrir todos os pontos da monitoração, o que faz com que ela seja possível de usar junto com outros métodos como o &lt;strong&gt;USE&lt;/strong&gt;, fornecendo aos times uma cobertura de forma abrangente do monitoramento de uma aplicação.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Referências&lt;/strong&gt;.:&lt;br&gt;
&lt;a href="https://grafana.com/blog/2018/08/02/the-red-method-how-to-instrument-your-services/" rel="noopener noreferrer"&gt;https://grafana.com/blog/2018/08/02/the-red-method-how-to-instrument-your-services/&lt;/a&gt;&lt;br&gt;
&lt;a href="https://gist.github.com/lpsm-dev/af6acc8bf6581614e3f88485d87d27e4" rel="noopener noreferrer"&gt;https://gist.github.com/lpsm-dev/af6acc8bf6581614e3f88485d87d27e4&lt;/a&gt;&lt;br&gt;
&lt;a href="https://www.opservices.com.br/o-metodo-red-uma-nova-estrategia-para-monitorar-microsservicos/" rel="noopener noreferrer"&gt;https://www.opservices.com.br/o-metodo-red-uma-nova-estrategia-para-monitorar-microsservicos/&lt;/a&gt;&lt;br&gt;
&lt;a href="https://medium.com/@valentin.marlier/monitoring-made-simple-understanding-red-and-use-methodologies-608aec056ae9" rel="noopener noreferrer"&gt;https://medium.com/@valentin.marlier/monitoring-made-simple-understanding-red-and-use-methodologies-608aec056ae9&lt;/a&gt;&lt;br&gt;
&lt;a href="https://www.sentinelone.com/blog/red-and-monitoring-three-key-metrics-and-why-they-matter/" rel="noopener noreferrer"&gt;https://www.sentinelone.com/blog/red-and-monitoring-three-key-metrics-and-why-they-matter/&lt;/a&gt;&lt;br&gt;
&lt;a href="https://thenewstack.io/monitoring-methodologies-red-and-use/" rel="noopener noreferrer"&gt;https://thenewstack.io/monitoring-methodologies-red-and-use/&lt;/a&gt;&lt;br&gt;
E-book Os Métodos RED e USE e os 4 Golden Signals para Observabilidade - Jeferson Fernando - LinuxTips.&lt;/p&gt;

</description>
      <category>cloudcomputing</category>
      <category>microservices</category>
      <category>monitoring</category>
      <category>redmethod</category>
    </item>
    <item>
      <title>ComunicaOps Parte 2.: Desafios de ter um time coeso e motivado de DevOps/SRE/Eng. de Plataformas</title>
      <dc:creator>rafaelbonilha</dc:creator>
      <pubDate>Wed, 10 Sep 2025 15:24:23 +0000</pubDate>
      <link>https://dev.to/rafaelbonilha/comunicaops-parte-2-desafios-de-ter-um-time-coeso-e-motivado-de-devopssreeng-de-plataformas-4f9g</link>
      <guid>https://dev.to/rafaelbonilha/comunicaops-parte-2-desafios-de-ter-um-time-coeso-e-motivado-de-devopssreeng-de-plataformas-4f9g</guid>
      <description>&lt;p&gt;Um dos grandes problemas para garantir que o time de DevOps/SRE/Engenharia de Plataformas atue de forma coesa e &lt;br&gt;
eficiente é conduzir as pessoas do time para que tenham uma &lt;strong&gt;visão compartilhada&lt;/strong&gt;, seja ela estratégica ou técnica.&lt;br&gt;
Ter todos alinhados quanto a &lt;strong&gt;visão&lt;/strong&gt; do time e &lt;strong&gt;objetivos&lt;/strong&gt; é essencial para manter o foco e garantir que os esforços &lt;br&gt;
sejam direcionados para os resultados a serem atingidos.&lt;br&gt;
Por serem geralmente times que lidam com diversas áreas na organização, é fundamental que o time de DevOps/SRE/&lt;br&gt;
Engenharia de Plataformas tenha bem definido seus objetivos e visão, mas para isso é necessário que esses objetivos&lt;br&gt;
e visão sejam bem definidos.&lt;/p&gt;

&lt;h2&gt;
  
  
  Visão
&lt;/h2&gt;

&lt;p&gt;Ter uma &lt;strong&gt;visão&lt;/strong&gt; clara e bem definida é o começo para motivar e inspirar a equipe. Ela deve descrever o futuro &lt;br&gt;
do time desejado e a direção que o mesmo deve seguir. Para isso, é necessário que a visão da equipe seja&lt;br&gt;
alinhada aos valores e missão da organização, destacando a importância do trabalho do time e como contribui&lt;br&gt;
para alcançar um objetivo maior e o impacto positivo que pode gerar.&lt;br&gt;
É importante também que a visão seja clara e desafiadora o suficiente para orientar as ações do time e inspiradora o&lt;br&gt;
suficiente para que a equipe tenha motivação para alcançá-la.&lt;/p&gt;

&lt;h2&gt;
  
  
  Objetivos
&lt;/h2&gt;

&lt;p&gt;Se temos uma visão definida, com ela é possível criar objetivos ou metas que sejam claras e possíveis de serem&lt;br&gt;
mensuradas. Uma maneira de alcançar isso é usando a metodologia &lt;strong&gt;SMART&lt;/strong&gt; (Specific, Measurable, Achievable, Relevant, &lt;br&gt;
Time-bound), isto é, determinar objetivos que sejam específicos, mensuráveis, atingíveis, relevantes e temporal,&lt;br&gt;
isto é, com prazos realistas e alinhados com o time.&lt;br&gt;
E onde entra a comunicação, você deve se perguntar?&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fz9wpbh5qu8scdtzovn1o.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fz9wpbh5qu8scdtzovn1o.png" alt=" " width="800" height="532"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  Comunicação.: Ponte para definir a visão e os objetivos do time
&lt;/h2&gt;

&lt;p&gt;Comunicação é fundamental não só para definir a visão e os objetivos com a equipe, ela ajuda a manter a clareza&lt;br&gt;
e a motivação das pessoas no dia a dia para que o time de DevOps/SRE/Engenharia de Plataformas façam seu trabalho&lt;br&gt;
de forma eficiente e coesa, entregando soluções ou ecossistemas eficientes e robustos para a organização.&lt;br&gt;
Pensando nisso, a comunicação deve ter algumas das iniciativas abaixo.:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;Compartilhe.:&lt;/strong&gt; Comunicar-se exige compartilhar não somente a visão e os objetivos, mas tudo aquilo que seja&lt;br&gt;
importante ou que traga benefícios para o time. Fazer bate papos regularmente com a equipe sobre a visão &lt;br&gt;
e os objetivos, trazendo o progresso e próximos passos e o impacto no contexto da organização ajuda a manter&lt;br&gt;
o time focado e ciente do que é necessário e importante a ser feito.&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;Motive a Participação e o Diálogo.:&lt;/strong&gt; Motivar e encorajar as pessoas da equipe a expor suas ideias e opiniões&lt;br&gt;
ajuda a criar e aumentar a sinergia entre os membros como também ajuda a criar um ambiente onde as pessoas&lt;br&gt;
se sentem ouvidas e motivadas. Uma maneira de alcançar uma colaboração maior entre o time é ter objetivos&lt;br&gt;
colaborativos, de curta duração por exemplo, para incentivar o trabalho em equipe e reforçar laços.&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;Revise Processos.:&lt;/strong&gt; Estabelecer uma revisão de práticas junto com o time ajuda a evitar desperdício de energia&lt;br&gt;
e tempo em processos que não fazem mais sentido ou que tenham pouco valor. Ouvir as sugestões da equipe ajuda&lt;br&gt;
os membros a se sentirem mais envolvidos e motivados, além de colaborar para identificar gargalos nas atividades&lt;br&gt;
e a criação de novas rotinas para tornar o time mais dinâmico e produtivo.&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;Mantenha sempre o valor no coletivo.:&lt;/strong&gt; Por mais que um time seja formado por pessoas de diferentes níveis de&lt;br&gt;
conhecimento técnico, é importante buscar distribuir as tarefas de forma uniforme sempre que possível e &lt;br&gt;
promover uma cultura onde todos se sintam valorizados e importantes dentro da equipe.&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;Forneça feedbacks e reconhecimento.:&lt;/strong&gt; Manter feedbacks construtivos de forma regular ajuda a manter a orientação&lt;br&gt;
dos membros da equipe, assim como seu desenvolvimento de forma contínua. Reconhecer o progresso e conquistas&lt;br&gt;
individuais e coletivas reforça o senso de pertencimento do time e sua motivação para alcançar os objetivos.&lt;/p&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  Conclusão
&lt;/h2&gt;

&lt;p&gt;Ter uma visão e objetivos claros aliados a uma comunicação eficaz possibilita o desenvolvimento de um time motivado &lt;br&gt;
e com clareza para buscar o sucesso na organização. Lembrando que a visão e os objetivos devem ser revisados com a &lt;br&gt;
equipe de forma regular para adaptá-los as mudanças de forma a garantir que as entregas reflitam as demandas atuais.&lt;br&gt;
E com a comunicação clara e aberta, juntos é possível criar um ambiente positivo e estimulante para que os membros&lt;br&gt;
se desenvolvam e cresçam.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Referências.:&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;&lt;a href="https://stackspot.com/pt/blog/time-de-engenharia-de-plataforma/" rel="noopener noreferrer"&gt;https://stackspot.com/pt/blog/time-de-engenharia-de-plataforma/&lt;/a&gt;&lt;br&gt;
&lt;a href="https://portaldalecarnegie.com.br/criando-uma-visao-e-proposito-de-equipe/" rel="noopener noreferrer"&gt;https://portaldalecarnegie.com.br/criando-uma-visao-e-proposito-de-equipe/&lt;/a&gt;&lt;br&gt;
&lt;a href="https://medium.com/@petrusje/descobrindo-o-prop%C3%B3sito-do-time-a-import%C3%A2ncia-da-conversa-de-prop%C3%B3sito-6f32e7401d30" rel="noopener noreferrer"&gt;https://medium.com/@petrusje/descobrindo-o-prop%C3%B3sito-do-time-a-import%C3%A2ncia-da-conversa-de-prop%C3%B3sito-6f32e7401d30&lt;/a&gt;&lt;br&gt;
&lt;a href="https://www.flowup.me/blog/planejamento-tatico/" rel="noopener noreferrer"&gt;https://www.flowup.me/blog/planejamento-tatico/&lt;/a&gt;&lt;/p&gt;

</description>
      <category>devops</category>
      <category>devex</category>
      <category>cloud</category>
      <category>productivity</category>
    </item>
    <item>
      <title>ComunicaOps: Criando Alicerces para Construção de Plataformas</title>
      <dc:creator>rafaelbonilha</dc:creator>
      <pubDate>Fri, 15 Aug 2025 19:38:42 +0000</pubDate>
      <link>https://dev.to/rafaelbonilha/comunicaops-criando-alicerces-para-construcao-de-plataformas-ed</link>
      <guid>https://dev.to/rafaelbonilha/comunicaops-criando-alicerces-para-construcao-de-plataformas-ed</guid>
      <description>&lt;p&gt;A &lt;strong&gt;comunicação&lt;/strong&gt; é muito importante dentro das práticas de DevOps e Engenharia de Plataformas, sendo um elemento&lt;br&gt;
 crítico para o sucesso dos times poderem projetar, operar e evoluir infraestrutura de forma coordenada.&lt;br&gt;
 Em resumo, a construção de uma plataforma que seja robusta, confiável e fácil de usar é um desafio tanto social&lt;br&gt;
 quanto técnico.&lt;br&gt;
 A tecnologia define o que a plataforma pode fazer, mas a comunicação determina se ela será usada e se agregará &lt;br&gt;
 valor.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fzq0thps6gnvc5wdvu4qg.jpeg" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fzq0thps6gnvc5wdvu4qg.jpeg" alt=" " width="474" height="284"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Entendendo o Rolê.: Saber o que o negócio ou o cliente espera de uma entrega&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;Talvez em última análise, a comunicação seja o fator de construir pontes entre os times de DevOps/SRE/Engenharia &lt;br&gt;
 de Plataformas e seus clientes, sejam eles outras áreas de TI, da empresa, negócio ou externo.&lt;br&gt;
 E a solidez dessas pontes não depende apenas de tão qualificado seja o time, mas da qualidade da comunicação.&lt;br&gt;
 Sabemos o que acontece quando não temos uma boa comunicação.: Silos entre times e áreas, cultura de culpar o outro&lt;br&gt;
 e prejuízos para pessoas e o negócio.&lt;br&gt;
 Isso leva a um cenário de conflito entre áreas e pessoas, gerando atrasos, crises e frustrações que atrasam a &lt;br&gt;
 entrega e gerando prejuízos.&lt;/p&gt;

&lt;p&gt;Comunicação garante um alicerce para que plataformas sejam bem pensadas e construídas, evitando a chamada &lt;br&gt;
 estrada para lugar nenhum. Alinhamento de expectativas, objetivos e plano de ação via ciclo de feedbacks&lt;br&gt;
 garante o que a plataforma a ser construída irá oferecer e quando. Lembrando que a plataforma é um produto&lt;br&gt;
 em evolução, sendo necessário tratar o seu roadmap como algo mutável, não estático.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F0b5qqipjnuis3fjfnnm2.jpeg" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F0b5qqipjnuis3fjfnnm2.jpeg" alt=" " width="474" height="258"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;O que precisamos.: Empatia e Soft Skills&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;Ter uma escuta ativa e empatia é fundamental para entender perspectivas diferentes, ajudando a reduzir ruídos&lt;br&gt;
 na comunicação e acelerando a resolução de possíveis conflitos, importante em contextos de grande pressão&lt;br&gt;
 e prazos curtos. Aliadas a feedbacks bem feitos e rápidos, fluxos visualmente claros e aprendizado contínuo&lt;br&gt;
 garantem a fluidez da comunicação, ajudando a obter as melhores respostas para as questões que surgirem &lt;br&gt;
 no desenvolvimento da plataforma. &lt;br&gt;
 São essas ferramentas que permitirão aos times alcançarem a sinergia, isto é, falarem a mesma língua e irem&lt;br&gt;
 na mesma direção.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Conclusão.: Plataformas São Feitas para Pessoas&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;Alinhando expectativa, técnicas de comunicação claras, transparência, colaboração, visibilidade aliada a cultura&lt;br&gt;
 de que erros são oportunidade de aprendizado, não de punição entre os times pode garantir aos times de &lt;br&gt;
 DevOps/SRE/Engenharia de Plataformas que estão construindo não apenas ferramentas, mas ecossistemas robustos e &lt;br&gt;
 confiáveis para acelerar a inovação e a capacitação de todos dentro da organização.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Referências.:&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;&lt;a href="https://youtu.be/HwMN_ohz__8?si=NywFvaUhlFFSpM1V" rel="noopener noreferrer"&gt;https://youtu.be/HwMN_ohz__8?si=NywFvaUhlFFSpM1V&lt;/a&gt;&lt;br&gt;
&lt;a href="https://www.youtube.com/live/nvINtvy_8eI?si=KAt_zKJ0AgA-MoKL" rel="noopener noreferrer"&gt;https://www.youtube.com/live/nvINtvy_8eI?si=KAt_zKJ0AgA-MoKL&lt;/a&gt;&lt;br&gt;
&lt;a href="https://youtu.be/fKv5g-U6C0E?si=FnwCAT7N_bvExix4" rel="noopener noreferrer"&gt;https://youtu.be/fKv5g-U6C0E?si=FnwCAT7N_bvExix4&lt;/a&gt;&lt;br&gt;
The Phoenix Project: A Novel about It, Devops, and Helping Your  Business Win -  &lt;a href="https://a.co/d/5F4V2yP" rel="noopener noreferrer"&gt;https://a.co/d/5F4V2yP&lt;/a&gt;&lt;/p&gt;

</description>
      <category>devops</category>
      <category>cloud</category>
      <category>sre</category>
      <category>devex</category>
    </item>
    <item>
      <title>Usando o Amazon WorkSpaces Core para migrações de VDI</title>
      <dc:creator>rafaelbonilha</dc:creator>
      <pubDate>Sat, 12 Jul 2025 05:50:48 +0000</pubDate>
      <link>https://dev.to/rafaelbonilha/usando-o-amazon-workspaces-core-para-migracoes-de-vdi-4chm</link>
      <guid>https://dev.to/rafaelbonilha/usando-o-amazon-workspaces-core-para-migracoes-de-vdi-4chm</guid>
      <description>&lt;p&gt;O Amazon WorkSpaces fornece um serviço de infraestrutura para área de trabalho virtual VDI gerenciado fornecendo&lt;br&gt;
as organizações acesso a aplicações e dados, otimizando custos e maximizando a produtividade. Sendo flexível ao &lt;br&gt;
ponto de permitir as organizações escolher áreas de trabalho virtuais para os usuários que necessitam acessar&lt;br&gt;
ambientes consistentes e personalizados.&lt;br&gt;
Sendo gerenciado pela mesma interface do Amazon WorkSpaces Pools no Console de Gerenciamento da AWS.&lt;/p&gt;

&lt;p&gt;Alguns dos benefícios do WorkSpaces para cenários onde a VDI é uma opção mais benéfica.:&lt;/p&gt;

&lt;p&gt;✔ Fornece acesso confiável e seguro a aplicações e dados.: O WorkSpaces fornece aos usuários acesso a aplicações e &lt;br&gt;
dados armazenados na AWS, ajudando a maximizar a produtividade e a continuidade dos negócios com um SLA apoiado &lt;br&gt;
financeiramente. Os serviços do WorkSpaces são criados na AWS, que foi projetada para estar entre os ambientes de &lt;br&gt;
computação em nuvem mais seguros atualmente disponíveis.&lt;/p&gt;

&lt;p&gt;✔ Flexibilidade para levar suas aplicações Microsoft 365.: O WorkSpaces oferece a &lt;br&gt;
flexibilidade de fazer com que as licenças de aplicações do Microsoft 365 para empresas sejam executadas nos &lt;br&gt;
serviços do WorkSpaces.&lt;/p&gt;

&lt;p&gt;✔ Gerenciamento de VDI.: Com o WorkSpaces, você pode gerenciar uma combinação de áreas de trabalho virtuais do &lt;br&gt;
WorkSpaces Personal e do WorkSpaces Pools usando o mesmo conjunto de aplicações para todos os usuários, resultando &lt;br&gt;
em uma experiência unificada para administradores e usuários finais. A ferramenta de integração no Console de &lt;br&gt;
Gerenciamento da AWS recomenda uma configuração adequada do WorkSpaces com base no seu caso de uso, reduzindo ainda &lt;br&gt;
mais a carga administrativa.&lt;/p&gt;

&lt;p&gt;✔ Escale sua infraestrutura com preços flexíveis.: O WorkSpaces oferece um modelo de preços flexível e econômico com &lt;br&gt;
opções de cobrança mensal e por hora. Com o faturamento por hora, você paga apenas pelos recursos que usa, &lt;br&gt;
facilitando a escalar sua infraestrutura de área de trabalho virtual à medida que as necessidades de sua empresa &lt;br&gt;
mudam. Essa abordagem de pagamento conforme o uso elimina a necessidade de grandes investimentos iniciais e ajuda &lt;br&gt;
você a ajustar seus gastos com áreas de trabalho virtuais.&lt;/p&gt;

&lt;p&gt;Essas abordagens permite que em alguns cenários, o tempo de implantação de uma VDI seja reduzido em até 90%, o que&lt;br&gt;
permite as organizações ganhar tempo para seus usuários, principalmente para cenários de usuários remotos.&lt;br&gt;
Para cenários de usuários remotos e temporários, VDI são fundamentais e o Amazon WorkSpaces torna-se uma opção &lt;br&gt;
interessante para estes cenários.&lt;/p&gt;

&lt;p&gt;O Amazon WorkSpaces permite escolher entre WorkSpaces Personal ou WorkSpaces Pools de acordo com a necessidade.&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;WorkSpaces Personal&lt;/strong&gt;.: Escolha WorkSpaces Personal se precisar de desktops virtuais persistentes que sejam Adaptado&lt;br&gt;
para usuários que precisam de uma área de trabalho altamente personalizada provisionada para seu uso exclusivo. &lt;br&gt;
Isso é semelhante a um computador desktop físico atribuído a um indivíduo.&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;WorkSpaces Pools&lt;/strong&gt;.:  Escolha o pool do WorkSpaces para áreas de trabalho virtuais não persistentes personalizadas &lt;br&gt;
para os usuários que precisam de acesso a ambientes de desktop altamente selecionados hospedados em infraestrutura &lt;br&gt;
efêmera.&lt;/p&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;É possível conectar aos WorkSpaces usando um aplicativo cliente por meio de um navegador Web compatível, &lt;br&gt;
para PCs são recomendados os navegadores Firefox e Chrome.&lt;/p&gt;

&lt;p&gt;Referências.:&lt;br&gt;
&lt;a href="https://docs.aws.amazon.com/workspaces/latest/adminguide/connect-client.html" rel="noopener noreferrer"&gt;https://docs.aws.amazon.com/workspaces/latest/adminguide/connect-client.html&lt;/a&gt;&lt;br&gt;
&lt;a href="https://aws.amazon.com/pt/workspaces-family/workspaces/" rel="noopener noreferrer"&gt;https://aws.amazon.com/pt/workspaces-family/workspaces/&lt;/a&gt;&lt;br&gt;
&lt;a href="https://docs.aws.amazon.com/workspaces/latest/adminguide/amazon-workspaces.html" rel="noopener noreferrer"&gt;https://docs.aws.amazon.com/workspaces/latest/adminguide/amazon-workspaces.html&lt;/a&gt;&lt;/p&gt;

</description>
      <category>cloud</category>
      <category>aws</category>
      <category>vdi</category>
      <category>workstations</category>
    </item>
    <item>
      <title>Conhecendo o Azure SRE Agent</title>
      <dc:creator>rafaelbonilha</dc:creator>
      <pubDate>Fri, 20 Jun 2025 20:38:18 +0000</pubDate>
      <link>https://dev.to/rafaelbonilha/conhecendo-o-azure-sre-agent-943</link>
      <guid>https://dev.to/rafaelbonilha/conhecendo-o-azure-sre-agent-943</guid>
      <description>&lt;p&gt;Anunciado como uma das maiores novidades do Microsof Build 2025, principal evento de tecnologia da empresa. Construído para usar recursos de IA juntamente com LLM, o objetivo do &lt;strong&gt;Azure SRE Agent&lt;/strong&gt; é trazer respostas ágeis e proativas para manutenção de ambientes cloud. Apoiando na resposta de incidentes, a ferramenta tem como premissa reduzir a carga de trabalho de gerenciamento de ambientes cloud produtivos.&lt;/p&gt;

&lt;p&gt;Usando LLMs para analisar os logs e métricas para uma análise efetiva e rápida da causa raiz de um problema e sua solução. Em cenários de crescimento da complexidade de ambientes clouds, o correto uso da engenharia de confiabilidade do site, SRE, apresenta-se como uma prioridade para os times responsáveis por manter funcionais, efetivos e confiáveis ambientes cloud em produção.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fxg0insyt9zpj7scbpcdz.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fxg0insyt9zpj7scbpcdz.png" alt="Image description" width="715" height="493"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Integrado aos recursos de observabilidade e gerenciamento de incidentes como o Agentic DevOps no GitHub Copilot de forma que ele possa monitorar e aprender a integridade dos recursos, lidando com alertas de forma a resolver problemas mais rapidamente.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Principais Recursos&lt;/strong&gt;&lt;br&gt;
Com o objetivo de ajudar a tornar o ambiente mais confiável, escalável e seguro, o &lt;strong&gt;Azure SRE Agent&lt;/strong&gt; conta com os seguintes recursos.:&lt;/p&gt;

&lt;p&gt;✔ &lt;strong&gt;Avaliando tendências de uso e desempenho&lt;/strong&gt;.: avaliando o ambiente de forma contínua, executando em segundo plano 24 horas por dia, 7 dias por semana, o &lt;strong&gt;SRE Agent&lt;/strong&gt; auxilia os times através de respostas a perguntas via prompt para identificação rápida de inconsistências.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Frfe85jd0vei3ebaar64s.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Frfe85jd0vei3ebaar64s.png" alt="Image description" width="800" height="281"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;✔ &lt;strong&gt;Detecção e correção proativas de vulnerabilidades de Segurança&lt;/strong&gt;.: Fazendo auditorias frequentes, o &lt;strong&gt;SRE Agent&lt;/strong&gt; verifica uso de versões TLS com suporte por exemplo, assim como executar as operações necessárias para atualizar os recursos com sua aprovação para deixar os mesmos em conformidade.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F79a2105uob7t1pqjwvm8.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F79a2105uob7t1pqjwvm8.png" alt="Image description" width="667" height="337"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;✔ &lt;strong&gt;Resposta automatizada a incidentes e análise mais rápida da causa raiz&lt;/strong&gt;.: Executando em conjunto com o Azure Monitor e o PagerDuty por exemplo, o &lt;strong&gt;SRE Agent&lt;/strong&gt; pode atuar na resposta a incidentes, reduzindo o tempo de resposta e auxiliando os times na resolução de incidentes em um tempo menor que os métodos tradicionais.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F9sxhj89wdyic3bihgveo.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F9sxhj89wdyic3bihgveo.png" alt="Image description" width="595" height="417"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;✔ &lt;strong&gt;Mitigação de Incidentes&lt;/strong&gt;.: Para normalizar uma aplicação ao seu estado operacional, o &lt;strong&gt;SRE Agent&lt;/strong&gt; pode fazer ações em nome e com aprovação do usuário. Essas açoes podem ser escalar recursos, reiniciar aplicativos e executar rollbacks de aplicativo de forma normalizar uma aplicação de forma mais rápida possível.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fvgkwzp1lmn3s9nz4ffgq.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fvgkwzp1lmn3s9nz4ffgq.png" alt="Image description" width="557" height="538"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;✔ &lt;strong&gt;Feche o ciclo com os desenvolvedores&lt;/strong&gt;.: Após a finalização da investigação, o &lt;strong&gt;SRE Agen&lt;/strong&gt;t cria um problema no GitHub, gerando os detalhes da investigação, ajudando os desenvolvedores a corrigir o código-fonte e evitar recorrências subsequentes de um incidente.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fkjvggj4fwl6jhjtvpcmu.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fkjvggj4fwl6jhjtvpcmu.png" alt="Image description" width="608" height="150"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;O &lt;strong&gt;Azure SRE Agent&lt;/strong&gt; é um dos recursos novos mais aguardados para estarem disponíveis no Azure para os próximos meses para apoiar os times na gestão de ambientes cloud produtivos e complexos.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Referências.:&lt;/strong&gt;&lt;br&gt;
&lt;a href="https://learn.microsoft.com/pt-br/azure/app-service/sre-agent-overview" rel="noopener noreferrer"&gt;https://learn.microsoft.com/pt-br/azure/app-service/sre-agent-overview&lt;/a&gt;&lt;br&gt;
&lt;a href="https://azure.microsoft.com/en-us/blog/all-the-azure-news-you-dont-want-to-miss-from-microsoft-build-2025/" rel="noopener noreferrer"&gt;https://azure.microsoft.com/en-us/blog/all-the-azure-news-you-dont-want-to-miss-from-microsoft-build-2025/&lt;/a&gt;&lt;br&gt;
&lt;a href="https://build.microsoft.com/en-US/sessions/DEM550" rel="noopener noreferrer"&gt;https://build.microsoft.com/en-US/sessions/DEM550&lt;/a&gt;&lt;br&gt;
&lt;a href="https://techcommunity.microsoft.com/blog/azurepaasblog/introducing-azure-sre-agent/4414569" rel="noopener noreferrer"&gt;https://techcommunity.microsoft.com/blog/azurepaasblog/introducing-azure-sre-agent/4414569&lt;/a&gt;&lt;/p&gt;

</description>
      <category>cloudcomputing</category>
      <category>azure</category>
      <category>ai</category>
      <category>cloud</category>
    </item>
    <item>
      <title>CryptoRave, BSides, DevOpsDays e o impacto de participar de eventos de Tecnologia</title>
      <dc:creator>rafaelbonilha</dc:creator>
      <pubDate>Tue, 20 May 2025 20:04:33 +0000</pubDate>
      <link>https://dev.to/rafaelbonilha/cryptorave-bsides-devopsdays-e-o-impacto-de-participar-de-eventos-de-tecnologia-3n5l</link>
      <guid>https://dev.to/rafaelbonilha/cryptorave-bsides-devopsdays-e-o-impacto-de-participar-de-eventos-de-tecnologia-3n5l</guid>
      <description>&lt;p&gt;Este Post vai ser um pouco diferente do normal, nele vou abordar a experiência adquirida ao participar de eventos de Tecnologia e como isso é importante para ajudar a conhecer iniciativas, tecnologias e de estar mais próximo da comunidade.&lt;/p&gt;

&lt;p&gt;É complicado estar presente em eventos presenciais: exige recursos, planejamento, tempo disponível e tem também a questão de em vários casos fazer a escolha de deixar alguma coisa de lado para poder estar presente no evento escolhido.&lt;/p&gt;

&lt;p&gt;Nos dias 16, 17 e 18/05 agora eu participei de dois eventos.: CryptoRave e BSides SP, ambos na cidade de São Paulo. Cada um com suas particularidades e grades de programação vasta, diversa e com muitas possibilidades de interação com a comunidade de tecnologia.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;&lt;em&gt;CryptoRave 2025&lt;/em&gt;&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;Na CryptoRave tive a feliz oportunidade de ser novamente voluntário, é um evento que participo desde as primeiras edições por ter um foco importante em ações para grupos minoritários e as classes sociais mais vulneráveis economicamente. E como bônus eu pude palestrar no evento, numa programação vasta e de elevado nível técnico, poder compartilhar um pouco do que eu sei ao lado de pessoas que admiro foi uma das experiências que mais me marcaram nestes anos todos de participação em eventos.&lt;br&gt;
É um evento gratuito, totalmente financiado pela comunidade e que recomendo demais a participação, ele ocorre anualmente e tem sido realizado nos últimos anos na Biblioteca Municipal Mário de Andrade, o que traz um charme a mais para o evento. &lt;br&gt;
E como o nome diz, após o evento em si, tem a tradicional festa para finalizar com chave de ouro as 24 horas de palestras, intervenções e atividades.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;&lt;em&gt;BSides SP&lt;/em&gt;&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;A BSides SP é um evento com foco em segurança, organizado pela comunidade e que tem uma quantidade significativa de ingressos gratuitos e que é realizada sempre em 2 dias, um dia focado em cursos e o outro dia focado em palestras, intervenções e atividades para a comunidade. &lt;br&gt;
É um evento muito disputado por já ser realizado à 20 anos, sendo que esta foi a 20° edição do mesmo. Foi muito bacana acompanhar as palestras e atividades com o foco em segurança, onde teve diversas iniciativas da comunidade para levar as boas práticas de segurança para o maior número de pessoas possível.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;&lt;em&gt;DevOpsDays&lt;/em&gt;&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;Este é um evento que eu tenho um carinho muito grande, pois foi o primeiro evento que eu consegui participar após a pandemia e que me trouxe a noção do que a comunidade é capaz de fazer quando se une em prol de um objetivo comum. &lt;br&gt;
Felizmente ele tem se expandido, sendo realizado em várias cidades no país, o que tem ajudado mais pessoas a participarem e conhecerem essa comunidade íncrivel. Tendo sido inicialmente criado em Ghent, na Bélgica, hoje o DevOpsDays é realizado em várias cidades do mundo.&lt;/p&gt;

&lt;p&gt;É isso pessoal, espero que possam ter essa experiência e que ajudem a espalhar o conhecimento.&lt;br&gt;
Até o próximo post =)!&lt;/p&gt;

</description>
      <category>security</category>
      <category>devops</category>
      <category>cloud</category>
      <category>eventsinyourcity</category>
    </item>
    <item>
      <title>Kagent: Agents de IA em clusters Kubernetes</title>
      <dc:creator>rafaelbonilha</dc:creator>
      <pubDate>Sat, 12 Apr 2025 04:04:41 +0000</pubDate>
      <link>https://dev.to/rafaelbonilha/kagent-agents-de-ia-em-clusters-kubernetes-3pkb</link>
      <guid>https://dev.to/rafaelbonilha/kagent-agents-de-ia-em-clusters-kubernetes-3pkb</guid>
      <description>&lt;p&gt;Hoje vamos abordar um projeto que está em seu início, mas que traz uma ideia bem interessante: usar agentes de IA em clusters Kubernetes para automatização, solução de problemas e desafios na nuvem, criado especificamente para os times de DevOps/Engenharia de Plataformas. Esta ideia é o que está por trás do &lt;a href="https://kagent.dev" rel="noopener noreferrer"&gt;Kagent&lt;/a&gt;.&lt;/p&gt;

&lt;p&gt;Isso é feito usando os recursos de raciocínio e planejamento iterativo transformando insights de IA em ações, apoiando os times em desafios operacionais comuns ou complexos como degradação de desempenho de uma aplicação, automação de alertas, gerenciamento de implementações, entre outros.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Componentes Principais&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;O Kagent possui 4 componentes principais:&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F54rlbd2j76kvzhm6c63r.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F54rlbd2j76kvzhm6c63r.png" alt="Image description" width="505" height="300"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;✔ Controller.: O controller é o controlador do Kubernetes para monitorar os recursos personalizados do Kagent e cria os recursos necessários para executar os agentes.&lt;br&gt;
✔ UI.: O UI é a interface web fácil de usar para gerenciar os agentes e ferramentas.&lt;br&gt;
✔ Engine.: O engine é formado por uma aplicação Python que executa os agentes e ferramentas. O engine é construído usando o Autogen.&lt;br&gt;
✔ CLI.: A preferida dos usuários, o CLI é a ferramenta de linha de comando que permite gerenciar os agentes e as ferramentas de forma otimizada e flexível.&lt;/p&gt;

&lt;p&gt;Agora que conhecemos a arquitetura do Kagent, vamos conhecer os conceitos principais por trás dele.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Conceitos Principais&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;O Kagent utiliza-se de 2 conceitos: Agentes e Ferramentas, ambos são recursos personalizados do Kubernetes, tornando os fáceis de gerenciar e modificar.&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;Agentes&lt;/strong&gt;.: São o principal componente do Kagent, sendo um conjunto de ferramentas, uma configuração de modelo e um prompt do sistema.&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;strong&gt;Ferramentas&lt;/strong&gt;.: São quaisquer ferramenta externa que pode ser usada em um agente. Definidas como recurso personalizado do Kubernetes, ela pode ser usada por vários agentes.&lt;/p&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Além dos conceitos, o Kagent tem os seguintes príncipios:&lt;/p&gt;

&lt;p&gt;✔ Kubernetes Nativo.: Criado para ser fácil de entender e usar, fornecendo uma maneira flexível e poderosa para criação e gerenciamento de agentes de IA.&lt;/p&gt;

&lt;p&gt;✔ Flexível.: O Kagent é criado para ser flexível, adaptativo para qualquer caso de uso de agente de IA.&lt;/p&gt;

&lt;p&gt;✔ Extensível.: Permite que o usuário adicione suas próprias ferramentas e agentes.&lt;/p&gt;

&lt;p&gt;✔ Observável.: Projetado para que seja fácil de monitorar os agentes e ferramentas usando as estruturas de monitoramento mais comuns, o Kagent facilita o trabalho dos times para monitorar o uso das cargas de trabalho dos agentes em clusters Kubernetes.&lt;/p&gt;

&lt;p&gt;✔ Declarativo.: O Kagent foi desenvolvido para ser declarativo, permitindo que as definições dos agentes e das ferramentas possam ser feitas em um arquivo YAML.&lt;/p&gt;

&lt;p&gt;✔ Testável.: Este ponto é importante para os agentes de IA e aplicações  baseadas, pois o Kagent foi criado para ser testado e depurado de forma rápida e fácil, dando aos times agilidade na identificação e solução de problemas.&lt;/p&gt;

&lt;p&gt;Por ser um projeto novo, o &lt;a href="https://kagent.dev" rel="noopener noreferrer"&gt;Kagent&lt;/a&gt; segue em constante evolução e estão previstas melhorias em observabilidade, testes, tempo de execução e ferramentas.&lt;br&gt;
Vale a pena ficar de olho neste projeto que promete trazer muitos benefícios para os times de DevOps/Engenharia de Plataformas.&lt;/p&gt;

</description>
      <category>ai</category>
      <category>cloud</category>
      <category>kubernetes</category>
      <category>opensource</category>
    </item>
  </channel>
</rss>
