{"id":1513,"date":"2025-04-18T16:01:20","date_gmt":"2025-04-18T16:01:20","guid":{"rendered":"https:\/\/mugnos-it.com\/?p=1513"},"modified":"2025-06-03T00:50:36","modified_gmt":"2025-06-03T00:50:36","slug":"estabilidade-estatica-sua-infraestrutura-e-resiliente-de-verdade-%f0%9f%98%ac","status":"publish","type":"post","link":"https:\/\/mugnos-it.com\/pt\/estabilidade-estatica-sua-infraestrutura-e-resiliente-de-verdade-%f0%9f%98%ac\/","title":{"rendered":"Estabilidade Est\u00e1tica: Sua Infraestrutura \u00e9 Resiliente de Verdade? \ud83d\ude2c"},"content":{"rendered":"<div data-elementor-type=\"wp-post\" data-elementor-id=\"1513\" class=\"elementor elementor-1513\" data-elementor-post-type=\"post\">\n\t\t\t\t<div class=\"elementor-element elementor-element-29250a58 e-flex e-con-boxed e-con e-parent\" data-id=\"29250a58\" data-element_type=\"container\">\n\t\t\t\t\t<div class=\"e-con-inner\">\n\t\t\t\t<div class=\"elementor-element elementor-element-3e9f9a98 elementor-widget elementor-widget-text-editor\" data-id=\"3e9f9a98\" data-element_type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t\n<p id=\"1cf14600-107e-8011-870b-cc3df6ed25a4\">Hoje eu quero te trazer uma reflex\u00e3o que, se voc\u00ea ainda n\u00e3o teve, <strong>provavelmente vai ter em breve<\/strong> \u2013 especialmente se voc\u00ea trabalha (ou quer trabalhar) com sistemas distribu\u00eddos, alta disponibilidade ou ambientes em cloud.<\/p>\n\n\n\n<p id=\"1cf14600-107e-802f-b034-dd79736cde7f\">Afinal\u2026 <strong>usar um, dois ou at\u00e9 tr\u00eas data centers realmente deixa sua aplica\u00e7\u00e3o mais resiliente e consequentemente aumenta sua SLA de disponibilidade ?<\/strong> \ud83e\udd14<br><\/p>\n\n\n\n<p id=\"1cf14600-107e-80c1-a9e0-c848b038fb5f\">E se eu te dissesse que, na pr\u00e1tica, <strong>isso pode at\u00e9 aumentar o risco de indisponibilidade<\/strong>, se n\u00e3o for bem planejado?<br><\/p>\n\n\n\n<p id=\"1cf14600-107e-8001-bb3e-cd333b1b01ec\">Parece meio estranho, n\u00e9? Mas esse \u00e9 exatamente o ponto central do conceito de <strong>estabilidade est\u00e1tica<\/strong>. J\u00e1 tem um tempo que falei sobre isso num v\u00eddeo l\u00e1 no YouTube \u2014 inclusive, se quiser assistir depois, vale muito a pena! Vou deixar o link no final do post (mas \u00f3, <strong>resiste a tenta\u00e7\u00e3o e continua aqui comigo primeiro!<\/strong> \ud83d\ude05)<\/p>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"1cf14600-107e-80e8-8ca0-dfe84c55de5d\">O que \u00e9 Estabilidade Est\u00e1tica?<br><\/h3>\n\n\n\n<p id=\"1cf14600-107e-8081-bcdf-e7963c61c1b4\">\u00c9 a <strong>capacidade do seu sistema continuar operando, mesmo quando uma parte dele falha<\/strong>. E mais: operando de forma est\u00e1vel, sem colapsar o resto da infraestrutura.<br><\/p>\n\n\n\n<p id=\"1cf14600-107e-8077-938f-ecf55fe26caa\">Esse conceito vem da engenharia \u201ctradicional\u201d, tipo engenharia civil ou automotiva. Imagina um carro projetado pra continuar funcionando com tr\u00eas rodas, se uma estourar. O sistema (carro) se adapta e continua de p\u00e9, mesmo que com limita\u00e7\u00f5es.<br><\/p>\n\n\n\n<p id=\"1cf14600-107e-806e-91e2-f13963c07be2\">Agora pensa comigo:<br><\/p>\n\n\n\n<p id=\"1cf14600-107e-80eb-9303-cb42bbe361f2\">Se eu crio um carro com quatro rodas, eu tamb\u00e9m crio <strong>quatro pontos de falha<\/strong>. E se uma roda fura? O carro pode precisar reduzir de 100km\/h pra 20km\/h \u2014 ou at\u00e9 parar de vez at\u00e9 a roda ser trocada.<br><\/p>\n\n\n\n<p id=\"1cf14600-107e-80ab-98ee-dbfb74a29537\"><strong>Ser\u00e1 que, nesse caso, um triciclo n\u00e3o seria at\u00e9 mais resiliente?<\/strong> Ele roda a 100km\/h como o carro, mas com 1\/4<strong> a menos de chance de falha, <\/strong>pois possui 3 pontos de falha \ud83d\udc40<br><\/p>\n\n\n\n<p id=\"1cf14600-107e-8033-9724-ee69e610ba23\">Parece loucura, mas \u00e9 justamente esse tipo de l\u00f3gica que a gente precisa aplicar quando desenha sistemas distribu\u00eddos. <strong>Mais pe\u00e7as nem sempre significam mais seguran\u00e7a.<\/strong><\/p>\n\n\n\n<p id=\"1cf14600-107e-80ad-be1a-c8b7015703ba\"><strong><br>Agora pensa: seu sistema de software consegue fazer isso?<\/strong><\/p>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"1cf14600-107e-80e2-a17e-e08dde8d2082\">O Erro Cl\u00e1ssico do &#8220;Resiliente&#8221; de Mentirinha<br><\/h3>\n\n\n\n<p id=\"1cf14600-107e-800d-94c5-e21fba8a971b\">A galera adora desenhar aquele esquema bonito:<\/p>\n\n\n\n<pre id=\"1cf14600-107e-80f8-81d9-e2f32888053d\" class=\"wp-block-code\"><code>Usu\u00e1rios \u2192 Load Balancer \u2192 3x AZs bonitinhas <\/code><\/pre>\n\n\n\n<p id=\"1cf14600-107e-8026-b639-dd7d4281dc09\">E dizem com todo orgulho: \u201cEstamos em tr\u00eas zonas de disponibilidade. T\u00e1 tudo resiliente!\u201d<\/p>\n\n\n\n<p id=\"1cf14600-107e-8023-8d80-c313c0f12d73\"><br><br><strong>Ser\u00e1 que isso \u00e9 uma verdade ?<\/strong> Vamos trazer pra pr\u00e1tica\u2026<strong><br><\/strong><\/p>\n\n\n\n<p id=\"1cf14600-107e-801b-8b12-de1007fabc65\">Imagina que voc\u00ea tem <strong>3 data centers<\/strong> (AZ-A, AZ-B e AZ-C), e cada um deles est\u00e1 operando com <strong>75% de uso dos seus recursos<\/strong>.<\/p>\n\n\n\n<p id=\"1cf14600-107e-8036-be19-ce6fc47d303f\">(Ali\u00e1s, aqui vale uma observa\u00e7\u00e3o r\u00e1pida: quando falamos de AZ \u2014 Availability Zone \u2014 estamos nos referindo a uma zona isolada de disponibilidade dentro de uma regi\u00e3o. Na pr\u00e1tica, ela pode conter mais de um data center f\u00edsico, mas para fins arquiteturais, voc\u00ea pode (e deve) tratar como se fosse um \u00fanico ponto de falha. Afinal, s\u00e3o estruturas pr\u00f3ximas, muitas vezes com interdepend\u00eancia energ\u00e9tica, de rede ou at\u00e9 clim\u00e1tica. \ud83c\udf29\ufe0f)<\/p>\n\n\n\n<p id=\"1cf14600-107e-807f-b14c-f95ef34573bf\">Pensando na analogia do carro: nesse caso acima, voc\u00ea teria um triciclo com 3 possiveis pontos de falhas.<\/p>\n\n\n\n<p id=\"1cf14600-107e-803f-9ef0-de269e25f719\">E se a <strong>AZ-C cair ?\u2026<\/strong> como \u00e9 que voc\u00ea faz os <strong>75% de carga<\/strong> que estavam l\u00e1 caberem dentro das outras duas AZs?<br><\/p>\n\n\n\n<p id=\"1cf14600-107e-802b-8150-efdc07d05a00\">Fazendo uma conta r\u00e1pida:<\/p>\n\n\n\n<ol start=\"1\" id=\"1cf14600-107e-806e-b122-f8184a664885\" class=\"wp-block-list\">\n<li>Cada uma (AZ-A e AZ-B) j\u00e1 estava com 75% de carga.<\/li>\n\n\n\n<li>Agora precisam absorver mais 37,5% cada (metade dos 75% da AZ-C).<\/li>\n\n\n\n<li>Resultado? <strong>AZ-A e AZ-B v\u00e3o a 112,5% de utiliza\u00e7\u00e3o.<br><\/strong><\/li>\n<\/ol>\n\n\n\n<p id=\"1cf14600-107e-804a-aebb-c56e05fc34af\">E a\u00ed, o que acontece?\ud83d\udca5 <strong>Indisponibilidade., <\/strong>\ud83d\udd25 <strong>Falha em cascata e <\/strong>se voc\u00ea ainda colocou retry autom\u00e1tico pra &#8220;ser resiliente&#8221;, a\u00ed \u00e9 que o caos se espalha de vez \u2014 o sistema come\u00e7a a se afogar em si mesmo (spoiler: tenho uma aula de quase 1 hora s\u00f3 sobre <em>retry<\/em> l\u00e1 no CaD, porque esse \u00e9 um dos temas que se n\u00e3o estiver bem implementado pode gerar um problema enorme).<\/p>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"1cf14600-107e-8046-9e13-cf388cd1b120\">Mas Douglas, n\u00e3o d\u00e1 pra escalar?<br><\/h3>\n\n\n\n<p id=\"1cf14600-107e-8099-a936-c25b34e51673\">At\u00e9 d\u00e1\u2026 <strong>se der tempo, <\/strong>por\u00e9m o que geralmente vejo nos clientes e arquiteturas que o tempo de escalar \u00e9 maior do que o rebalanceamento da carga dos usu\u00e1rios entre a zona com problema para as outras.<strong><br><\/strong><\/p>\n\n\n\n<p id=\"1cf14600-107e-803e-bcf4-de53290bff39\">Se o tr\u00e1fego redirecionado pras outras AZs for intenso, e seu autoscaling demorar a responder, a sobrecarga j\u00e1 bateu. CPU vai a 100%, threads travam, fila estoura. Voc\u00ea j\u00e1 viu esse filme, n\u00e9?<\/p>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"1cf14600-107e-8050-98d0-f9fc81d99b1c\">Ent\u00e3o o que \u00e9 um sistema est\u00e1vel estaticamente?<\/h3>\n\n\n\n<p id=\"1cf14600-107e-807b-829b-e496efda2f16\">\u00c9 um sistema onde <strong>cada peda\u00e7o<\/strong> (ex: cada AZ) <strong>tem capacidade m\u00ednima de operar sozinho<\/strong> em caso de falha alheia.<br><\/p>\n\n\n\n<p id=\"1cf14600-107e-8010-a953-e95539f4825f\">Ou seja, se uma zona cair, as outras ir\u00e3o conseguir comportar a carga total sem ultrapassar 100%.<br><br>Ou seja, em caso de ter 3 datacenters, garanta que eles estar\u00e3o operando no maixmo at\u00e9 60%, assim se um cair, os outros dois ir\u00e3o para 90% e iniciar\u00e3o o processo de escalar novos recursos nas AZs que n\u00e3o estiverem desligadas.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"1cf14600-107e-8065-abe3-d7941441f17e\">Para concluir,<\/h3>\n\n\n\n<p id=\"1cf14600-107e-802e-8804-fdab776cc413\">Conforme prometido, segue meu v\u00eddeo no youtube sobre esse tema e se voc\u00ea tiver interesse em aprender mais sobre arquitetura de software em um n\u00edvel bem mais aprofundado, venha fazer parte da <strong>Comunidade de Arquitetura Descomplicada (CaD)<\/strong>! Saiba mais em <a href=\"https:\/\/mugnos-it.com\/pt\/cad\/\">https:\/\/mugnos-it.com\/cad\/<\/a> \ud83d\ude80\ud83d\udea8<\/p>\n\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t<div class=\"elementor-element elementor-element-11d5c5d e-flex e-con-boxed e-con e-parent\" data-id=\"11d5c5d\" data-element_type=\"container\">\n\t\t\t\t\t<div class=\"e-con-inner\">\n\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<\/div>","protected":false},"excerpt":{"rendered":"<p>Hoje eu quero te trazer uma reflex\u00e3o que, se voc\u00ea ainda n\u00e3o teve, provavelmente vai ter em breve \u2013 especialmente se voc\u00ea trabalha (ou quer trabalhar) com sistemas distribu\u00eddos, alta disponibilidade ou ambientes em cloud. Afinal\u2026 usar um, dois ou at\u00e9 tr\u00eas data centers realmente deixa sua aplica\u00e7\u00e3o mais resiliente e consequentemente aumenta sua SLA [&hellip;]<\/p>","protected":false},"author":3,"featured_media":1897,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"_jetpack_memberships_contains_paid_content":false,"footnotes":""},"categories":[1],"tags":[],"class_list":["post-1513","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-uncategorized"],"aioseo_notices":[],"jetpack_featured_media_url":"https:\/\/mugnos-it.com\/wp-content\/uploads\/2025\/04\/09.-Estabilidade-Estatica-Sua-Infraestrutura-e-Resiliente-de-Verdade.png","jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/mugnos-it.com\/pt\/wp-json\/wp\/v2\/posts\/1513","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/mugnos-it.com\/pt\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/mugnos-it.com\/pt\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/mugnos-it.com\/pt\/wp-json\/wp\/v2\/users\/3"}],"replies":[{"embeddable":true,"href":"https:\/\/mugnos-it.com\/pt\/wp-json\/wp\/v2\/comments?post=1513"}],"version-history":[{"count":4,"href":"https:\/\/mugnos-it.com\/pt\/wp-json\/wp\/v2\/posts\/1513\/revisions"}],"predecessor-version":[{"id":2040,"href":"https:\/\/mugnos-it.com\/pt\/wp-json\/wp\/v2\/posts\/1513\/revisions\/2040"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/mugnos-it.com\/pt\/wp-json\/wp\/v2\/media\/1897"}],"wp:attachment":[{"href":"https:\/\/mugnos-it.com\/pt\/wp-json\/wp\/v2\/media?parent=1513"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/mugnos-it.com\/pt\/wp-json\/wp\/v2\/categories?post=1513"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/mugnos-it.com\/pt\/wp-json\/wp\/v2\/tags?post=1513"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}