{"id":2450,"date":"2026-02-11T10:30:00","date_gmt":"2026-02-11T10:30:00","guid":{"rendered":"https:\/\/mugnos-it.com\/?p=2450"},"modified":"2026-02-11T11:57:16","modified_gmt":"2026-02-11T11:57:16","slug":"error-budget-funciona-mesmo-ou-so-no-papel","status":"publish","type":"post","link":"https:\/\/mugnos-it.com\/pt\/error-budget-funciona-mesmo-ou-so-no-papel\/","title":{"rendered":"Error Budget\u2026 funciona mesmo ou s\u00f3 no papel?"},"content":{"rendered":"<div data-elementor-type=\"wp-post\" data-elementor-id=\"2450\" class=\"elementor elementor-2450\" data-elementor-post-type=\"post\">\n\t\t\t\t<div class=\"elementor-element elementor-element-59d96eca e-flex e-con-boxed e-con e-parent\" data-id=\"59d96eca\" data-element_type=\"container\">\n\t\t\t\t\t<div class=\"e-con-inner\">\n\t\t\t\t<div class=\"elementor-element elementor-element-5d47e2c6 elementor-widget elementor-widget-text-editor\" data-id=\"5d47e2c6\" data-element_type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t\n<p>Quando a gente come\u00e7a a estudar SRE, Error Budget aparece como um dos conceitos mais importantes. Ele \u00e9 apresentado como o mecanismo que equilibra inova\u00e7\u00e3o e confiabilidade. Mas, sendo bem honesto, mesmo depois de passar por empresas grandes, multinacionais, com produtos extremamente cr\u00edticos, eu sempre tive dificuldade de ver o Error Budget sendo aplicado <em>de fato<\/em>, com esse nome e com essa disciplina.<\/p>\n\n\n\n<p>Antes de discutir se ele funciona ou n\u00e3o, vale dar um passo atr\u00e1s e alinhar: <strong>o que \u00e9, na pr\u00e1tica, um Error Budget?<\/strong><\/p>\n\n\n\n<p>De forma simples, o Error Budget nasce do SLO.<\/p>\n\n\n\n<p>Se um servi\u00e7o tem um SLO de <strong>99.9% de sucesso<\/strong>, isso significa que ele pode falhar <strong>0.1%<\/strong> do tempo ou das requisi\u00e7\u00f5es. Esse 0.1% \u00e9 o chamado <em>or\u00e7amento de erro(Aka. Error Budget)<\/em>.<\/p>\n\n\n\n<p>Ele existe para responder a uma pergunta muito concreta:<\/p>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p><strong>Quanto de falha esse sistema pode \u201cgastar\u201d sem comprometer o neg\u00f3cio?<\/strong><\/p>\n<\/blockquote>\n\n\n\n<p>Ok, ok\u2026 eu sei \ud83d\ude05 na vida real, o neg\u00f3cio quer <strong>24&#215;7<\/strong>, mesmo quando ele opera <strong>8&#215;5<\/strong>.<\/p>\n\n\n\n<p>Ningu\u00e9m \u201caceita\u201d falha \u2014 pelo menos no discurso.<\/p>\n\n\n\n<p>Mas o Error Budget existe justamente para tirar a conversa do campo do <em>desejo<\/em> e trazer datapoints reais.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Um exemplo r\u00e1pido (com analogia)<\/h3>\n\n\n\n<p>Pense no Error Budget como o <strong>limite do cart\u00e3o de cr\u00e9dito<\/strong>.<\/p>\n\n\n\n<p>Voc\u00ea n\u00e3o quer estourar o limite mensal.<\/p>\n\n\n\n<p>Mas ele existe justamente porque, em algum momento, voc\u00ea <em>vai<\/em> usar.<\/p>\n\n\n\n<p>Se o seu limite \u00e9 R$ 1.000:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>gastar R$ 50 \u00e9 tranquilo,<\/li>\n\n\n\n<li>gastar R$ 900 j\u00e1 muda completamente o seu comportamento.<\/li>\n<\/ul>\n\n\n\n<p>Voc\u00ea sabe que precisa ser mais cauteloso.<\/p>\n\n\n\n<p>J\u00e1 n\u00e3o d\u00e1 mais pra pedir uma <strong>Coca-Cola<\/strong>\u2026vai ter que ir de <strong>Dolly.<\/strong><\/p>\n\n\n\n<p>O Error Budget funciona do mesmo jeito.<\/p>\n\n\n\n<p>Ele n\u00e3o existe para incentivar falhas,<\/p>\n\n\n\n<p>mas para controlar quanto risco voc\u00ea pode assumir antes de precisar desacelerar.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Um exemplo r\u00e1pido (sem zuera agora hehe)<\/h3>\n\n\n\n<p>Imagine um servi\u00e7o que processa <strong>1.000.000 de requisi\u00e7\u00f5es por m\u00eas<\/strong>.<\/p>\n\n\n\n<p>Com um SLO de <strong>99.9%<\/strong>, o sistema pode falhar em at\u00e9:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>1.000 requisi\u00e7\u00f5es por m\u00eas<\/strong><\/li>\n<\/ul>\n\n\n\n<p>Esse n\u00famero n\u00e3o \u00e9 um alvo.<\/p>\n\n\n\n<p>Ele \u00e9 um <strong>limite de risco aceit\u00e1vel<\/strong>.<\/p>\n\n\n\n<p>Enquanto voc\u00ea estiver abaixo disso, voc\u00ea pode:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Fazer novos Deploys<\/li>\n\n\n\n<li>Aproveitar pra colocar aquela feature mais ousada<\/li>\n\n\n\n<li>enfim assumir mais risco. (olha s\u00f3 aqui esta o principio de \u201cEmbracing risk\u201d )<\/li>\n<\/ul>\n\n\n\n<p>Se esse n\u00famero for ultrapassado, o comportamento deveria mudar:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>menos mudan\u00e7as,<\/li>\n\n\n\n<li>mais foco em estabilidade,<\/li>\n\n\n\n<li>corre\u00e7\u00e3o de causas raiz.<\/li>\n<\/ul>\n\n\n\n<p>Na teoria, isso cria um acordo saud\u00e1vel entre produto e engenharia.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">O que acontece na pr\u00e1tica?<\/h2>\n\n\n\n<p>Na maioria das empresas, o nome <em>Error Budget<\/em> nunca aparece.<\/p>\n\n\n\n<p>Mas o comportamento\u2026 sim.<\/p>\n\n\n\n<p>\u00c9 muito comum ver:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>freeze windows depois de falhas,<\/li>\n\n\n\n<li>bloqueios de deploy,<\/li>\n\n\n\n<li>semanas \u201cs\u00f3 estabilizando\u201d.<\/li>\n<\/ul>\n\n\n\n<p>O sistema \u201cj\u00e1 falhou demais, agora n\u00e3o pode mais falhar\u201d.<\/p>\n\n\n\n<p>Isso \u00e9 Error Budget, por\u00e9m implementado sem acordo e baseado em press\u00e3o, percep\u00e7\u00e3o e crise \u2014 n\u00e3o em datapoints como deveria ser<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Qual o real valor de utilizar \u201cerror budgets\u201d<\/h2>\n\n\n\n<p>Existe algo importante que quase nunca aparece quando falamos de Error Budget:<\/p>\n\n\n\n<p>ele n\u00e3o \u00e9 s\u00f3 um c\u00e1lculo, nem um n\u00famero para ser seguido religiosamente.<\/p>\n\n\n\n<p>Na pr\u00e1tica, o maior valor do Error Budget n\u00e3o \u00e9 matem\u00e1tico \u2014 \u00e9 <strong>cultural e psicol\u00f3gico<\/strong>.<\/p>\n\n\n\n<p>Mesmo que o neg\u00f3cio n\u00e3o concorde 100%, quando voc\u00ea define um SLO e um Error Budget como meta para o time de TI, voc\u00ea cria um novo jeito de pensar o sistema.<\/p>\n\n\n\n<p>As pessoas come\u00e7am a se perguntar:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>\u201cComo eu fa\u00e7o esse deploy de forma mais segura?\u201d<\/li>\n\n\n\n<li>\u201cSer\u00e1 que preciso mesmo de uma janela de 4 horas?\u201d<\/li>\n\n\n\n<li>\u201cD\u00e1 pra fazer isso de forma gradual?\u201d<\/li>\n\n\n\n<li>\u201cE se eu errar, quanto isso ir\u00e1 consumir o or\u00e7amento mensal?\u201d<\/li>\n<\/ul>\n\n\n\n<p>De repente, um downtime planejado de 4 horas deixa de ser algo \u201cnormal\u201d e passa a ser visto como algo caro. Afinal, isso pode representar metade do Error Budget do m\u00eas inteiro.<\/p>\n\n\n\n<p>E a\u00ed o comportamento muda.<\/p>\n\n\n\n<p>Em vez de:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>updates in place,<\/li>\n\n\n\n<li>mudan\u00e7as grandes e arriscadas,<\/li>\n<\/ul>\n\n\n\n<p>as equipes come\u00e7am a pensar em:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>deploys graduais,<\/li>\n\n\n\n<li>canary,<\/li>\n\n\n\n<li>blue\/green,<\/li>\n\n\n\n<li>rollback r\u00e1pido,<\/li>\n\n\n\n<li>testes melhores,<\/li>\n\n\n\n<li>menos impacto para o usu\u00e1rio.<\/li>\n<\/ul>\n\n\n\n<p>O Error Budget n\u00e3o existe para travar inova\u00e7\u00e3o.<\/p>\n\n\n\n<p>Ele existe para <strong>elevar o padr\u00e3o de como a inova\u00e7\u00e3o ser\u00e1 entregue<\/strong>.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Para concluir..<\/h2>\n\n\n\n<p>No fim, Error Budget n\u00e3o \u00e9 sobre aceitar falhas.<\/p>\n\n\n\n<p>\u00c9 sobre aceitar a realidade dos sistemas complexos.<\/p>\n\n\n\n<p>Ele n\u00e3o existe para dizer \u201cquanto voc\u00ea pode errar\u201d,<\/p>\n\n\n\n<p>mas para for\u00e7ar uma pergunta muito mais dif\u00edcil:<\/p>\n\n\n\n<p><strong>como voc\u00ea vai mudar a forma de construir para n\u00e3o precisar errar tanto?<\/strong><\/p>\n\n\n\n<p>Se o seu time come\u00e7a a pensar em deploys melhores, estrat\u00e9gias mais seguras e menos impacto para o usu\u00e1rio, ent\u00e3o o Error Budget j\u00e1 est\u00e1 funcionando \u2014 mesmo que ningu\u00e9m chame assim.<\/p>\n\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t<div class=\"elementor-element elementor-element-3d09d49 e-flex e-con-boxed e-con e-parent\" data-id=\"3d09d49\" data-element_type=\"container\">\n\t\t\t\t\t<div class=\"e-con-inner\">\n\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<\/div>","protected":false},"excerpt":{"rendered":"<p>Quando a gente come\u00e7a a estudar SRE, Error Budget aparece como um dos conceitos mais importantes. Ele \u00e9 apresentado como o mecanismo que equilibra inova\u00e7\u00e3o e confiabilidade. Mas, sendo bem honesto, mesmo depois de passar por empresas grandes, multinacionais, com produtos extremamente cr\u00edticos, eu sempre tive dificuldade de ver o Error Budget sendo aplicado de [&hellip;]<\/p>","protected":false},"author":3,"featured_media":2451,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"_jetpack_memberships_contains_paid_content":false,"footnotes":""},"categories":[1],"tags":[],"class_list":["post-2450","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-uncategorized"],"aioseo_notices":[],"jetpack_featured_media_url":"https:\/\/mugnos-it.com\/wp-content\/uploads\/2026\/02\/image.png","jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/mugnos-it.com\/pt\/wp-json\/wp\/v2\/posts\/2450","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/mugnos-it.com\/pt\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/mugnos-it.com\/pt\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/mugnos-it.com\/pt\/wp-json\/wp\/v2\/users\/3"}],"replies":[{"embeddable":true,"href":"https:\/\/mugnos-it.com\/pt\/wp-json\/wp\/v2\/comments?post=2450"}],"version-history":[{"count":4,"href":"https:\/\/mugnos-it.com\/pt\/wp-json\/wp\/v2\/posts\/2450\/revisions"}],"predecessor-version":[{"id":2458,"href":"https:\/\/mugnos-it.com\/pt\/wp-json\/wp\/v2\/posts\/2450\/revisions\/2458"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/mugnos-it.com\/pt\/wp-json\/wp\/v2\/media\/2451"}],"wp:attachment":[{"href":"https:\/\/mugnos-it.com\/pt\/wp-json\/wp\/v2\/media?parent=2450"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/mugnos-it.com\/pt\/wp-json\/wp\/v2\/categories?post=2450"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/mugnos-it.com\/pt\/wp-json\/wp\/v2\/tags?post=2450"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}