Digitalização sem um plano de continuidade de negócios? Esqueça!

A continuidade do negócio desempenha um papel cada vez mais importante num mundo VUCA

A digitalização dos processos empresariais deverá levá-los a proporcionar uma melhor experiência e a tornar-se mais eficientes. No entanto, estes benefícios levam frequentemente também a que os interessados se tornem cada vez mais dependentes dos sistemas informáticos utilizados. Neste artigo, destaco, portanto, o cada vez mais importante, mas também muitas vezes esquecido ou apenas tecnicamente abordado tópico de continuidade de negócios.

Mais alto, mais longe, mais rápido: este é o credo de muitas iniciativas de digitalização que estão actualmente a ser lançadas a muitos níveis da nossa sociedade. Os sistemas informáticos estão a desempenhar um papel cada vez mais central neste contexto, quer se trate de pagar independentemente na caixa do supermercado, reservar uma viagem de férias, ir ao médico (o que por vezes já não é necessário) ou mesmo eleger um novo governo. Assim, os utilizadores destes sistemas informáticos dependem cada vez mais do seu correcto funcionamento – por vezes até em demasia. Abordar a questão da continuidade do negócio (Business Continuity) contribui, entre outras coisas, para responder a esta expectativa.

A digitalização aumenta frequentemente a complexidade do sistema no seu conjunto

No entanto, para todas as vantagens do tratamento de processos (potencialmente críticos) de criação de valor através de sistemas informáticos, existe uma grande desvantagem: a complexidade adicional que resulta da utilização das pilhas de software e/ou hardware necessárias. Isto significa que os processos empresariais digitalizados podem ser potencialmente perturbados ou mesmo interrompidos mais facilmente. O princípio da esperança não deve ser aplicado aqui: É apenas uma questão de tempo até os sistemas informáticos falharem ou os “adereços” mudarem abruptamente e potencialmente perturbadores, afectando o seu funcionamento – infelizmente muitas vezes não para melhor.

Um bom exemplo é a paragem que ocorreu na Meta (anteriormente Facebook) este ano: não só os serviços amplamente utilizados WhatsApp, Facebook e Instagram já não eram acessíveis, como os funcionários da Meta já nem sequer podiam entrar em certos edifícios da empresa e salas de conferência ou enviar e-mails externos. Um “golpe completo”, por assim dizer.

Trafficvolumen in bits für Facebook-Services am 04.10.2021 - Facebook Outage 2021
Volume de tráfego em bit/s para serviços do Facebook em 04.10.2021 (CC BY 4.0) Fonte: https://en.wikipedia.org/wiki/2021_Facebook_outage. Recuperado em: 28.12.2021

Como é que o problema foi finalmente resolvido? Há rumores de que uma equipa de técnicos teve de ser enviada para um centro de dados na Califórnia para reiniciar manualmente os servidores afectados. Um exemplo deslumbrante, então, de uma falha abrupta do sistema (que, como se verificou, se deveu a uma mudança de configuração) que teve profundas implicações globais e cuja abordagem e eventual resolução foi gerida por processos que tiveram de ser estabelecidos, em parte, numa base ad hoc. Um belo exemplo de continuidade de negócios.

O que é a Continuidade dos Negócios (“Business Continuity”)?

O termo “business continuity” descreve a capacidade de uma empresa ou organização para continuar a fornecer produtos ou serviços numa medida pré-determinada, caso ocorra um evento perturbador.

Na maioria dos casos, um evento perturbador não é uma simples falha de um sistema informático (por exemplo, a falha do sistema de acesso num local da empresa não deve ser necessariamente considerada como tal, embora seja também potencialmente perturbadora), mas sim um evento que leva à deterioração abrupta de cadeias de valor inteiras. Um exemplo é a actual variante “Omicron” da SRA-CoV-2, que causou o cancelamento de milhares de voos em todo o mundo durante as férias de Natal, porque o pessoal de voo infectado teve de entrar em quarentena.

Identificar e dar prioridade aos riscos

“Primeiro, pensa-se melhor e segundo, as coisas saem de forma diferente”. Esta variação do ditado popular destina-se a assinalar que, normalmente, vale a pena tomar precauções para eventos perturbadores. Mesmo que o evento difira em teoria cinzenta e em realidade “colorida”, sensibilizou-se pelo menos os funcionários para a sua ocorrência e, se necessário, procurou-se mesmo os recursos necessários que não seriam facilmente acessíveis no caso de uma catástrofe. O exemplo das máscaras de protecção no início da pandemia acima referida é certamente familiar a todos, mas o que dizer, por exemplo, da aquisição de geradores de energia de emergência, a fim de poder continuar a operar os sistemas centrais em caso de falhas ou interrupções de energia?

Por conseguinte, a base mais importante para a continuidade do negócio é que os eventos perturbadores sejam reconhecidos, analisados e geridos em toda a empresa. No caso mais simples, mantém-se uma lista actualizada dos eventos potenciais, dos seus efeitos e das medidas adequadas para os limitar em caso de emergência. A melhor maneira de compilar tal lista é consultar tanto fontes oficiais, gerais e análises sectoriais específicas e complementá-las com eventos de risco que tenham sido identificados a nível da organização. A categorização dos eventos, por exemplo em categorias como “social”, “político” ou “técnico”, torna-os mais fáceis de manter e comunicar.

Sejamos realistas: uma vez que a preparação para eventos hipotéticos não é da natureza dos seres humanos e, consequentemente, não de grupos de seres humanos, vale a pena quando se implementam medidas para os planear com base numa hierarquização dos riscos associados. Desta forma, os recursos podem ser concentrados e o esforço necessário para implementar as medidas pode ser mantido reduzido, tornando mais provável que os fundos apropriados sejam disponibilizados.

Por exemplo, uma simples estimativa da criticalidade para um único evento pode ser feita da seguinte forma:

Evento de criticidade = probabilidade de ocorrência do evento (por exemplo, por ano) x impacto do evento (por exemplo, financeiro ou como uma métrica alternativa).

Para uma lista de eventos, pode-se assim estimar individualmente a sua criticidade e dar prioridade à implementação das medidas que afectam os eventos mais críticos. Por exemplo: Uma avaliação global de eventos perturbadores para uma empresa fictícia mostrou que os riscos “falta de energia” e “problemas de entrega de componentes semicondutores” devem ser classificados como os mais críticos.

As medidas derivadas “compra de geradores de energia de emergência” e “constituição de reservas de componentes semicondutores” devem ser implementadas em conformidade, como prioridade, e os projectos correspondentes devem ser lançados. As medidas para outros eventos perturbadores serão tomadas mais tarde ou, se a sua criticidade tiver sido melhorada, avançarão no tempo (ver abaixo).

Derivar e implementar medidas como um processo contínuo

Agora, naturalmente, coloca-se a questão de saber que medidas podem ser tomadas para assegurar a continuidade suficiente das actividades quando o respectivo evento ocorrer. Tal como mencionado no início, isto requer várias medidas que descrevem até que ponto os processos de criação de valor afectados continuam a fornecer produtos ou serviços.

As abordagens possíveis aqui são a definição de parâmetros de qualidade relacionados com a qualidade do produto ou serviço, e a definição de períodos de tempo dentro dos quais o processo de criação de valor restrito deve ser restaurado. Para este último, o chamado Objectivo de Tempo de Recuperação (Recovery Time Objective – RTO) e Objectivo de Ponto de Recuperação (Recovery Point Objective – RPO) são particularmente bem conhecidos, mas não se deve fugir à criação da própria métrica.

Que tipos de medidas podem ser tomadas? Podem ser tomadas medidas para assegurar a continuidade das actividades a vários níveis, por exemplo, aos seguintes níveis

  • Nível organizacional
  • organização do processo ou nível do processo
  • nível técnico
  • nível legal

embora outros tipos de medidas, por exemplo a nível da comunicação empresarial, sejam também inteiramente possíveis.

Exemplo de categorização dos riscos globais pelo Fórum Económico Mundial (WEF)
Exemplo de categorização dos riscos globais pelo Fórum Económico Mundial (WEF)

As organizações do sector das TIC em particular tendem frequentemente a concentrar-se em medidas técnicas e negligenciam outros aspectos. Neste contexto, é extremamente importante que os planos de continuidade de negócios (BCP) sejam elaborados e implementados da forma mais holística possível, pois de outra forma não é possível garantir a manutenção da plena criação de valor.

Deixem-me dar-vos um exemplo: A integração de encomendas online na aplicação móvel da sua loja online fictícia resultou numa grande proporção de utilizadores que agora a utilizam para fazer encomendas. Numa sexta-feira à tarde má, a sua linha directa de apoio recebe subitamente pilhas de chamadas de pessoas que se queixam de já não poderem colocar encomendas na aplicação móvel.

Depois de algumas idas e vindas, verifica-se que a sua plataforma de encomendas, que é alojada por um fornecedor de nuvens, foi afectada por uma interrupção. A situação só se atenua durante a tarde de sábado quando o fornecedor anuncia que as perturbações na Zona de Disponibilidade (AZ) onde a sua plataforma de encomendas está alojada foram resolvidas. Claro que nesta altura já houve numerosas queixas (também de natureza “não divulgada” nas redes sociais) e muitos clientes decidiram encomendar noutros locais. O prejuízo financeiro é considerável.

Que medidas poderia ter tomado antecipadamente para fazer face a este risco em termos de continuidade do negócio? A nível técnico, teria certamente sido vantajoso se a sua organização operacional tivesse sido informada sobre a perturbação no fornecedor da nuvem numa fase inicial (por exemplo, através de notificações correspondentes) e, além disso, se a sua plataforma de encomendas tivesse sido alojada em diferentes AZs.

Além disso, se tivesse existido um processo correspondente, o apoio poderia ter sido informado sobre a interrupção existente, a fim de poder fornecer informações directamente aos clientes que telefonam e possivelmente oferecer-lhes uma opção alternativa de encomenda (por exemplo, através de formulário web).

Por último, mas não menos importante, poderia ter – assumimos que se trata de uma solução COTS – assegurado no contrato de manutenção da sua plataforma de encomendas que quaisquer falhas de serviço seriam compensadas financeiramente. Nesta altura, você e eu pensaríamos certamente em outras medidas. Mas tenha também em mente aqui: Nem todas as medidas têm o mesmo efeito, e é por isso que estas também devem ser consideradas prioritárias.

Derivar e implementar medidas como um processo contínuo

Deve ter notado que derivar e implementar medidas de continuidade de negócios não é uma questão trivial, mas leva algum tempo. Mas ainda fica pior: uma vez que a natureza dos acontecimentos que ameaçam a criação de valor de uma organização muda continuamente, não é suficiente derivar e implementar medidas apenas uma vez. É melhor encarar a continuidade do negócio e a sua garantia através de medidas como um processo contínuo que assume a forma de um ciclo de deming.

Consequentemente, deve seguir o modelo simples Plano – Fazer – Verificar – Agir e verificar regularmente a relevância e eficácia das suas medidas e corrigi-las, se necessário. Estou ciente de que esta não é uma tarefa fácil e, em alguns casos, simplesmente não é possível. No entanto, mesmo exercícios de emergência isolados – no caso acima referido, por exemplo, uma manutenção da plataforma de encomendas que não foi dada a conhecer à organização de apoio – pode já ajudar a verificar a qualidade da implementação de uma medida. Em resumo: Fique atento.

A continuidade do negócio é cada vez mais importante num mundo VUCA

O acrónimo “VUCA“, que significa “Volatilidade, Incerteza, Complexidade, Ambiguidade”, é frequentemente utilizado para descrever o estado actual do nosso mundo. Não é necessariamente necessário ser pessimista para associar alguma verdade a esta caracterização. É precisamente este ambiente dinâmico e cada vez mais imprevisível, aliado ao aumento da complexidade técnica que acompanha a digitalização, que está a tornar o tema da continuidade do negócio cada vez mais importante para organizações de todas as dimensões. Por isso, fique atento – mesmo pequenos passos contam.

Was Georg Hauzenberger antreibt, ist das Schaffen von Mehrwert für die Allgemeinheit durch neue Denkansätze und Werkzeuge. Neue Technologien sind dabei Nebensache. Georg suchte früh Disruption, als er aus einem geisteswissenschaftlichen Fokus an die ETH Zürich wechselte. Er verschrieb sich danach der Innovation. Momentan treibt er bei der Schweizerischen Rettungsflugwacht Rega die Digitalisierung des Rettungswesens und deren agile Transformation voran.

Comentários estão fechados.

This website uses cookies to improve your experience. We'll assume you're ok with this, but you can opt-out if you wish. Accept Read More