View Single Post
Du sier at selv 10 minutter nedetid er for mye, og da kan vi fastslå at en failover-løsning er poengløst. Du vil aldri kunne reagere kjapt nok til det, med mindre du ønsker å åpne deg selv opp for datatap og "split brain"-problematikk. Det er ingen garanti mot datatap hos f.eks. Amazon. Du er rett og slett nødt til å ta en impact analyse og se hvor mye nedetid dere kan overleve med manuelle prosesser og hvor mye datatap dere kan takle. Ingen av tallene kan være null.

Det sagt - det største problemet med tjenester som AWS er at de som setter det opp ikke har nok kunnskap, eller at det skjer noe som er helt utenfor din kontroll. Det er fint med et system som automatisk balanserer seg selv, men det er ikke så fint hvis backend systemene henger seg opp så du ikke får skalert opp. Det har skjedd hos bl.a. Azure, Google Cloud og Amazon relativt nylig. Og det er ingenting du kan gjøre når det skjer.

Plan for failure, og husk at automatic recovery stort sett betyr automatisk datatap.