Du må være registrert og logget inn for å kunne legge ut innlegg på freak.no
X
LOGG INN
... eller du kan registrere deg nå
Dette nettstedet er avhengig av annonseinntekter for å holde driften og videre utvikling igang. Vi liker ikke reklame heller, men alternativene er ikke mange. Vær snill å vurder å slå av annonseblokkering, eller å abonnere på en reklamefri utgave av nettstedet.
  3 4053
Heisann!

Jeg skal gå til innkjøp av et nytt NAS, og ser i den anledning på litt forskjellige oppsett.

En av tingene jeg ønsker å finne ut av er hvor stor sannsynlighet det er for at ting går til helvete med forskjellige konfigurasjoner.

Før jeg starter med oppgaven vil jeg påpeke at jeg har valgt å se bort i fra følgende:
- At diskene blir dårligere over tid, og at sannsynligheten for at de dør blir høyere jo mer disken er i bruk
- At diskene blir stresset mer under evt. rebuild av degradert RAID
- At RAID-kontrolleren kan dø, og generelt andre faktorer som ikke omhandler selve diskene

-----------------------

Oppgave:

Jeg har plukket ut 2 forskjellige disker med forskjellig kapasitet og gjennomsnittlig feilrate (årlig):
4000GB = 2,14% sannsynlighet for å dø i løpet av et år
6000GB = 5,71% sannsynlighet for å dø i løpet av et år

Jeg har også sett meg ut 2 forskjellige NAS, med henholdsvis 16 og 24 brønner.

Mulige oppsett blir da:

Kode

1: 16 x 4000GB
2: 16 x 6000GB
3: 24 x 4000GB
4: 24 x 6000GB

Hvordan finner jeg ut sannsynligheten for at henholdsvis 0, 1, 2 og 3 disker dør i løpet av det første året i de forskjellige oppsettene?

Jeg har gjort det forsøk på å finne ut 0 og "minst 1", men jeg vet ikke om mine svar er riktige, og jeg har null idé om hvordan jeg finner ut 1, 2 og 3:

Kode

Sannsynlighet for at 0 disker dør:
1: 16 x 4000GB   |   (1-0,0214)^16 = ~70%
2: 16 x 6000GB   |   (1-0,0571)^16 = ~39%
3: 24 x 4000GB   |   (1-0,0214)^24 = ~59%
4: 24 x 6000GB   |   (1-0,0571)^24 = ~24%



Sannsynlighet for at MINST 1 disk dør:
1: 16 x 4000GB   |   100% - 70% = 30%
2: 16 x 6000GB   |   100% - 39% = 61%
3: 24 x 4000GB   |   100% - 59% = 41%
4: 24 x 6000GB   |   100% - 24% = 76%

Jeg har gjort et forsøk på å finne ut av sannsynligheten for at 1 disk ryker det første året, men den utregningen passer ikke med utregningen ovenfor i det hele tatt:

Kode

Sannsynlighet for at 1 disk dør:
1: 16 x 4000GB   |   2,14 * 16 = ~34%
2: 16 x 6000GB   |   5,71 * 16 = ~91%
3: 24 x 4000GB   |   2,14 * 24 = ~51%
4: 24 x 6000GB   |   5,71 * 24 = ~137%
Er jeg helt på tur? En av utregningene må i alle fall være feil.
Kunne noen dyttet meg litt i riktig retning?
Her skal du bruke binomisk sannsynlighetsregning (bildene nedenfor er hentet fra wikipediasiden):

Sannsynligheten for at eksakt k av n disker feiler, gitt en feilrate p er da:



hvor




Eksempel: 2 av 16 4TB disker feiler i løper av et år:

Pr(X=2) = 16! / (2!*14!) * 0.0214^2 * (1-0.0214)^14 = 0.0405 = 4.05 %

Vil du finne sannsynligheten for at K eller færre disker feiler i løpet av et år, summerer du bare alle sannsynlighetene fra k=0 til k=K.

(et lite forbehold om feil, det er lenge siden jeg regnet sannsynlighet)

Lagde et regneark til deg. Setter du Cummulative til False får du sannsynligheten for at eksakt i disker feiler. Setter du den til True, får du sannsynligheten for at 0 til i disker feiler.

https://docs.google.com/spreadsheets...it?usp=sharing
Sist endret av steili; 16. januar 2017 kl. 16:46. Grunn: Automatisk sammenslåing med etterfølgende innlegg.
curx's Avatar
Trådstarter Donor
Sitat av steili Vis innlegg
Her skal du bruke binomisk sannsynlighetsregning (bildene nedenfor er hentet fra wikipediasiden):

Sannsynligheten for at eksakt k av n disker feiler, gitt en feilrate p er da:



hvor




Eksempel: 2 av 16 4TB disker feiler i løper av et år:

Pr(X=2) = 16! / (2!*14!) * 0.0214^2 * (1-0.0214)^14 = 0.0405 = 4.05 %

Vil du finne sannsynligheten for at K eller færre disker feiler i løpet av et år, summerer du bare alle sannsynlighetene fra k=0 til k=K.

(et lite forbehold om feil, det er lenge siden jeg regnet sannsynlighet)

Lagde et regneark til deg. Setter du Cummulative til False får du sannsynligheten for at eksakt i disker feiler. Setter du den til True, får du sannsynligheten for at 0 til i disker feiler.

https://docs.google.com/spreadsheets...it?usp=sharing
Vis hele sitatet...
En ting som er helt klart er at dette er langt forbi den matematikken jeg hadde på barneskolen!

I Excel-arket ser jeg at sannsynligheten er større for at en disk skal dø i gruppen 16x6TB enn i 24x6TB. Henholdsvis 38% og 35%.
Hvordan er dette mulig?
Sitat av curx Vis innlegg
En ting som er helt klart er at dette er langt forbi den matematikken jeg hadde på barneskolen!

I Excel-arket ser jeg at sannsynligheten er større for at en disk skal dø i gruppen 16x6TB enn i 24x6TB. Henholdsvis 38% og 35%.
Hvordan er dette mulig?
Vis hele sitatet...
Grunnen til dette ser du i sannsynligheten for at to disker feiler. Denne er mye høyere når du har 24 enn når du har 16 disker, så denne "spiser opp" en del av kaken fra sannsynligheten for at eksakt en disk feiler. (tror jeg)

Forøvrig er det trivielt å finne forventningsverdien (hvor mange disker man forventer at feiler i løpet av ett år) i en binomisk sannsynlighetsfordeling. Denne er ganske enkelt p*N, for eksempel forventer man at 0.0214 * 24 = 0.51 disker feiler pr. år i et 4TB*24 konfigurasjon. Jo flere disker du har, jo sikrere kan du være på at dette tallet kommer til å stemme relativt bra med virkeligheten.