View Single Post
Gjest
Trådstarter
198
Sitat av DumDiDum Vis innlegg
Hupp. Har en mastergrad i statistikk fra UiT, er sivil ingeniør i data teknikk og rimelig habil på Python. Stiller du spørsmålet åpent svarer jeg gratis.


Jeg antar du ikke har drevet med sampling fra forskjellige sannsynlighetsfordelinger selv her?

1. R er desidert enkleste for alt som har med statistikk og sannsynligheter å gjøre. Sliter veldig så fort man har data som ikke passer inn i matriser.
2. Python med sklearn og numpy er ålreit nok for statistikk, men vinner overlegent på maskin-læring, fleksibilitet og listehåndtering. Trygt valg for det meste.
3. Matlab er desidert enklest for matematikk og alt som inneholder matrisemultiplikasjon, men virkelig ikke beste alternativet på statistikk.
Vis hele sitatet...
Et praktisk eksempel: UiT har 6000 registrerte studenter. Daglig så går i gjennomsnitt 4000 inn døra til universitet. Vi vet at flesteparten av disse 4000 drar inn dit på morgenen(mellom 07.00 og 09.00), og færre og færre utover dagen og kvelden. Så med andre ord, så har vi en høy "terksel/topp" på morgenen som avtar senere på dagen som nevnt.

4000/ 24 = 166.66, altså 166.66 går inn i timen
166.66/60= 2,777, altså 2,777 går inn i minuttet
2,777/60 = 0,0462, 0,0462 går inn i sekundet.

Da vet vi gj.snittet der.

Så kan vi spørre: Hva er sjansen for at mellom kl 07.00-09.00, så har 2500 studenter gått inn?
- Og hvordan vil fordeling være resten av dagen?