View Single Post
For det første skinner det igjennom at du ikke har lest deg opp, da antall variabler vil bestemme om du skal bruke multipel eller singel regresjon. Så til selve problemet - gjør du dette for moro ellre noe du tror er lurt å bruke? Statistikk og maskinlæring skiller primært på to ting, og det er at statistikk er deskriptivt brukt for å finne mulige forklaringer, mens maskinlæring er prediktivt. Jeg antar du her vil benytte deg av muligheten til å spå fremtiden, men det som er maskinlæringens store fordel er at man dytter inn data og finner mønstre man ikke ville tenkt på tradisjonelt fordi man lar maskiner kverne statistikken. Så i dette tilfellet vil du f.eks aldri komme noen vei med å se på historie så simpelt, du må legge til ting som overganger, poster på sosiale medier, og andre faktorer som er tenkelig at påvirker et lag. Dette er både styrken og feilen med maskinlæring - vi er sjeldent interessert i de åpenbare og enkle sammenhengen til historien, vi vil spå og ser etter mønstre som ikke er åpenbare. For å forstå litt mer, kan du f.eks høre på Data Skeptic podcasten, som går igjennom algoritmer og intervjuer folk i bransjen. For de som driver med dette er det i overkant enkelt og åpenbart, men for å prøve å forstå konseptene er den flott.