Du må være registrert og logget inn for å kunne legge ut innlegg på freak.no
X
LOGG INN
... eller du kan registrere deg nå
Dette nettstedet er avhengig av annonseinntekter for å holde driften og videre utvikling igang. Vi liker ikke reklame heller, men alternativene er ikke mange. Vær snill å vurder å slå av annonseblokkering, eller å abonnere på en reklamefri utgave av nettstedet.
  2 3965
Hei, jeg var litt usikker på hvor jeg kunne plassere tråden, så derfor endte den opp her, men flytt den gjerne om admin føler det passer

Over til saken: Jeg har lest og sett videoer om maskin-læring, og har en grei basis forståelse for hva Lineær regresjon, SVM og KNN er, samt hvordan bruke dette i python med tensorflow biblioteket. Forsatt føler jeg at jeg sliter litt med å "bestemme" hvilken av teknikkene er best å bruke i hvilken situasjon?

For eksempel så er jeg er igang med å utvikle et lite script som skal gi en sannsynlighets beregning for hvor mange mål det kan skores i en fotball-kamp.(f.eks: 82% sjans for at denne kampen kan ende over 3 mål)

Jeg har fått inn tilstrekkelig med historisk data (både CSV og JSON), og med dette så kan jeg f.eks enkelt se:

Lag 1 hadde så så mange mål i sesong 2012,2013,2014 osv osv..
Lag 2 hadde så så mange mål i sesong 2012,2013,2014 osv osv..

Kampen spilt mellom Lag 1 og Lag 2 i sesong 2012 hadde: X mål
Kampen spilt mellom Lag 1 og Lag 2 i sesong 2013 hadde: X mål
.....
.....
.....


Spørsmålet er da, vil ikke lineær, eller multiple linær regresjon vært best her?

Altså: Hvilken maskinlærings teknikk er best å bruke i hvilken situasjon?

takker for svar.
Sist endret av Myoxocephalus; 28. august 2019 kl. 16:25. Grunn: Flyttet fra diskusjon til programmering
For det første skinner det igjennom at du ikke har lest deg opp, da antall variabler vil bestemme om du skal bruke multipel eller singel regresjon. Så til selve problemet - gjør du dette for moro ellre noe du tror er lurt å bruke? Statistikk og maskinlæring skiller primært på to ting, og det er at statistikk er deskriptivt brukt for å finne mulige forklaringer, mens maskinlæring er prediktivt. Jeg antar du her vil benytte deg av muligheten til å spå fremtiden, men det som er maskinlæringens store fordel er at man dytter inn data og finner mønstre man ikke ville tenkt på tradisjonelt fordi man lar maskiner kverne statistikken. Så i dette tilfellet vil du f.eks aldri komme noen vei med å se på historie så simpelt, du må legge til ting som overganger, poster på sosiale medier, og andre faktorer som er tenkelig at påvirker et lag. Dette er både styrken og feilen med maskinlæring - vi er sjeldent interessert i de åpenbare og enkle sammenhengen til historien, vi vil spå og ser etter mønstre som ikke er åpenbare. For å forstå litt mer, kan du f.eks høre på Data Skeptic podcasten, som går igjennom algoritmer og intervjuer folk i bransjen. For de som driver med dette er det i overkant enkelt og åpenbart, men for å prøve å forstå konseptene er den flott.
Sitat av Xasma Vis innlegg
For det første skinner det igjennom at du ikke har lest deg opp, da antall variabler vil bestemme om du skal bruke multipel eller singel regresjon. Så til selve problemet - gjør du dette for moro ellre noe du tror er lurt å bruke? Statistikk og maskinlæring skiller primært på to ting, og det er at statistikk er deskriptivt brukt for å finne mulige forklaringer, mens maskinlæring er prediktivt. Jeg antar du her vil benytte deg av muligheten til å spå fremtiden, men det som er maskinlæringens store fordel er at man dytter inn data og finner mønstre man ikke ville tenkt på tradisjonelt fordi man lar maskiner kverne statistikken. Så i dette tilfellet vil du f.eks aldri komme noen vei med å se på historie så simpelt, du må legge til ting som overganger, poster på sosiale medier, og andre faktorer som er tenkelig at påvirker et lag. Dette er både styrken og feilen med maskinlæring - vi er sjeldent interessert i de åpenbare og enkle sammenhengen til historien, vi vil spå og ser etter mønstre som ikke er åpenbare. For å forstå litt mer, kan du f.eks høre på Data Skeptic podcasten, som går igjennom algoritmer og intervjuer folk i bransjen. For de som driver med dette er det i overkant enkelt og åpenbart, men for å prøve å forstå konseptene er den flott.
Vis hele sitatet...
Nja, du trenger ikke nødvendigvis å ha så mye grunnlag. Det er det som er så fantastisk; man KAN finne overraskende nøyaktige sammenhenger relativt til mengden inputs.

På generelt grunnlag tror jeg di leter under feil stein, først og fremst må du forberede datasettene og se at du i det hele tatt har treningsdataene du tenker at du har.

Hva skal du forutsi på bakgrunn av hvilken variabler?

Ville begynt med noe enkelt og veldokumentert noe. Du må få feelingen med det å faktisk jobbe med fungerende datasett, lære deg å gjenkjenne prosessen med forberedelse av data og tilpasning av treningsparametre.