Jeg har en visualiseringsoppgave og trenger å skaffe en del data fra VG sine nettsider, nærmere bestemt kommentarer på nyhetsartikkler.
Metoden jeg ønsker å bruke er å lage et script som går inn på alle artikklene til vg og henter ut dataen.
f.eks.
hvor “*” = heltall fra 1 til 12000000
Og deretter henter ut alt mellom ""message”:”og " "can_remove”:”
f.eks. fra:
+
alt mellom "created_time”: og "like_count”:"
Finnes det script som kan gjøre en slik oppgave allerede? Alternativt, finnes det nettside rippere som kan laste ned alle dokumenter fra artid=1 til artid=12000000?
På forhånd takk.
[EDIT:] VgG faktisk... jaja... :/
Metoden jeg ønsker å bruke er å lage et script som går inn på alle artikklene til vg og henter ut dataen.
f.eks.
Kode
https://graph.facebook.com/comments/?ids=http://www.vg.no/nyheter/innenriks/artikkel.php?artid=*
Og deretter henter ut alt mellom ""message”:”og " "can_remove”:”
f.eks. fra:
Kode
https://graph.facebook.com/comments/?ids=http://www.vg.no/nyheter/innenriks/artikkel.php?artid=10127343
"\"Martin Kolberg (Ap): - Skaper mistanke om usunne nettverk\"\nStein, m\u00f8t glasshus...\nHvor lenge siden var det ikke Kolberg fors\u00f8kte \u00e5 fikse fordeler for familiemedlemmer ved \u00e5 true med \"Vet du virkelig ikke hvem jeg er?\”",
Vis hele sitatet...
+
alt mellom "created_time”: og "like_count”:"
"2013-10-22T19:17:32+0000”,
Vis hele sitatet...
På forhånd takk.
[EDIT:] VgG faktisk... jaja... :/
Sist endret av Turbolego; 24. oktober 2013 kl. 00:23.