Du må være registrert og logget inn for å kunne legge ut innlegg på freak.no
X
LOGG INN
... eller du kan registrere deg nå
Dette nettstedet er avhengig av annonseinntekter for å holde driften og videre utvikling igang. Vi liker ikke reklame heller, men alternativene er ikke mange. Vær snill å vurder å slå av annonseblokkering, eller å abonnere på en reklamefri utgave av nettstedet.
  3 1467
Hallo. Tukler og tøyser med linux. Tanken slo meg, og jeg spør :

Hvordan kan man surfe internett, uten en såkalt browser, men at man kun henter informasjon og data fra et gitt sted, la oss si, forskning.no..

Noen?
Hvordan kan man surfe internett, uten en såkalt browser
Vis hele sitatet...
Surfe/teste med headless browser.
Surfe Headless er ikke så vanlig,
man surfer i den forstand at man tester nettsiden uten og bruke nettleser.
Jeg liker Selenium i kombinasjon med PhantomJS for og hente ut data fra sider som bruker mye JavaScript.
men at man kun henter informasjon og data fra et gitt sted, la oss si, forskning.no..
Vis hele sitatet...
Hente data/parse her er det mange måter som fungerer f.eks kommando line verktøy som Wget,cURL.
Bruke og kunne et programmeringsspråk er en stor fordel,som f.eks Python.
Demo:

Kode

import requests
from bs4 import BeautifulSoup

url = 'http://forskning.no/'
url_page = requests.get(url)
soup = BeautifulSoup(url_page.content, 'html.parser')
tag = soup.find('div', id="site-slogan")
print(tag.text) #--> Nettavis om norsk og internasjonal forskning
Her bruker jeg gode bibliotek som Requests og Beautiful Soup
Sist endret av snippsat; 30. oktober 2015 kl. 05:27.
En browser er i bunn og grunn bare en applikasjon som sender requester til en server og viser deg resultatet. De fleste programmeringsspråk har biblioteker for å sende slike requester, jeg laget selv for mange år siden en liten sak som lastet ned alle bilder fra en nettside og lagret dem til disk.

Teoretisk er det ikke vanskelig å hente informasjon fra nettet uten browser, men avhengig av hva du henter gir det ikke mening å gjøre det uten en browser. F.eks. vil en nettside i HTML være tung å lese uten at den parses i en browser, mens henting av PDF-er eller andre filer for lagring til disk gir mening.

Dog, hvorfor vil du ikke bruke browser? Requesten forutsetter uansett at du sender med data, bl.a. hvilken URL serveren skal svare til. Å "surfe" uten browser, det vil si gjøre mer enn å hente et kjent filnavn fra en kjent URL krever i bunn og grunn at du implementerer en browser, bare uten HTML-parseren.
Ikke helt det du spør etter, men...
Du har jo også Lynx som er en tekstbasert nettleser. Dette gjør at du kan browse nettsider fra konsollen. Noget sær, men morro å se. https://en.wikipedia.org/wiki/Lynx_(web_browser)
Sist endret av Halalgeir; 30. oktober 2015 kl. 13:30.