Hvordan kan man surfe internett, uten en såkalt browser
Surfe/teste med
headless browser.
Surfe Headless er ikke så vanlig,
man surfer i den forstand at man tester nettsiden uten og bruke nettleser.
Jeg liker Selenium i kombinasjon med PhantomJS for og hente ut data fra sider som bruker mye JavaScript.
men at man kun henter informasjon og data fra et gitt sted, la oss si, forskning.no..
Hente data/parse her er det mange måter som fungerer f.eks kommando line verktøy som Wget,cURL.
Bruke og kunne et programmeringsspråk er en stor fordel,som f.eks Python.
Demo:
Kode
import requests
from bs4 import BeautifulSoup
url = 'http://forskning.no/'
url_page = requests.get(url)
soup = BeautifulSoup(url_page.content, 'html.parser')
tag = soup.find('div', id="site-slogan")
print(tag.text) #--> Nettavis om norsk og internasjonal forskning
Her bruker jeg gode bibliotek som
Requests og
Beautiful Soup
Sist endret av snippsat; 30. oktober 2015 kl. 05:27.