View Single Post
Heisann, jeg prøver å scrape boligannonser fra finn med Python og BeautifulSoup, og har kommet ganske langt.

Kode

def scrape(link):
	r1 = requests.get('https://www.finn.no' + link)
	coverpage = r1.content
	soup1 = BeautifulSoup(coverpage, 'html.parser')
	linker = soup1.find_all( class_='definition-list')

	for n in range(1,len(linker)):
		statestikk.append(linker[n].get_text(" ", strip=True))
Om jeg da kjører print statestikk[1] feks vil jeg få ut

Kode

Boligtype Enebolig Eieform Eier (Selveier) Soverom 3 Primærrom 104 m² Bruksareal 126 m² Byggeår 1958 Energimerking D - oransje Rom 4
Spørsmålet mitt er hvordan jeg da kan få ut boligtypen, eieformen, antall soverom osv på en fornuftig måte. De fleste boligene har forskjellig statestikk, så nytter ikke splitte stringen og deretter ta indeksen, det må søkes spesifikt etter "Boligtype" og deretter må neste ord tas.

hvordan kan jeg løse dette på en fornuftig måte?