Heisann, jeg prøver å scrape boligannonser fra finn med Python og BeautifulSoup, og har kommet ganske langt.
Om jeg da kjører print statestikk[1] feks vil jeg få ut
Spørsmålet mitt er hvordan jeg da kan få ut boligtypen, eieformen, antall soverom osv på en fornuftig måte. De fleste boligene har forskjellig statestikk, så nytter ikke splitte stringen og deretter ta indeksen, det må søkes spesifikt etter "Boligtype" og deretter må neste ord tas.
hvordan kan jeg løse dette på en fornuftig måte?
Kode
def scrape(link): r1 = requests.get('https://www.finn.no' + link) coverpage = r1.content soup1 = BeautifulSoup(coverpage, 'html.parser') linker = soup1.find_all( class_='definition-list') for n in range(1,len(linker)): statestikk.append(linker[n].get_text(" ", strip=True))
Kode
Boligtype Enebolig Eieform Eier (Selveier) Soverom 3 Primærrom 104 m² Bruksareal 126 m² Byggeår 1958 Energimerking D - oransje Rom 4
hvordan kan jeg løse dette på en fornuftig måte?