View Single Post
Førstefiskevasker
Barte-Sam's Avatar
150
Spennende tråd! Jeg har i flere år hatt et egenutviklet verktøy skrevet i NodeJS, som bruker nb.no sitt API for å hente ned tiles som jeg så kombinerer til sider, kjører OCR på lokalt, og til slutt kombinerer til én stor, søkbar PDF. Verktøyet mitt har en del avhengigheter, som Postgres, Tesseract OCR, og diverse PDF-verktøy. Jeg har lenge hatt en plan om å lage et Docker-image som lar deg kjøre verktøyet uten å måtte installere alle disse verktøyene selv på forhånd.

Jeg kan godt tenke meg å dele kode, men først må jeg nok rydde litt opp i den.