Har vært stille rundt Boitho lenge nå. Vi er nå endelig klar med ny indeks og ny versjon av den distribuert crawleren.
Den nye indeksen er tilgjengelig her: http://www.boitho.com/beta/
Siste halvåret har vi jobbet med koden og foreningsdelen. Hele søkesystemet er nå skrevet i C. Vi har opprettet firma, og fått kontorer i Forskningsparken i Oslo.
Har laget en blog der jeg har skrevet litt om dette: http://www.boitho.com/blog/ .
Hovedutfordringen nå er å få crawlet nokk sider. At vi ikke har nokk påvirker rangeringen, og man finner ikke alltid det man leter etter. Vi har nå skaffet 7 dedikerte PCer til å crawle, og håper at folk vil hjelpe oss ved å laste ned crawler klienten vår som bruker idle tid på maskinen får å crawle. Den kan lastes ned her: http://www.boitho.com/dc/
Støtte for crawlergrupper kommer snart. Slik at man for eksempel kan lage en Freakforum gruppe.
Man kan se om en side er indeksert her: http://bbh-001.boitho.com/cgi-bin/UrlToDocID/index.cgi (eks http://bbh-001.boitho.com/cgi-bin/Ur...freakforum.nu/) . Dere kan legge til sider her: http://www.boitho.com/legg_til_link.htm.no
Denne betaen er noe begrenset. Man kan ikke bla seg videre fra side 1, og pilene fungerer ikke. Det er ofte stor forskjel på søk på fraser med og uten ” tegn, så bruk query med frasetegn som dette når det søkes på navn: ”bil gates”
Noen queryer dere kan prøve:
Chat: http://www.boitho.com/beta/?&query=chat&sprok=NBO
Finner mange relevante sider, som boldchat.com, mIRC, liveperson.com, irchelp.org og Yahoo! Chat
Trondheim: http://www.boitho.com/beta/?query=trondheim&sprok=NBO
adressa.no og adresseavisen.no er lokalavisen her. Begge domenene er for samme side, men innholde er ikke likt da de var kravlet med noe mellomrom, så avisa var oppdatert i mellomtiden. Vil i fremtiden bli iltrert ut da de har samme ip.
For aktuelle ting som trondheim.com, TRONDHEIM KINO, NTNU, Nidarosdomen.no, Trondheim commune og Trondheim folkebibliotek. Men også en del hotell spam.
Søker fortsatt medgrundere, programmerere og folk vi kan samarbeide med. Ta kontakt på runarb [att] boitho [dot] com eller msn msm_support [att] hostviser [dot] com
Den nye indeksen er tilgjengelig her: http://www.boitho.com/beta/
Siste halvåret har vi jobbet med koden og foreningsdelen. Hele søkesystemet er nå skrevet i C. Vi har opprettet firma, og fått kontorer i Forskningsparken i Oslo.
Har laget en blog der jeg har skrevet litt om dette: http://www.boitho.com/blog/ .
Hovedutfordringen nå er å få crawlet nokk sider. At vi ikke har nokk påvirker rangeringen, og man finner ikke alltid det man leter etter. Vi har nå skaffet 7 dedikerte PCer til å crawle, og håper at folk vil hjelpe oss ved å laste ned crawler klienten vår som bruker idle tid på maskinen får å crawle. Den kan lastes ned her: http://www.boitho.com/dc/
Støtte for crawlergrupper kommer snart. Slik at man for eksempel kan lage en Freakforum gruppe.
Man kan se om en side er indeksert her: http://bbh-001.boitho.com/cgi-bin/UrlToDocID/index.cgi (eks http://bbh-001.boitho.com/cgi-bin/Ur...freakforum.nu/) . Dere kan legge til sider her: http://www.boitho.com/legg_til_link.htm.no
Denne betaen er noe begrenset. Man kan ikke bla seg videre fra side 1, og pilene fungerer ikke. Det er ofte stor forskjel på søk på fraser med og uten ” tegn, så bruk query med frasetegn som dette når det søkes på navn: ”bil gates”
Noen queryer dere kan prøve:
Chat: http://www.boitho.com/beta/?&query=chat&sprok=NBO
Finner mange relevante sider, som boldchat.com, mIRC, liveperson.com, irchelp.org og Yahoo! Chat
Trondheim: http://www.boitho.com/beta/?query=trondheim&sprok=NBO
adressa.no og adresseavisen.no er lokalavisen her. Begge domenene er for samme side, men innholde er ikke likt da de var kravlet med noe mellomrom, så avisa var oppdatert i mellomtiden. Vil i fremtiden bli iltrert ut da de har samme ip.
For aktuelle ting som trondheim.com, TRONDHEIM KINO, NTNU, Nidarosdomen.no, Trondheim commune og Trondheim folkebibliotek. Men også en del hotell spam.
Søker fortsatt medgrundere, programmerere og folk vi kan samarbeide med. Ta kontakt på runarb [att] boitho [dot] com eller msn msm_support [att] hostviser [dot] com