' freak.no - Stemmegjenkjenning
freak.no

freak.no (https://freak.no/forum/index.php)
-   Generell DIY (https://freak.no/forum/forumdisplay.php?f=208)
-   -   Stemmegjenkjenning (https://freak.no/forum/showthread.php?t=293782)

Cybergasm 1. desember 2016 22:12

Stemmegjenkjenning
 
Var litt usikker på hvor jeg skulle plassere denne, men jeg føler DIY passer best.

Har i dag en Raspberry Pi med Jasper som stemmegjenkjenning og det fungerer ok om man sitter opptil 2 meter fra mikrofonen men den sliter fortsatt litt med bakgrunnstøy og feiltolkning, dette kan kanskje komme av sørlandsdialekten min selv om jeg prøver å uttale ordene på ren bokmål.
Det virker også som at hele Jasper prosjektet sjangler litt både i form av dårlig dokumentasjon og lite strukturert community.

Jeg skjønner jo også at valget mitt om å bruke Norsk istedenfor engelsk spiller en liten rolle i selve gjenkjenningen. Bruker wit.ai som STT og Ivona med den Norske stemmen Liv som TTS.

Har satt sammen ett par moduler på Norsk som bla gjør at jenteungen på 5 år kan starte spillelister fra mediasenteret i stuen og styre en del smarthus funksjoner uten at hun trenger å inn i kontrollpanelet å begynne å rote.

I starten brukte jeg ett gammelt creative webkamera som kun funket opptil 1 meter fra mikrofonen. Byttet til PS3 Eye camera pga mikrofonspesifikasjonene og økte distansen med en god meter.

Det jeg sliter mest med er stemmegjenkjenning fra 2-3 meter og oppover.

Er det noen her som bruker lignende programvare og har noen anbefalinger?

Og hva vil dere anbefale som hotword? Har prøvd litt forskjellig som "Hei robot" som ofte tolkes som "Hei robert" og "Hei robåt", jeg har også testet Alexa som hotword men det tolkes ofte som "alex/aleks".

Hvilket Norsk ord er det mest unike man kan bruke som samtidig ikke høres skikkelig kleint ut når man roper det ut mens man har folk på besøk?

Har kikket på Alexa til raspberry pi men der må man trykke en knapp for å snakke til mikrofonen, dette kan sikkert løses med "ekstern" hotword detection som simulerer en bryter på GPIO pinnene, men har ikke kikket noe nærmere på det.

Jeg har også ett nettbrett hengende på kjøkkenet med "OK google" og tasker som jeg kan bruke til samme formål men dette funker heller ikke veldig bra (kan hende det er mikrofonen i nettbrettet som er dårlig).

Google home og Alexa dot fra Amazon er jo gode alternativer sett fra ett hardware perspektiv, men ønsker å sette sammen noe selv da jeg har litt store planer for systemet på sikt.

laksir 2. desember 2016 01:24

Jeg har ikke snøring på området, men kanskje du kan finne noe relevant i denne videoen?

Cybergasm 2. desember 2016 10:00

Takk for tips, men denne henter kun tekst fra tv signalene. Men det var ett kult prosjekt!

frtoretang 2. desember 2016 19:33

Fikk massiv inspirasjon av tråden din ts. Nå kjenner jeg at jeg skal finne frem pi'n og skissere opp noe tilsvarende.
Har hatt den siste versjonen liggende en stund uten å finne motivasjon til å bruke tid på å bestemme hva jeg skal gjøre med den. Skulle egentlig bruke den til et can bus prosjekt men pga chinglish problemer så har jeg ennå ikke fått oversikt over protokoller etc. så pi'n har bare samlet støv. Blir gøy å få den i bruk.

Om du finner en løsning på bedre rekkevidde på stemmekommando så oppdater gjerne tråden.


Alle tidspunkt er GMT +2. Klokken er nå 14:29.