Ho comprato un simpatico Hat del Raspberry che volevo guardare insieme a voi, il ReSpeaker 4-mic Array.
Di cosa si tratta ? :
Una carta d’espansione quad-microphone per Raspberry PI designed, progettata interamente con lo scopo di servire applicazion di AI e Voice Recognition, WHAT !?!?! R U SERIOUS ?! ABSOLUTELY !!!
Cosa vuol dire questo ? Che non é un microfono che puoi prendere da qualunque parte che serve per tutti gli usi, che puoi usare per il tuo pc, per fare streaming o recording; no, se vuoi fare applicazioni dedicate al riconoscimento vocale su Raspberry, questo prodotto é dedicato e costruito per questo specifico utilizzo.
Cioé dalle informazioni del produttore si evince che puó essere uno strumento molto piú potente di Alexa e Google Assistant.
Da un certo punto di vista potrebbe dare un vantaggio di capacità già in partenza, comunque questo ci dice che se vogliamo spingere sulle performance questo potrebbe essere lo strumento giusto, in seguito vedremo il perché ed anche il vantaggio software.
Un piccolo punto di vista comunque é che se volete provare a giocare un pó con il riconoscimento vocale, vi consiglio prima di sperimentare un normale microfono usb, anche sul vostro pc per poi salire di livello, riassumendo non fate come me che ho la pessima abitudine di comprare prodotti già avanzati per l’utilizzo che devo farci, che penso che mi serviranno ma che poi restano nel cassetto per anni :D
Comunque non preoccupatevi faró piú avanti dei tutorial su come prototipare applicazioni su PC per poi passarle su Raspberry con le dovute cautele ed appunto preparare un “pacchetto” che sia facile da installare poi su un dispositivo meno performante del pc, come il Raspberry appunto.
Torniamo alle nostre specifiche :
- AC108
- Quad-channel ADC con IS2/TDM per ascolto in un raggio di 3 metri
- Anello di led con 12 APA102 led programmabili
- Grove interface I2C connessa con I2C-1
- Grove interface porta digitale connessa con GPI012/13
Cosa vogliono dire tutte queste sigle ? Non lo so neanche io quindi non preoccupatevi, dobbiamo usarlo, non assemblarlo , giusto ?! Il vantaggio di conoscere i componenti potrebbe venire utile in una fase avanzata dei progetti quando si vorrà approfondire le librerie o magari quando si avranno dei problemi ed errori e capire come sistemarli “FIXARLI”.
Quello che possiamo dire é che questa carta di permette di fare con il software algorithm già preinstallato tante cose.
Il software algorithm ci permette di :
- VAD ( Voice Activity Detection ) Riconoscimento di attività vocali
- DOA ( Direction of Arrival ) Direzione di arrivo vocale :O
- KWS ( Keyword Search ) identificazione parole ed indicazione della direzione con il LED ring.
Uff... che bomba !!! Insomma qua abbiamo tutto quello che ci serve per sperimentare nuove applicazioni e giocarci come se non ci fosse un domani.
Top comments (0)