Dabiski runājoša alternatīva

Datoru atpazīšana un atbilde uz jūsu balsi ir grūts uzdevums pat mūsdienu spēcīgajiem datoriem. Runājošajai angļu valodai piemītošais akcentu un sarežģītības daudzveidība var padarīt runas uztveršanu un interpretāciju sarežģītu. „Nuance Communication” „Dragon NaturallySpeaking” balss – teksta programmatūra dominē patērētāju tirgū balss vadības datoram, taču tā nav jūsu vienīgā iespēja. Gan Windows, gan Macintosh operētājsistēmas ietver pamata runas atpazīšanu, un atvērtā pirmkoda programmatūra turpina attīstīties.

Native Solutions

Datorā ar jaunākajām operētājsistēmām jau var būt alternatīva NaturallySpeaking. Windows Vista, Windows 7 un Macintosh OS X integrē runas atpazīšanas programmas, kas ļauj veikt sistēmas darbības un diktēt. Windows versijas instalēšanas procedūru laikā "iemācīsies" balss, un runas atpazīšana ir neatņemama jūsu datorā. Mac OS X 10.8 diktēšanas funkcija prasa aktīvu tīkla savienojumu un nosūta jūsu balss informāciju serverim atpazīšanai (skat. 2. atsauces).

Atvērtā koda alternatīvas

Atklātā pirmkoda sektorā runas atpazīšana nav labi attīstīta, lai gan sastāvdaļas pastāv, piemēram, Carnegie Mellon University CMUSphinx rīkkopa (sk. 4. atsauci). CMUSphinx iekļautie rīki būtībā ir runas lietojumprogrammu bloki, un tie ir noderīgi programmētājiem un kodētājiem. CMUSphinx kalpo par datu bāzi Simonai - atvērtā pirmkoda runas atpazīšanas programmatūras pakotnei (skatīt 3. atsauces). Simon ir elastīgs un modulārs, un, lai gan tas ir pilnīgs pieteikums, lietotājam ir nepieciešams augsts pielāgošanas līmenis.

Darbības optimizēšana

Skaidrs balss uztveršana uzlabo jebkuras balss atpazīšanas programmatūras veiktspēju (sk. Atsauces 1). Lai gan mikrofoni, kas ir iebūvēti klēpjdatoros un monitoros, darbosies, precizitāte tiek ievērojami uzlabota, izmantojot mikrofonaustiņu mikrofonu ar trokšņu slāpēšanas funkcijām. Pielāgojot savu balsi, kas atbilst jūsu izvēlētajam risinājumam, jūsu programmatūras alternatīva var konkurēt ar NaturallySpeaking veiktspēju balss uztveršanā, lai gan funkcijas joprojām ir ierobežotas. Atvērtā koda opciju pielāgošana dod iespēju saskaņot balss darbību ar jūsu vajadzībām.

Produktu ierobežojumi

Neatkarīgi no jūsu risinājuma dažas balsis nedarbojas labi ar runas atpazīšanu (sk. Atsauces 1). Akcentus un frekvenču saturu ietekmē tas, ko mikrofons savāc akustiskos datus, kas savukārt ietekmē to, ko programmatūra var atpazīt. Dažas programmas precizē veiktspēju, izmantojot kļūdu labošanas funkcijas, tāpēc jūsu spēja atpazīt esošās kļūdas nekavējoties ietekmē to, cik labi jūsu programmatūra pielāgojas. Dažas lietojumprogrammas un tīmekļa lapas nereaģēs uz balss komandām, pat ja jūsu runas ievade ir optimizēta.