A magyar nyelvi csomag

Az egyes nyelvek esetében ugyanaz a beszédfelismerő gép ismer fel. A nyelvi specialitások nem a programban, hanem a program futásakor használatos adatokban találhatók. (Természetesen egy adott nyelv felismerési tapasztalatai alapján elvégzett program-javításokat az összes felhasználó élvezheti.)

A magyar felismerő működésének előfeltétele a nyelv leírásához szükséges akusztikus adatbázis (akusztikus referencia adatok) elkészítése. Ehhez jelentős mennyiségű hangzó anyagot kellett összegyűjteni különböző életkorú és beszédstílusú nőktől és férfiaktól. Szerencsére a magyar nyelv akusztikusan viszonylag könnyen leírható, hangzóink tiszták, ami megkönnyíti a beszédfelismerő rendszer működését. Magyar nyelven a dialektusok szerepe kisebb, mint angol vagy német nyelven. Mindenesetre az adatgyűjtés során figyelembe vettük a különböző nyelvjárásokat is.

A nyelvi csomag elsősorban a szabály alapú felismerést támogatja. Jellemző példák erre, az emberi hanggal vezérelt alkalmazások. Ilyenkor a felismerő egy viszonylag kisebb szótárral (max. pár ezer szó) és az ebben található szavakból alkotható kifejezésekkel, a mondatokat leíró szabályrendszerrel dolgozik.

Lehetőség van az úgynevezett szabad szótáras (pár tízezer szó) felismerésre is. Ilyenkor egy-egy konkrét alkalmazási területre optimalizált szótárat és nyelvi modellt (amely a szóhasználatot, a szavak egymás utáni valószínűségét írja le) kell kifejleszteni. Erre a feladatra fejlesztő eszközök szolgálnak, amelyek egy része azonnal rendelkezésre áll. A jobb felismerési eredmények elérésének érdekében, a Philips nyelvészeti részlege, legtöbbször, egy adott területre specializált kontextust fejleszt ki. Ilyen kontextus magyar nyelven radiológiai területen illetve demonstrációs célokra áll rendelkezésre.


Copyright © 2012 StartVox Kft     Oldaltérkép