Zajszűrő eljárások alkalmazása, teljesítményük vizsgálata zajos beszéd automatikus felismerésénél
A jelen cikk célja több zajszr eljárás teljesítményének összehasonlítása autók bels terében történ automatikus beszédfelismeréskor. A kutatást autóban felvett hanganyagon végeztük el német nyelvre. A zajszr eljárások teljesítményének összehasonlítását egy csatornán végeztük. Négyféle zajszr eljárást...
Elmentve itt :
| Szerzők: | |
|---|---|
| Testületi szerző: | |
| Dokumentumtípus: | Könyv része |
| Megjelent: |
2009
|
| Sorozat: | Magyar Számítógépes Nyelvészeti Konferencia
6 |
| Kulcsszavak: | Nyelvészet - számítógép alkalmazása |
| Online Access: | http://acta.bibl.u-szeged.hu/58709 |
| Tartalmi kivonat: | A jelen cikk célja több zajszr eljárás teljesítményének összehasonlítása autók bels terében történ automatikus beszédfelismeréskor. A kutatást autóban felvett hanganyagon végeztük el német nyelvre. A zajszr eljárások teljesítményének összehasonlítását egy csatornán végeztük. Négyféle zajszr eljárást vizsgáltunk: Spectral Subtraction, Wiener-filter, Minimum Mean-Square Error Log-Spectral Amplitude Estimator, valamint modulációs spektrum szrésén alapuló zajcsökkentés. Minden eljárásnál használtunk egy felülátereszt szrt is, amellyel az autó mélyfrekvenciás zaját tudtuk kiküszöbölni. A beszédfelismerési tesztekre Rejtett Markov-modell alapú felismert használtunk. A tesztsorozatokat két részre bontottuk. Az els tesztsorozat során megvizsgáltuk az egyes zajszr eljárások alkalmazhatóságát a beszédfelismerésben úgy, hogy a TELEAUTO személygépkocsi belterében rögzített hanganyagot használtuk tanításra és tesztelésre is, az adott zajszr eljárás alkalmazása után. A második tesztsorozat során pedig megvizsgáltuk, hogy a SpeechDat adatbázissal betanított HMM modellekkel a szrt felvételek milyen eredményeket adnak a szretlen személygépkocsikban rögzített felvételekkel történ felismeréshez képest. A kapott eredmények azt mutatják, hogy a zajszr eljárások közül az MMSE adja a legjobb felismerési százalékot az általunk vizsgált módszerek közül. Továbbá a teszteredményekbl az is egyértelm, hogy a felismerés szempontjából az a leghatékonyabb eljárás, ha a zajos beszédfelismerésnél a hasonló zajban felvett beszédadatbázissal történik a betanítás. |
|---|---|
| Terjedelem/Fizikai jellemzők: | 195-205 |
| ISBN: | 978-963-482-982-9 |