Szövegalapú nyelvi elemző kiértékelése gépi beszédfelismerő hibákkal terhelt kimenetén

A cikkünkben felvázolt vizsgálat fókuszában az áll, hogy kiderüljön, milyen mértékű szintaktikai elemzést képes végrehajtani a „magyarlánc” nyelvi elemző a beszédfelismerő által kibocsájtott, hibákkal terhelt szövegeken, és ez az elemzés mennyiben „hasonlít” a hibátlan referenciaszövegen futtatottho...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerzők: Tündik Máté Ákos
Szaszák György
Testületi szerző: Magyar Számítógépes Nyelvészeti Konferencia (12.) (2016) (Szeged)
Dokumentumtípus: Könyv része
Megjelent: 2016
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 12
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Online Access:http://acta.bibl.u-szeged.hu/58967
LEADER 02197naa a2200217 i 4500
001 acta58967
005 20221108114937.0
008 190701s2016 hu o 1|| zxx d
020 |a 978-963-306-450-4 
040 |a SZTE Egyetemi Kiadványok Repozitórium  |b hun 
041 |a zxx 
100 1 |a Tündik Máté Ákos 
245 1 0 |a Szövegalapú nyelvi elemző kiértékelése gépi beszédfelismerő hibákkal terhelt kimenetén  |h [elektronikus dokumentum] /  |c  Tündik Máté Ákos 
260 |c 2016 
300 |a 111-121 
490 0 |a Magyar Számítógépes Nyelvészeti Konferencia  |v 12 
520 3 |a A cikkünkben felvázolt vizsgálat fókuszában az áll, hogy kiderüljön, milyen mértékű szintaktikai elemzést képes végrehajtani a „magyarlánc” nyelvi elemző a beszédfelismerő által kibocsájtott, hibákkal terhelt szövegeken, és ez az elemzés mennyiben „hasonlít” a hibátlan referenciaszövegen futtatotthoz, illetve azonosítható-e az elemzésnek olyan szintje, részeredménye, amely nagyban korrelál a hibátlan szövegével. A feladathoz egy híradós adatbázis 535 mondatból álló részhalmazát használtuk fel. Ezen a „magyarlánc” nyelvi elemzővel szintaktikai elemzést hajtottunk végre, mely meghatározta a mondatokra a szófaji és függőségi címkéket. Ezt követően a szintaktikai / szemantikai elemzések elemi részekre (szavakra) történő azonosítása és felbontása következett, majd az ezek halmaza felett megvalósított bag of words reprezentáció vizsgálata, melyet a korreláció, hasonlóság mérésére használtuk fel. További összehasonlítás történt a kinyert szófaji és dependencia tagek távolságszámításával is, a szóhibaarány számításával analóg módon. Az eredmények alapján elmondható, a beszéd-szöveg átalakítással nyert szövegeken végzett elemzés nagyban korrelál a hibáktól mentes referenciaátiraton végzettel. 
695 |a Nyelvészet - számítógép alkalmazása 
700 0 1 |a Szaszák György  |e aut 
710 |a Magyar Számítógépes Nyelvészeti Konferencia (12.) (2016) (Szeged) 
856 4 0 |u http://acta.bibl.u-szeged.hu/58967/1/msznykonf_012_111-121.pdf  |z Dokumentum-elérés