Témaspecifikus gépi fordítórendszer minőségének javítása domain adaptáció segítségével

A mély tanulásos módszerek elterjedése napjainkban nagymértékben megváltoztatta a gépi fordítások emberi megítélését. A statisztikai gépi fordítórendszerekkel (SMT) szemben a neurálishálózat-alapon működő architektúrák (NMT) sokkal olvashatóbb fordításokat generálnak, melyek a hivatásos fordítók szá...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerző: Laki László János
Testületi szerző: Magyar Számítógépes Nyelvészeti Konferencia (15.) (2019) (Szeged)
Dokumentumtípus: Könyv része
Megjelent: 2019
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 15
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Online Access:http://acta.bibl.u-szeged.hu/59075
LEADER 02038naa a2200205 i 4500
001 acta59075
005 20221108114921.0
008 190703s2019 hu o 1|| zxx d
020 |a 978-963-315-393-2 
040 |a SZTE Egyetemi Kiadványok Repozitórium  |b hun 
041 |a zxx 
100 1 |a Laki László János 
245 1 0 |a Témaspecifikus gépi fordítórendszer minőségének javítása domain adaptáció segítségével  |h [elektronikus dokumentum] /  |c  Laki László János 
260 |c 2019 
300 |a 73-82 
490 0 |a Magyar Számítógépes Nyelvészeti Konferencia  |v 15 
520 3 |a A mély tanulásos módszerek elterjedése napjainkban nagymértékben megváltoztatta a gépi fordítások emberi megítélését. A statisztikai gépi fordítórendszerekkel (SMT) szemben a neurálishálózat-alapon működő architektúrák (NMT) sokkal olvashatóbb fordításokat generálnak, melyek a hivatásos fordítók számára könnyebben és hatékonyabban javíthatók az utófeldolgozás során. Az új módszer nehézsége azonban, hogy a stabilan jó fodítási minőséget adó rendszerek tanításához nagy méretű tanítóanyagra van szükség. Ez azonban a legtöbb fordítócég vagy nyelvpár esetén nem áll rendelkezésre. Munkám során a kicsi és jó minőségű in-domain tanítóanyagokat adatszelekció segítségével feldúsítottam egy nagy méretű out-of-domain korpusz leginkább hasonló szegmenseivel. Az így létrehozott architektúrával sikerült statisztikailag szignifikáns mértékben javítanom a fordítórendszer minőségét az összes vizsgált esetben. Kutatásom során igyekeztem megtalálni a feladathoz leginkább alkalmas szelekciós módszert, illetve megvizsgáltam a rendszer működését több különböző nyelv- és domainpár kombinációval. 
695 |a Nyelvészet - számítógép alkalmazása 
710 |a Magyar Számítógépes Nyelvészeti Konferencia (15.) (2019) (Szeged) 
856 4 0 |u http://acta.bibl.u-szeged.hu/59075/1/msznykonf_015_073-082.pdf  |z Dokumentum-elérés