emToken Unicode-képes tokenizáló magyar nyelvre /

Cikkünkben az emToken tokenizáló programot mutatjuk be. Ennek főbb tulajdonságai között említhető, a széleskörű UTF-8 támogatás, a konfigurálhatóság, az automatikus tesztkörnyezet és a programkönytár által nyújtott API. Az előállított - XML vagy JSON formátumú - kimenet detokenizálható. A program fo...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerző: Mittelholcz Iván
Testületi szerző: Magyar Számítógépes Nyelvészeti Konferencia (13.) (2017) (Szeged)
Dokumentumtípus: Könyv része
Megjelent: 2017
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 13
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Online Access:http://acta.bibl.u-szeged.hu/58997

Hasonló tételek