Magyar jelentés-egyértelműsített korpusz

Az első magyar WSD korpusz elkészítéséhez 39 olyan szóalakot választottunk ki, melyek jó mintapéldák a jelentés-egyértelműsítés feladatának vizsgálatára. A kiválasztásnál a kritériumok között szerepelt, hogy az adott szóalak legyen gyakori a magyar nyelvben (ennek mérésére a Magyar Nemzeti Szövegtár...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerzők: Szarvas György
Hatvani Csaba
Szauter Dóra
Almási Attila
Vincze Veronika
Csirik János
Testületi szerző: Magyar Számítógépes Nyelvészeti Konferencia (5.) (2007) (Szeged)
Dokumentumtípus: Könyv része
Megjelent: 2007
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 5
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Online Access:http://acta.bibl.u-szeged.hu/58673
LEADER 01732naa a2200265 i 4500
001 acta58673
005 20221108115044.0
008 190618s2007 hu o 1|| zxx d
020 |a 978-963-482-848-8 
040 |a SZTE Egyetemi Kiadványok Repozitórium  |b hun 
041 |a zxx 
100 1 |a Szarvas György 
245 1 0 |a Magyar jelentés-egyértelműsített korpusz  |h [elektronikus dokumentum] /  |c  Szarvas György 
260 |c 2007 
300 |a 158-165 
490 0 |a Magyar Számítógépes Nyelvészeti Konferencia  |v 5 
520 3 |a Az első magyar WSD korpusz elkészítéséhez 39 olyan szóalakot választottunk ki, melyek jó mintapéldák a jelentés-egyértelműsítés feladatának vizsgálatára. A kiválasztásnál a kritériumok között szerepelt, hogy az adott szóalak legyen gyakori a magyar nyelvben (ennek mérésére a Magyar Nemzeti Szövegtár (MNSZ) [8] gyakorisági adatait használtuk), illetve, hogy legyen több, használatában gyakorinak tekinthető jelentése. A korpusz szövegeit is az MNSZ-ből, annak Heti Világgazdaság (HVG) számaiból összeállított részkorpuszából válogattuk. Így minden egyes példához rendelkezésre áll a vizsgálat szempontjából releváns kontextus (teljes HVG-cikk), illetve automatikus tokenizálás, szófaji kódolás, szótőre vonatkozó információ. 
695 |a Nyelvészet - számítógép alkalmazása 
700 0 1 |a Hatvani Csaba  |e aut 
700 0 1 |a Szauter Dóra  |e aut 
700 0 1 |a Almási Attila  |e aut 
700 0 1 |a Vincze Veronika  |e aut 
700 0 1 |a Csirik János  |e aut 
710 |a Magyar Számítógépes Nyelvészeti Konferencia (5.) (2007) (Szeged) 
856 4 0 |u http://acta.bibl.u-szeged.hu/58673/1/msznykonf_005_158-165.pdf  |z Dokumentum-elérés