Egy magyar nyelvű táblázatos kérdésmegválaszolás kiértékelő adatbázis
Cikkünkben nagy nyelvi modellek táblázat értelmezési képességeit vizsgáljuk. Ehhez készítettünk egy magyar nyelvű kiértékelőadatbázist, amiben Wikipédiaról származó táblázatok és azok alapján megválaszolható kérdés-válasz párok találhatók. A kérdés-válasz párokat a táblázat környezetében található s...
Elmentve itt :
| Szerzők: | |
|---|---|
| Testületi szerző: | |
| Dokumentumtípus: | Könyv része |
| Megjelent: |
Szegedi Tudományegyetem TTIK, Informatikai Intézet
Szeged
2025
|
| Sorozat: | Magyar Számítógépes Nyelvészeti Konferencia
21 |
| Kulcsszavak: | Nyelvi modell, Nyelvészet - számítógép alkalmazása |
| Tárgyszavak: | |
| Online Access: | http://acta.bibl.u-szeged.hu/88787 |
| LEADER | 01839naa a2200277 i 4500 | ||
|---|---|---|---|
| 001 | acta88787 | ||
| 005 | 20251112140658.0 | ||
| 008 | 251112s2025 hu o 100 hun d | ||
| 020 | |a 978-963-688-034-7 | ||
| 040 | |a SZTE Egyetemi Kiadványok Repozitórium |b hun | ||
| 041 | |a hun | ||
| 100 | 1 | |a Tóth Gábor | |
| 245 | 1 | 0 | |a Egy magyar nyelvű táblázatos kérdésmegválaszolás kiértékelő adatbázis |h [elektronikus dokumentum] / |c Tóth Gábor |
| 260 | |a Szegedi Tudományegyetem TTIK, Informatikai Intézet |b Szeged |c 2025 | ||
| 300 | |a 269-278 | ||
| 490 | 0 | |a Magyar Számítógépes Nyelvészeti Konferencia |v 21 | |
| 520 | 3 | |a Cikkünkben nagy nyelvi modellek táblázat értelmezési képességeit vizsgáljuk. Ehhez készítettünk egy magyar nyelvű kiértékelőadatbázist, amiben Wikipédiaról származó táblázatok és azok alapján megválaszolható kérdés-válasz párok találhatók. A kérdés-válasz párokat a táblázat környezetében található szövegek alapján automatikusan generáltuk, majd ezeket kézzel ellenőriztük. Az így kapott korpuszon összehasonlítottuk 14 nagy nyelvi modell pontosságát. Azt konkludálhatjuk, hogy 2024 végén a 8 milliárd paraméteres modellek körülbelül 10 százalékponttal, míg a 30 millárd körüli modellek 5 százalékponttal teljesítenek rosszabbul, mint a GPT4o. | |
| 650 | 4 | |a Természettudományok | |
| 650 | 4 | |a Számítás- és információtudomány | |
| 650 | 4 | |a Bölcsészettudományok | |
| 650 | 4 | |a Nyelvek és irodalom | |
| 695 | |a Nyelvi modell, Nyelvészet - számítógép alkalmazása | ||
| 700 | 0 | 1 | |a Farkas Richárd |e aut |
| 700 | 0 | 1 | |a Szántó Zsolt |e aut |
| 711 | |a Magyar számítógépes nyelvészeti konferencia (21.) |c Szeged |d 2025. február 6-7. | ||
| 856 | 4 | 0 | |u http://acta.bibl.u-szeged.hu/88787/1/msznykonf_021_269-278.pdf |z Dokumentum-elérés |