Relevance segmentation of long documents
In this paper, we present our methods to identify the most salient topics for a selected domain based on topic modeling. We propose a topic relevance score and segmentation procedure which can split the document into parts referring to various topics. We also offer a solution for visualizing textual...
Elmentve itt :
Szerzők: | |
---|---|
Testületi szerző: | |
Dokumentumtípus: | Könyv része |
Megjelent: |
2018
|
Sorozat: | Magyar Számítógépes Nyelvészeti Konferencia
14 |
Kulcsszavak: | Nyelvészet - számítógép alkalmazása |
Online Access: | http://acta.bibl.u-szeged.hu/59063 |
LEADER | 01439naa a2200265 i 4500 | ||
---|---|---|---|
001 | acta59063 | ||
005 | 20221108114928.0 | ||
008 | 190703s2018 hu o 1|| zxx d | ||
020 | |a 978-963-306-578-5 | ||
040 | |a SZTE Egyetemi Kiadványok Repozitórium |b hun | ||
041 | |a zxx | ||
100 | 1 | |a Szántó Zsolt | |
245 | 1 | 0 | |a Relevance segmentation of long documents |h [elektronikus dokumentum] / |c Szántó Zsolt |
260 | |c 2018 | ||
300 | |a 405-412 | ||
490 | 0 | |a Magyar Számítógépes Nyelvészeti Konferencia |v 14 | |
520 | 3 | |a In this paper, we present our methods to identify the most salient topics for a selected domain based on topic modeling. We propose a topic relevance score and segmentation procedure which can split the document into parts referring to various topics. We also offer a solution for visualizing textual spans that are related to a given topic. In this way, it can be easily determined which are the most relevant and most irrelevant segments of a long document (like blog posts or news articles). | |
695 | |a Nyelvészet - számítógép alkalmazása | ||
700 | 0 | 2 | |a Sliz-Nagy Alex |e aut |
700 | 0 | 2 | |a Nagy T. István |e aut |
700 | 0 | 2 | |a Csuma-Kovács Ádám |e aut |
700 | 0 | 2 | |a Vincze Veronika |e aut |
700 | 0 | 2 | |a Farkas Richárd |e aut |
710 | |a Magyar Számítógépes Nyelvészeti Konferencia (14.) (2018) (Szeged) | ||
856 | 4 | 0 | |u http://acta.bibl.u-szeged.hu/59063/1/msznykonf_014_405-412.pdf |z Dokumentum-elérés |