Caracterização da complementaridade temporal: subsídios para sumarização automática multidocumento
DOI:
https://doi.org/10.1590/1981-5794-1804-6Palavras-chave:
Descrição linguística, Complementaridade, CST, Sumarização Multidocumento, Processamento Automático de Língua Natural,Resumo
A complementaridade é um fenômeno multidocumento comumente observado entre notícias que versam sobre um mesmo evento. A partir de um corpus em português composto por um conjunto de pares de sentenças manualmente anotadas com as relações da Cross-Document Structure Theory (CST) que explicitam a complementaridade temporal (Historical background e Follow-up), identificou-se um conjunto potencial de atributos linguísticos desse tipo de complementaridade. Por meio de algoritmos de Aprendizado de Máquina, testou-se o potencial dos atributos em distinguir as referidas relações. O classificador simbólico gerado pelo algoritmo JRip obteve o melhor desempenho ao se considerar a precisão e o tamanho reduzido do conjunto de regras. Somente com base em 5 regras, tal classificador identificou Follow-up e Historical background com precisão aproximada de 80%. Ademais, as regras do classificador indicam que o atributo ocorrência de expressão temporal na sentença 2 é o mais relevante para a tarefa. Como contribuição, salienta-se que o classificador JRip aqui gerado pode ser utilizado nos analisadores discursivos multidocumento para o português do Brasil que são baseados na CST.Downloads
Não há dados estatísticos.
Downloads
Publicado
25/04/2018
Como Citar
SOUZA, J. W. da C.; FELIPPO, A. D. Caracterização da complementaridade temporal: subsídios para sumarização automática multidocumento. ALFA: Revista de Linguística, São Paulo, v. 62, n. 1, 2018. DOI: 10.1590/1981-5794-1804-6. Disponível em: https://periodicos.fclar.unesp.br/alfa/article/view/9204. Acesso em: 14 nov. 2024.
Edição
Seção
Artigos Originais
Licença
Os manuscritos aceitos e publicados são de propriedade da Alfa: Revista de Linguística. É vedada a submissão integral ou parcial do manuscrito a qualquer outro periódico. A responsabilidade do conteúdo dos artigos é exclusiva dos autores. É vedada a tradução para outro idioma sem a autorização escrita do Editor ouvida a Comissão Editorial.