Reconhecimento do vocabulário de jornais populares brasileiros por um dicionário computacional de acesso livre

Autores

DOI:

https://doi.org/10.1590/1981-5794-1904-3

Palavras-chave:

Jornais populares, Léxico, Vocabulário, Dicionário computacional, Cobertura lexical, Reconhecimento de palavras, Português brasileiro,

Resumo

Relata-se um experimento de verificação da identificação de um universo de palavras do português popular escrito por duas versões de um dicionário computacional do português brasileiro (PB), DELAF PB 2004 e DELAF PB 2015. Esse dicionário computacional é gratuitamente acessível para ser utilizado em análises linguísticas do Português do Brasil e em outras pesquisas, o que justifica um estudo crítico. O universo vocabular provém do corpus PorPopular, composto por jornais populares, o Diário Gaúcho (DG) e o jornal baiano Massa! (MA). Do DG, partiu-se de um conjunto de textos com 984.465 palavras (tokens), publicados em 2008, com ortografia desatualizada frente ao Acordo Ortográfico da Língua Portuguesa adotado em 2009. Do MA, examinou-se um universo com 215.776 palavras (tokens), em publicações de 2012, 2014 e 2015, com todo o material na nova ortografia. A verificação envolveu: a) gerar listas de palavras diferentes empregadas em DG e MA; b) comparar essas listas com as listas de entradas das duas versões do DELAF PB; c) avaliar a cobertura desse vocabulário; d) propor modos de inclusão de itens não cobertos. Os resultados do trabalho mostraram, no DG, uma média de 19% de palavras diferentes (types) desconhecidas pelos DELAF PB 2004 e 2015. No MA, essa média ficou em 13%. A versão do dicionário repercutiu ligeiramente sobre o desempenho do reconhecimento de itens.

Downloads

Não há dados estatísticos.

Biografia do Autor

Maria José Bocorny Finatto, Universidade Federal do Rio Grande do Sul (UFRGS), Porto Alegre - RS – Brasil.

Docente do PPG Letras-UFRGS.Pesquisadora do CNPq.

Oto Araújo Vale, Universidade Federal de São Carlos (UFSCar), Centro de Educação e Ciências Humanas, São Carlos - SP - Brasil.

Docente do PPG Linguagem da UFScar.

Publicado

15/04/2019

Como Citar

FINATTO, M. J. B.; VALE, O. A.; LAPORTE, Éric. Reconhecimento do vocabulário de jornais populares brasileiros por um dicionário computacional de acesso livre. ALFA: Revista de Linguística, São Paulo, v. 63, n. 1, 2019. DOI: 10.1590/1981-5794-1904-3. Disponível em: https://periodicos.fclar.unesp.br/alfa/article/view/11234. Acesso em: 22 nov. 2024.

Edição

Seção

Artigos Originais