Propuesta de extracción automática de candidatos a término del dominio médico procesando información lingüística. Descripción y evaluación de resultados

Walter Koza Orellana

doi:10.1590/1981-5794-1502-5

Propuesta de extracción automática de candidatos a término del dominio médico procesando información lingüística. Descripción y evaluación de resultados

Autores

Walter Koza Orellana PUCV – Pontificia Universidad Católica de Valparaíso. Instituto de Literatura y Ciencias del Lenguaje. Facultad de Filosofía y Educación. Viña del Mar – Valparaíso – Chile

DOI:

https://doi.org/10.1590/1981-5794-1502-5

Palavras-chave:

Terminología médica, Extracción automática, Información lingüística, Candidatos a término,

Resumo

Se presenta la descripción de un método de extracción automática de candidatos a términos del área médica a partir del procesamiento de información lingüística. Para ello, se trabajó con reglas en el nivel léxico, morfológico y sintáctico. En primer lugar, se realizó la detección aplicando un diccionario estándar, el cual asignó a las palabras consideradas términos, la etiqueta MED (MÉDICO). Luego, para las palabras que no estaban contempladas en el diccionario (PNCD), se dedujeron las categorías gramaticales apelando a reglas morfológicas y sintácticas. Posteriormente, se procedió a la conformación de sintagmas nominales que involucraban PNCD y MED, para extraerlos como candidatos a términos del dominio. Se utilizaron los softwares Smorph y Módulo Post Smorph (MPS), que trabajan en bloque, y Xfst. Smoprh realiza el análisis morfológico y MPS trabaja sobre gramáticas locales. Xfst, por su parte, es una herramienta de estados finitos que opera sobre cadenas de caracteres, a las que asigna categorías previamente declaradas. El método se probó en una parte del corpus de casos clínicos compilado por Burdiles (2012), que contenía 217258 palabras, y los resultados arrojaron una precisión de 92,58%, una cobertura de 95,02% y una medida f de 93,78%.

Downloads

Não há dados estatísticos.

Downloads

Publicado

23/02/2015

Como Citar

KOZA ORELLANA, W. Propuesta de extracción automática de candidatos a término del dominio médico procesando información lingüística. Descripción y evaluación de resultados. ALFA: Revista de Linguística, São Paulo, v. 59, n. 1, 2015. DOI: 10.1590/1981-5794-1502-5. Disponível em: https://periodicos.fclar.unesp.br/alfa/article/view/6440. Acesso em: 12 jul. 2026.

Baixar Citação

Edição

v. 59 n. 1 (2015)

Seção

Artigos Originais

Licença

Os manuscritos aceitos e publicados são de propriedade da Alfa: Revista de Linguística. É vedada a submissão integral ou parcial do manuscrito a qualquer outro periódico. A responsabilidade do conteúdo dos artigos é exclusiva dos autores. É vedada a tradução para outro idioma sem a autorização escrita do Editor ouvida a Comissão Editorial.

Propuesta de extracción automática de candidatos a término del dominio médico procesando información lingüística. Descripción y evaluación de resultados

Autores

DOI:

Palavras-chave:

Resumo

Downloads

Downloads

Publicado

Como Citar

Edição

Seção

Licença

Desenvolvido por

Idioma

Informações