O desenvolvimento de uma base de dados léxico-conceitual bilíngue (inglês norte-americano/português brasileiro)

Autores

  • Ariani Di Felippo UFSCar - Universidade Federal de São Carlos/São Carlos - SP
  • Bento Carlos Dias-da-Silva UNESP - Universidade Estadual Paulista/Araraquara - SP

Palavras-chave:

Processamento automático de línguas naturais, Base de dados bilíngue inglês-português, Alinhamento léxico-conceitual, Interlíngua estruturada, MultiNet,

Resumo

Para os sistemas computacionais que processam línguas naturais, como os de tradução automática, os recursos léxico-conceituais bilíngues ou multilíngues são de extrema importância. Consequentemente, o desenvolvimento de tais recursos tem ocupado lugar de centralidade no Processamento Automático das Línguas Naturais (PLN). Para o português do Brasil (PB), os recursos desse tipo ainda são escassos. Neste trabalho, apresenta-se REBECA, uma base de dados léxico-conceitual bilíngue desenvolvida para o par de línguas “inglês americano-PB” (Ingl-PB). Na introdução, contextualiza-se o projeto de desenvolvimento dessa base. Na sequência, apresentam-se (i) o equacionamento metodológico do projeto, enfatizando as atividades de pesquisa realizadas em cada uma das etapas previstas pela metodologia, (ii) a construção da base com o auxílio do editor de ontologias Protégé-OWL, (iii) as principais características e potencialidades da base REBECA e, por fim, (iv) as possíveis extensões e algumas considerações finais.

Downloads

Publicado

03/07/2009

Edição

Seção

Artigos Originais