DESEMPENHO DO PROCESSAMENTO AUTOMÁTICO DE VERBOS DO PORTUGUÊS BRASILEIRO PELOS ETIQUETADORES TREETAGGER E AUTOMATIC PARSE

Nucleus

Endereço:
Rua Coronel Flauzino Barbosa Sandoval, 1259, Bairro Universitário
/ SP
14500000
Site: http://www.nucleus.feituverava.com.br/index.php/nucleus
Telefone: (16) 3729-9000
ISSN: 1982-2278
Editor Chefe: Vera Mariza Chaud de Paula
Início Publicação: 31/03/2003
Periodicidade: Semestral
Área de Estudo: Multidisciplinar

DESEMPENHO DO PROCESSAMENTO AUTOMÁTICO DE VERBOS DO PORTUGUÊS BRASILEIRO PELOS ETIQUETADORES TREETAGGER E AUTOMATIC PARSE

Ano: 2014 | Volume: 11 | Número: 1
Autores: Flávia Regina de Santana Evangelista; Rebeca Rodrigues de Santana; Raquel Meister Ko Freitag
Autor Correspondente: Flávia Regina de Santana Evangelista | [email protected]

Palavras-chave: Etiquetagem. Processamento linguístico. Verbos. - Tagger. Linguistic processing. Verbs

Resumos Cadastrados

Resumo Português:

Por envolverem traços semânticos, morfológicos e pragmáticos, os verbos compõe uma classe gramatical complexa, o que torna complicado o seu processamento computacional, pois muitas vezes os analisadores automáticos não conseguem captar as minúcias de significação que são dependentes do contexto linguístico, gerando ambiguidades. Para aprimorar o processamento automático da linguagem, analisamos o desempenho de dois etiquetadores, o Automatic Parse e o Treetagger, a fim de observar as suas limitações na etiquetagem de verbos do português. Os resultados obtidos reforçam a necessidade de desenvolvimento de etiquetas semântico-discursivas para verbos nos analisadores automáticos, pois, apesar de serem poucos em relação ao número total de palavras do corpus, os erros de etiquetagem de verbos foram significativos e se mostraram frequentes.



Resumo Inglês:

Verbs involve semantic, morphologic and pragmatic features that compounds a complex grammatical class and this becomes complicate its computational processing because anytime automatic parsers fail at codifying specific meanings context dependents, resulting ambiguity in language. To improve theautomatic language processing we analyze the performance of two software taggers – Automatic Parse and Treetagger – in
verbs of Portuguese. The results point that is necessary the development of semantic-discursive tags to verbs in automatic taggers: besides few tag mistakes in the corpora these were recurrent in same contexts.