Extração de Informação e Mineração de Dados no Diário Oficial de Pernambuco

REPA - Revista de Engenharia e Pesquisa Aplicada

Endereço:
Rua Benfica, n. 455 - Madalena
Recife / PE
50720001
Site: http://revistas.poli.br/index.php/repa/index
Telefone: (81) 3184-7513
ISSN: 2525-4251
Editor Chefe: Diego José Rátiva Millan
Início Publicação: 01/10/2018
Periodicidade: Quadrimestral
Área de Estudo: Ciências Exatas, Área de Estudo: Engenharias

Extração de Informação e Mineração de Dados no Diário Oficial de Pernambuco

Ano: 2018 | Volume: 3 | Número: 3
Autores: R. B. das Neves Junior, W. F. de M. Melo, R. A. de A. Fagundes, A. M. A. Maciel
Autor Correspondente: R. B. das Neves Junior | [email protected]

Palavras-chave: Mineração de Dados; Diário Oficial; Árvore de Decisão;

Resumos Cadastrados

Resumo Português:

O uso de técnicas de mineração de dados tem sido amplamente utilizado para o processamento de uma grande quantidade de dados documentados. No entanto, atualmente, poucos aplicativos mostraram-se efetivos para extrair e minerar dados em diários oficiais. Este trabalho tem como objetivo apresentar um método para construção de uma aplicação que usa um algoritmo para indexar conteúdo da base do Diário Oficial do Estado de Pernambuco, transformando as informações anteriormente disponíveis no texto para o formato estruturado, para aplicar uma Mineração de Dados. Para o desenvolvimento do método, a linguagem Java foi utilizada, com a possibilidade do aplicativo web. O estudo de caso baseou-se em documentos publicados no Diário Oficial de janeiro de 2007 a abril de 2017. Os resultados mostram que é possível indexar e estruturar esses dados, mas ainda há necessidade de uma melhor padronização dos dados.



Resumo Espanhol:

The use of Data Mining techniques has been widely applied for processing a high amount of documented data. However, to date, there are very few effective applications for extracting and mining data in official journals. This work aims to present a method for the construction of an application that uses an algorithm to index contents of the base of the Official Gazette of the state of Pernambuco, transforming the information previously available in the text to structured format, to apply a Mining of Data. For the development of the method, the Java language was used, with the possibility of the web application. The case study was based on documents published in the Official Gazette from January 2007 to April 2017. The results show that it is possible to index this data and give meaning to it, but there is still a need for a better standardization of the data.