Mineração de dados: busca de conhecimento sobre a evolução do canto da família Thamnophilidae

AtoZ

Endereço:
Universidade Federal do ParanáSetor de Ciências Sociais Aplicadas // Av. Prefeito Lothário Meissner, 632 - Campus III - Jardim Botânico
Curitiba / PR
80210-170
Site: http://www.revistas.ufpr.br/atoz
Telefone: (04) 1336-0419
ISSN: 2237-826X
Editor Chefe: Profª. Drª. Maria do Carmo Duarte Freitas
Início Publicação: 31/07/2011
Periodicidade: Semestral
Área de Estudo: Ciência da computação, Área de Estudo: Administração, Área de Estudo: Ciência da informação, Área de Estudo: Comunicação, Área de Estudo: Multidisciplinar

Mineração de dados: busca de conhecimento sobre a evolução do canto da família Thamnophilidae

Ano: 2011 | Volume: 1 | Número: 1
Autores: Leticia da Costa e Silva, Denise Fukumi Tsunoda, Viviane Deslandes
Autor Correspondente: Leticia da Costa e Silva | [email protected]

Palavras-chave: mineração de dados, bases de dados, aves florestais, Thamnophilidae (ave), cantos dos pássaros.

Resumos Cadastrados

Resumo Português:

Introdução: Descreve a utilização de uma técnica de mineração de dados sobre o canto, a biologia e o micro-habitat da família Thamnophilidae (Aves) a fim de encontrar padrões que os relacionem.
Método: Uma base de dados foi construída em planilha Excel® relacionando 82 espécies da família da ave Thamnophilidae com diversos atributos referentes às características do canto, da biologia e do micro-habitat em que são encontradas. Na análise utilizou-se o algoritmo Apriori no software WEKA 3.7.1.
Resultados: Ao associar os diferentes atributos de 82 espécies diferentes considerando o suporte mínimo de 10% e a confiança mínima de 90% foram encontrados 172 padrões, dos quais 42 continham um dos atributos do canto: PC1 e PC2. Os padrões que relacionavam o atributo PC2 foram os mais significativos ao indicar a relação deste com o tamanho e gênero da família. Os resultados colaboraram para gerar a hipótese de que os atributos do canto possuem comportamentos não relacionados.
Conclusões: O experimento demonstrou que o algoritmo pode ser melhor aproveitado em bases de dados maiores e/ou cuja padronização dos dados apresente menor número de categorias, o que pode ser uma limitação no campo da macroecologia. Mas, ao mesmo tempo, se mostrou um instrumento alternativo para o estudo exploratório de relações entre diversos atributos, cujos resultados podem servir de objetos de análises mais aprofundadas.



Resumo Inglês:

Introduction: Describes the use of a data mining technique about the song, biology and micro-habitat of the Thamnophilidae bird family in order to find patterns which relate them.
Method: A database was built in Excel ® spreadsheet listing 82 species of the family of the bird Thamnophilidae comprising various attributes related to bird calling features, biology and micro-habitat in which they are found. For the analysis it was used the algorithm APRIORI in the WEKA 3.7.1 software.
Results: The association of the different attributes of the 82 different species, considering 10% of minimum support and 90% of minimum confidence, allowed the rescued of 172 patterns, from which 42 contained one of the song’s attributes: PC1 e PC2. The patterns which related the attribute PC2 were the most expressive ones due to its relation to the size and gender of the family.
Conclusions: The experiment demonstrated that the algorithm could be better suited in larger databases and/or when the data standardization presents a lower number of categories, what could be a limitation in the macroecology field. Nonetheless, it has presented itself as an alternative instrument to the exploratory study of the relations among diverse attributes, which results could serve as objects for further analysis.



Resumo Espanhol:

Introducción: Se describe la utilización de una técnica de minería de datos sobre el canto, la biología y el micro-habitat de la familia Thamnophilidae (Aves) con el fin de encontrar estándares que se relacionen. Metodología: Se construyó una base de datos en una planilla Excel relacionando 83 especies de la familia de las aves Thamnophilidae, con diferentes atributos referentes a las características del canto, de la biología y del micro-habitat en el cual se encontraban. En el análisis se utilizó el algoritmo Apriori en el software WEKA 3.7.1. Resultados: Al asociar los diferentes atributos de 82 especies diferentes considerando una base mínima de un 10% y una confianza mínima de 90% fueron encontrados 172 estándares, de los cuales 42 contenían dos atributos de canto: PC1 y PC2. Los estándares que relacionaban el atributo PC2 fueron los más significativos al indicar la relación de este con los tamaños y géneros de la familia. Los resultados ayudaron a generar una hipótesis de que los atributos de canto poseen comportamientos no relacionados. Conclusiones: La experiencia demostró que el algoritmo puede ser mejor aprovechado en bases de datos mayores y/o cuya estandarización de datos presente menor número de categorías, lo que puede ser una limitación en el campo de la macroecología. Pero, al mismo tiempo, se mostró un instrumento alternativo para el estudio exploratorio de relaciones entre diversos atributos, cuyos resultados pueden servir de objetos de análisis más profundos.