Webscraping em R: uma abordagem para investigação em ciências sociais

Simbiótica

Endereço:
Universidade Federal do Espírito Santo - Av. Fernando Ferrari, 514, IC II, Sl. 21 - Goiabeiras
Vitória / ES
29075-910
Site: http://periodicos.ufes.br/simbiotica/index
Telefone: (27) 4009-7619
ISSN: 2316-1620
Editor Chefe: Claudio Marcio Coelho
Início Publicação: 31/05/2012
Periodicidade: Semestral
Área de Estudo: Antropologia, Área de Estudo: Ciência política, Área de Estudo: História, Área de Estudo: Sociologia, Área de Estudo: Multidisciplinar

Webscraping em R: uma abordagem para investigação em ciências sociais

Ano: 2021 | Volume: 8 | Número: 4
Autores: Quemuel Baruque de Freitas Rodrigues, Mayres Pequeno, Marina Félix de Melo, Amurabi Oliveira
Autor Correspondente: Quemuel Baruque de Freitas Rodrigues | [email protected]

Palavras-chave: ciências sociais, produção acadêmica, coleta de dados quantitativos, algoritmos.

Resumos Cadastrados

Resumo Português:

Este artigo apresenta uma breve introdução ao uso de algoritmos para coleta de dados em repositórios online em investigações no campo das ciências sociais a partir de um modelo empírico de pesquisa sobre produção acadêmica de bolsistas de produtividade do CNPq no Brasil. Metodologicamente, apresentamos uma pesquisa realizada com a aplicação da técnica computacional de elaboração de algoritmos e, em seguida, descrevemos o passo-a-passo do planejamento de algoritmo de scrapping a partir do software R. Busca-se não apenas tornar mais compreensível a técnica computacional para recolha de dados, como também fomentar sua utilização no campo das ciências sociais, tornando as coletas de dados em repositórios institucionais mais sistemáticas, transparentes, replicáveis e céleres.

Palavras-chave: ciências sociais; produção acadêmica; coleta de dados quantitativos; algoritmos.



Resumo Inglês:

This article presents a brief introduction to the algorithms for data collection used in online repositories in social sciences investigations based on empirical research on academic production of CNPq scientific productivity grants in Brazil. Methodologically, we present a study carried out to apply the computational technique of elaborating algorithms. Then we describe the step-by-step planning of the scrapping algorithm using the R software. The computational approach for data collection is understandable and promotes its use in the field of social sciences, making data collection in institutional repositories more systematic, transparent, replicable and quick.

Keywords: Social sciences; academic production; quantitative data collection; algorithms.



Resumo Espanhol:

Este artículo presenta una breve introducción al uso de algoritmos para la recolección de datos en repositorios en línea en investigaciones en el campo de las ciencias sociales a partir de un modelo de investigación empírica sobre la producción académica de becarios de productividad del CNPq en Brasil. Metodológicamente, presentamos una investigación realizada con la aplicación de la técnica computacional de elaboración de algoritmos y luego describimos la planificación paso a paso del algoritmo de scrapping utilizando el software R. La técnica computacional para la recolección de datos intenta promover su uso en el campo de las ciencias sociales, haciendo que la recolección de datos en los repositorios institucionales sea más sistemática, transparente, replicable y rápida.

Palavras clave: ciencias sociales; producción académica; recopilación de datos cuantitativos; algoritmos.