Análise de domínio da produção científica sobre Coleta de Dados no contexto do Institute of Electrical And Electronics Engineers

Sociograma dos autores. Copyright para Fernando de Assis Rodrigues. Anais de Congresso

Este estudo teve como objetivo identificar pesquisas que versam sobre a temática de coleta de dados. Para tanto foi utilizada análise de domínio em publicações científicas, com a aplicação de uma análise de citações e cocitações.

A identificação dos representantes da temática de coleta de dados e a interlocução existente entre eles foi obtida a partir do processamento dos conjuntos de metadados sobre publicações em periódicos disponíveis da base de conhecimento IEEE Xplore(r) Digital Library.

Como estratégia de busca, utilizou-se na interface de busca avançada os termos ‘Data Collecting’, ‘Data Collect’ e ‘Data Gathering’, concatenados pelo operador booleano ‘OU’. Foram recuperados dados sobre 2.278 publicações e a amostra foi delimitada aos artigos publicados em periódicos científicos entre os anos de 1954 e 2018, totalizando 281 publicações.

Para cada artigo, foi coletado o conjunto de referências na forma de documento HTML. Sobre o conteúdo obtido foi aplicado um algoritmo para a conversão das referências de HTML para CSV e a serialização das referências para o padrão de estilo IEEE Editorial Style.

Foram processadas 5.867 referências e identificados 8.267 autores, sendo descartadas 270 referências por estarem fora do padrão. Aplicou-se a Lei do Elitismo de Price para a delimitação do corpo de autores nas análises de citação e cocitação, totalizando 91 autores, número este que foi arredondado para 94 para contabilizar mais 3 autores que possuíam o mesmo número de citação do 91º autor.

Posteriormente, aplicou-se um algoritmo para a geração das matrizes i) citados e citantes e ii) de frequência absoluta de cocitação. A partir destes dados, a identificação de informações sobre nacionalidade e associação institucional foram obtidas por processamento manual.

Foram calculados os indicadores de rede social: i) Densidade da Rede, representando a intensidade de relacionamentos entre autores da rede e ii) Centralidade de Grau, representando o número de ligações incidentes em um autor.

A análise dos dados resultou em uma Densidade de Rede no valor de 3,20 e desvio padrão amostral de 3,34, ou seja, cada pesquisador têm aproximadamente 3 relacionamentos com pares da rede; e Centralidade de Grau no valor de 20,93%, demonstrando dispersão, com cada vértice possuindo 20,93% de probabilidade de receber alguma interação da rede.

A dispersão está associada com a amplitude do domínio analisado, pois coleta de dados é um tema recorrente em diferentes áreas do conhecimento, mas aderente ao contexto de publicação dos periódicos da IEEE.

Ao analisar a Centralidade de Grau dos autores individualmente, é possível observar uma relação com a quantidade de citações recebidas, uma vez que os 13 principais autores do índice de Centralidade de Grau são também os mais citados, representando 25,16% de todas as citações recebidas da rede. Neste grupo, foi identificado uma média de 7,69% de representatividade de cada autor no total de citações, com amplitude variando entre 6,12% e 11,76%.

Conclui-se que a temática apesar de amplamente citada apresenta um núcleo estadunidense, ligado às instituições UC, USC e MIT.

Palavras-chave: Coleta de Dados. Análise de Domínio. IEEE.

Autores

  1. Fernando de Assis Rodrigues
  2. Fábio Mosso Moreira
  3. Ricardo César Gonçalves Sant’Ana

Texto completo

  1. X EIICA
  2. Research Gate
Fernando de Assis Rodrigues
Dr. Fernando de Assis Rodrigues é professor na Universidade Federal do Pará, Brasil.