Identificando características semânticas de conjuntos de dados de interação do usuário por meio da aplicação de uma análise de dados

Em uma avaliação de uma decisão, o fato analisado precisa receber insumos de múltiplas fontes de dados – estruturando, integrando, armazenando e processando dados coletados em uma saída que suporta uma melhor compreensão do fato dos dados, permitindo novas dimensões de análise.
O objetivo deste estudo é identificar as características semânticas dos atributos de dados no momento da coleta, das estruturas de datasets encontradas nas interfaces de exportação de dados nas ferramentas de análise de interações do usuário, nos canais de comunicação da Internet e nas ferramentas de dados analíticas da web envolvidas em um periódico científico. gestão, através de uma aplicação de um processo de análise de dados e técnicas de modelagem de dados.
A pesquisa foi delimitada para conjuntos de dados exportáveis ​​disponíveis em interfaces do Open Journal Systems, do Google Analytics e do Search Console, do Twitter Analytics e do Facebook Insights.
Adotou-se uma metodologia de análise exploratória para identificar características sobre como os dados estão disponíveis e estruturados sobre esses recursos de dados. Os conceitos de Modelagem de Relacionamento de Entidade foram aplicados para projetar e armazenar dados coletados dos serviços, recursos, conjuntos de dados e atributos.
Além disso, os dados coletados foram processados ​​em outra estrutura de dados, adotando-se o cubo de processamento analítico on-line como uma representação tridimensional de elementos, atuando como perspectivas de análise.
Esta análise de dados identificou dissonâncias semânticas nas definições de atributos em entidades, que podem interferir no processo de desenvolvimento de relações entre atributos de diferentes conjuntos de dados, diminuindo o potencial de interoperabilidade.

Palavras-chave: An[alise de Dados. Coleta de Dados. Dados. Redes Sociais Online. Dados de usuário.

Autores

  1. Fernando de Assis Rodrigues
  2. Pedro Henrique Santos Bisi
  3. Ricardo César Gonçalves Sant’Ana

Texto completo disponível em

  1. ISKO
  2. Research Gate

Estudo de aderência entre padrões de representação de dados sobre entidades

Projetos de sistemas de informação voltados à disseminação de dados originários e destinados para setores específicos necessitam de estruturas na fase de armazenamento que propiciem esta disseminação. Uma das entidades presentes neste contexto é a formalização da representação de pessoas, empresas e organizações e para a explicitação deste tipo de informação é necessário um conjunto específico de atributos. Entretanto, distintas aplicações destes conjuntos de dados são realizadas com o uso diferentes padrões e estruturas, o que torna complexo o armazenamento unificado deste tipo de informação.

Portanto, o objetivo deste trabalho é estudar a aderência entre os padrões de representação de dados vCard e o vocabulário Friend of a Friend (FOAF), definindo um núcleo comum para a explicitação de entidades desta temática para setores específicos – com independência tecnológica – necessárias à estruturação de bases de dados na fase de armazenamento destes conjuntos de dados.

Ações para disponibilização de datasets governamentais em Linked Open Data

Os princípios de Linked Open Data (LOD) estabelecem um novo modo de compartilhamento de datasets (conjuntos de dados) abertos pela internet, com objetivo de promover a ampla distribuição de dados estruturados em linguagens como a eXtensible Markup Language (XML) e em concomitância com as recomendações do padrão Resource Description Framework (RDF).

Neste cenário, datasets governamentais têm papel de destaque: representam 18,58% da quantidade total de datasets de LOD existentes e 41,54% destes datasets governamentais possuem ao menos um vínculo com ontologias ou vocabulários controlados, segundo resultados do mapeamento elaborado pelo projeto Linking Open Data cloud diagram.

Entretanto, ainda existem características nas estruturas dos datasets de LOD no momento da recuperação de dados que não são consideradas ideais ou boa prática adotada, tais como a ausência de metadados e de licenças de uso. Ações para tornar acessíveis dados governamentais públicos são parte integrante de discussões sobre tendências de modernização dos modelos de administração pública, que procuram redistribuir competências e recursos dentre diferentes organizações intra e extragovernamentais, permitindo um maior pluralismo institucional nas funções públicas.

Elaboração de estratégia para mensuração de critérios de qualidade na recuperação de datasets disponíveis em sítios governamentais

Este texto descreve estudo realizado a partir de documentos propostos pelo Open Data for Development, na fase de recuperação e focando no objetivo da qualidade dos dados, em especial ao analisar estruturas de páginas com especificações descritivas de datasets governamentais, no intuito de identificar formas de mensurar nestes ambientes os critérios de qualidade.