APLICAÇÃO ANALYTICS COM ESTUDO DE CORRELAÇÃO: FATORES QUE INFLUENCIAM O CONSUMO DE ÁLCOOL DOS ESTUDANTES

Autores

  • Pedro Henrique Medeiros Tomasi Faculdade CESUSC
  • Thyago de Souza Pereira Faculdade CESUSC
  • Lean Enzo Constantino Lima
  • Rafael Alexandre Izidoro Hessim Faculdade CESUSC
  • Lucas Góes Faculdade CESUSC
  • Isadora Fagundes Gonçalves Faculdade CESUSC
  • Mariah Rodrigues Faculdade CESUSC
  • Fabio Luiz Piggosso Faculdade CESUSC
  • Aline Jessica Rodrigues da Silva Faculdade CESUSC
  • André de Oliveira Leite Faculdade CESUSC

Resumo

Em maio deste ano os alunos de todos os semestres do curso de Análise e Desenvolvimento de Sistemas participaram da 3ª Aula Aberta da edição 2019. No evento este foram organizados em equipes com no máximo 10 integrantes, para cada equipe foi entregue um problema de ordem quantitativa. Os professores indicaram um Dataset (conjunto de dados abertos disponibilizados para pesquisa via web) para cada grupo com dois objetivos a serem alcançados. O primeiro, desenvolver uma rotina automatizada para captura, tratamento e carga dos dados de um site da web para um Banco de Dados Não Relacional; o segundo, extrair os dados, armazená-los em uma planilha e realizar um estudo estatístico de correlação para identificar quais variáveis apresentam relação direta com a variável alvo determinada no problema apresentado. Para desenvolver a rotina automatizada utilizamos a linguagem de programação Python, com as bibliotecas csv, json e pandas e para armazenar os dados foi utilizado o Banco de Dados MongoDB. O problema apresentado para o grupo tem origem nos dados extraídos no site https://www.kaggle.com/uciml/student-alcohol-consumption sob o título de Student Alcohol Consumption tendo como alvo a identificação das variáveis que tem correlação com a performance dos alunos e o consumo de álcool. O dataset foi obtido em uma pesquisa com estudantes de cursos de matemática e português no ensino médio. Na rotina desenvolvida foi possível identificar o potencial para a automatização dos processos de captura, extração e análise de dados como forma de identificar soluções para problemas que tenham origem dados disponíveis na internet. A partir da implementação desta rotina e do conhecimento das tecnologias aplicadas, os integrantes da equipe identificaram diversas outras aplicações. Após execução da rotina que capturou e armazenou os dados foram identificadas e extraídas as variáveis independentes sexo, idade, status de coabitação dos pais, guardião, relacionamentos, notas, qualidade das relações familiares e tempo livre do dataset original e as variáveis consumo de álcool diário e consumo de álcool no final de semana como dependentes. No processo de testes, os objetivos dos valores das variáveis ainda estão sendo levantados para futuras correlações significativas.

Downloads

Publicado

2019-11-12

Como Citar

Tomasi , P. H. M. ., Pereira , T. de S. ., Lima , L. E. C. ., Hessim , R. A. I. ., Góes , L. ., Gonçalves , I. F. ., Rodrigues , M. ., Piggosso , F. L. ., Silva , A. J. R. da ., & Leite , A. de O. . (2019). APLICAÇÃO ANALYTICS COM ESTUDO DE CORRELAÇÃO: FATORES QUE INFLUENCIAM O CONSUMO DE ÁLCOOL DOS ESTUDANTES. CADERNOS DE INICIAÇÃO CIENTÍFICA, 4(1). Recuperado de https://cesuscvirtual.com.br/CIC-CESUSC/article/view/444

Edição

Seção

Resumos - Análise e Desenvolvimento de Sistemas

Artigos mais lidos pelo mesmo(s) autor(es)