APLICAÇÃO ANALYTICS COM ESTUDO DE CORRELAÇÃO: FATORES QUE INFLUENCIAM NA QUALIDADE DO VINHO

Autores

  • Everton Bublitz Do Prado Faculdade CESUSC
  • Igor Andrey Strejevitch Faculdade CESUSC
  • Leonardo Martinelli Deves Faculdade CESUSC
  • Leonardo Tasca Faculdade CESUSC
  • Alesio Nicolas Barreiro Faculdade CESUSC
  • Arthur Dos Passos Rosa Faculdade CESUSC
  • Daniel Simone Beira Faculdade CESUSC
  • Matheus Da Silva Cardoso Faculdade CESUSC
  • Anelise Stahnke Faculdade CESUSC
  • Sergio Murilo Schütz Faculdade CESUSC

Resumo

Em 8 de maio de 2019 os alunos de todos os semestres de 2019 do curso de Análise e Desenvolvimento de Sistemas participaram do III Aula Aberta. No evento estes foram organizados em equipes com no máximo 10 integrantes, para cada equipe foi entregue um problema de ordem quantitativa. Os professores indicaram um Dataset (conjunto de dados disponibilizados para pesquisa) para cada grupo com dois objetivos a serem alcançados. O primeiro, desenvolver uma rotina automatizada para captura, tratamento e carga dos dados de um site da web para um Banco de Dados Não Relacional; o segundo, extrair os dados, armazená-los em uma planilha e realizar um estudo estatístico de correlação para identificar quais variáveis apresentam relação direta com a variável alvo determinada no problema apresentado. Para desenvolver a rotina automatizada utilizamos a linguagem de programação PYTHON, com as bibliotecas SELENIUN e PANDAS, para armazenar os dados foi utilizado o Banco de Dados MONGODB. O problema apresentado para  nosso grupo tem origem nos dados extraídos no site https://www.kaggle.com/uciml/red-wine-quality-cortez-et-al-2009  sob o título de Red Wine Quality tendo como alvo a identificação das variáveis que tem correlação com a qualidade do vinho. Foi definido um limite arbitrário para sua variável dependente (qualidade do vinho) em 7 ou superior sendo classificado como 'bom / 1' e o restante como 'não bom / 0'. Na rotina desenvolvida foi possível identificar o potencial para a automatização dos processos de captura, extração e análise de dados como forma de identificar soluções para problemas que tenham origem dados disponíveis na internet. A partir da implementação desta rotina e do conhecimento das tecnologias aplicadas os integrantes da equipe identificaram diversas outras aplicações. Após execução da rotina que capturou e armazenou os dados foram identificadas e extraídas as variáveis independentes fixed acidity, volatile acidity, citric acid, residual sugar, chlorides, free sulfur dioxide, total sulfur dioxide, density, pH, sulfates e alcohol do dataset original e a variável quality como dependente. Nos testes realizados nenhuma das variáveis apresentaram correlação significativa, apenas a variável residual sugar=0.5709 apresentou certo grau de correlação.

Downloads

Publicado

2019-11-12

Como Citar

Prado, E. B. D. ., Strejevitch, I. A. ., Deves, L. M. ., Tasca, L. ., Barreiro , A. N. ., Rosa, A. D. P. ., Beira, D. S. ., Cardoso, M. D. S. ., Stahnke, A. ., & Schütz, S. M. . (2019). APLICAÇÃO ANALYTICS COM ESTUDO DE CORRELAÇÃO: FATORES QUE INFLUENCIAM NA QUALIDADE DO VINHO. CADERNOS DE INICIAÇÃO CIENTÍFICA, 4(1). Recuperado de https://cesuscvirtual.com.br/CIC-CESUSC/article/view/442

Edição

Seção

Resumos - Análise e Desenvolvimento de Sistemas

Artigos mais lidos pelo mesmo(s) autor(es)

1 2 3 4 > >>