APLICAÇÃO ANALYTICS COM ESTUDO DE CORRELAÇÃO: FATORES QUE INFLUENCIAM O CONSUMO DE CERVEJA

Autores

  • Artur Ferreira Braz Faculdade CESUSC
  • Bruno Pessi x Bruno Pessi Derzi Faculdade CESUSC
  • Clarissa Costa Martins Faculdade CESUSC
  • Diéssica Gomes de Andrade Faculdade CESUSC
  • Gabriela da Rocha Faculdade CESUSC
  • Jessica Carolina Piovezani Faculdade CESUSC
  • Patrick Santos Faculdade CESUSC
  • Pedro Rodolfo Kalva Junior Faculdade CESUSC
  • Thiago Cabral Faculdade CESUSC
  • Steve Andrade Faculdade CESUSC
  • Luiz Claudio Duarte Dalmolin Faculdade CESUSC

Resumo

Em 8 de maio de 2019 os alunos de todos os semestres de 2019 do curso de Análise e Desenvolvimento de Sistemas participaram do III Aula Aberta. No evento estes foram organizados em equipes com no máximo 10 integrantes, para cada equipe foi entregue um problema de ordem quantitativa. Os professores indicaram um Dataset (conjunto de dados disponibilizados para pesquisa) para cada grupo com dois objetivos a serem alcançados. O primeiro, desenvolver uma rotina automatizada para captura, tratamento e carga dos dados de um site da web um Banco de Dados Não Relacional; o segundo, extrair os dados, armazená-los em uma planilha e realizar um estudo estatístico de correlação para identificar quais variáveis apresentam relação direta com a variável alvo determinada no problema apresentado. Para desenvolver a rotina automatizada utilizamos a linguagem de programação Python, com as bibliotecas Selenium, para armazenar os dados foi utilizado o Banco de Dados Pandas. O problema apresentado para  nosso grupo tem origem nos dados extraídos no site https://www.kaggle.com/dongeorge/beer-consumption-sao-paulo  sob o título de Beer Consumption - Sao Paulo tendo como alvo a variável de consumo de cerveja e quais variáveis a influenciam. Os dados foram coletados em São Paulo - Brasil, em uma área universitária, onde existem algumas festas com grupos de alunos de 18 a 28 anos de idade. O conjunto de dados utilizado para esta atividade possui 7 atributos, sendo um alvo, com período de um ano. Na rotina desenvolvida foi possível identificar o potencial para a automatização dos processos de captura, extração e análise de dados como forma de identificar soluções para problemas que tenham origem dados disponíveis na internet. A partir da implementação desta rotina e do conhecimento das tecnologias aplicadas os integrantes da equipe identificaram diversas outras aplicações. Após execução da rotina que capturou e armazenou os dados foram identificadas e extraídas as variáveis independentes Data, Temperatura média, Temperatura mínima, Temperatura máxima, Precipitação e Final de semana do dataset original e a variável Consumo de cerveja como dependente. Nos testes realizados as variáveis que apresentaram correlação significativa foram Temperatura média = 0,574615 e Temperatura máxima= 0,642672.

Downloads

Publicado

2019-11-12

Como Citar

Braz , A. F. ., Bruno Pessi Derzi , B. P. x, Martins , C. C. ., Andrade , D. G. de, Rocha , G. da ., Piovezani , J. C. ., Santos , P. ., Kalva Junior , P. R. ., Cabral , T. ., Andrade , S. ., & Dalmolin , L. C. D. . (2019). APLICAÇÃO ANALYTICS COM ESTUDO DE CORRELAÇÃO: FATORES QUE INFLUENCIAM O CONSUMO DE CERVEJA. CADERNOS DE INICIAÇÃO CIENTÍFICA, 4(1). Recuperado de https://cesuscvirtual.com.br/CIC-CESUSC/article/view/445

Edição

Seção

Resumos - Análise e Desenvolvimento de Sistemas