@article{Berkenbrock_Tassinari_Mainardes_Lisboa_Rossoni_Godoy_Rossi_2019, title={APLICAÇÃO ANALYTICS COM ESTUDO DE CORRELAÇÃO: FATORES QUE INFLUENCIAM O CONSUMO DE PRODUTOS ORGÂNICOS EM UM SUPERMERCADO}, volume={4}, url={https://cesuscvirtual.com.br/CIC-CESUSC/article/view/446}, abstractNote={<p>Em 8 de maio de 2019 os alunos de todos os semestres do curso de Análise e Desenvolvimento de Sistemas participaram do III Aula Aberta. No evento estes foram organizados em equipes com no máximo 10 integrantes, e para cada equipe foi entregue um problema de ordem quantitativa. Os professores indicaram um Dataset (conjunto de dados disponibilizados para pesquisa na web ) para cada grupo com dois objetivos a serem alcançados. O primeiro, desenvolver uma rotina automatizada para captura, tratamento e carga dos dados de um site da web um Banco de Dados Não Relacional; o segundo, extrair os dados, armazená-los em uma planilha e realizar um estudo estatístico de correlação para identificar quais variáveis apresentam relação direta com a variável alvo determinada no problema apresentado. Para desenvolver a rotina automatizada utilizamos a linguagem de programação python, com o framework scrapy que importa diversas bibliotecas nativas, para armazenar os dados foi utilizado o Banco de Dados MongoDB. O problema apresentado para o grupo tem origem nos dados extraídos no <em>site</em> <a href="https://www.kaggle.com/papercool/organics-purchase-indicator">https://www.kaggle.com/papercool/organics-purchase-indicator</a> sob o título de <em>Organics Purchase Indicator  </em>tendo como alvo a identificação das variáveis que tem correlação com de clientes a consumir produtos orgânicos. O conjunto de dados contém 13 variáveis ​​e mais de 22.000 observações. Na rotina desenvolvida foi possível identificar o potencial para a automatização dos processos de captura, extração e análise de dados como forma de identificar soluções para problemas que tenham origem dados disponíveis na internet. A partir da implementação desta rotina e do conhecimento das tecnologias aplicadas os integrantes da equipe identificaram diversas outras aplicações. Após execução da rotina que capturou e armazenou os dados foram identificadas e extraídas as variáveis independentes A = Affluece Grade, B = Loyalty Status do dataset original e a variável Organic Purchase Count como dependente. Nos testes realizados as variáveis que apresentaram correlação significativa foram A = 0,5700 e B = 0,03.</p>}, number={1}, journal={CADERNOS DE INICIAÇÃO CIENTÍFICA}, author={Berkenbrock , Christian and Tassinari , Mitzrael and Mainardes , Allan and Lisboa , Guilherme and Rossoni , Afonso and Godoy , Pedro Gabriel and Rossi , Gisele Zommer}, year={2019}, month={nov.} }