APLICAÇÃO ANALYTICS COM ESTUDO DE CORRELAÇÃO: FATORES QUE INFLUENCIAM NO DESEMPENHO DE CONSUMO DE COMBUSTÍVEL

Autores

  • Felipe Cardoso Faculdade CESUSC
  • Fernando Poletto Faculdade CESUSC
  • Jeferson Roberto Faculdade CESUSC
  • Andres Jaramillo Faculdade CESUSC
  • André Boa Sorte Faculdade CESUSC
  • Elcimar Silva Faculdade CESUSC
  • Paulo André Lima Faculdade CESUSC
  • Estefania Menendez Faculdade CESUSC
  • Bruno Loschenkohl Faculdade CESUSC
  • Roberto Fabiano Fernandes Faculdade CESUSC

Resumo

RESUMO

Em maio de 2019 os alunos de todos os semestres do curso de Análise e Desenvolvimento de Sistemas participaram da 3ª Aula Aberta da edição de 2019/1. No evento estes foram organizados em equipes com no máximo 10 integrantes, onde para cada equipe foi entregue um problema de ordem quantitativa. Os professores indicaram um Dataset (conjunto de dados disponibilizados para pesquisa na web) para cada grupo com dois objetivos a serem alcançados. O primeiro, desenvolver uma rotina automatizada para captura, tratamento e carga dos dados de um site da web o Banco de Dados Não Relacional; o segundo, extrair os dados, armazená-los em uma planilha e realizar um estudo estatístico de correlação para identificar quais variáveis apresentam relação direta com a variável alvo determinada no problema apresentado. Para desenvolver a rotina automatizada utilizamos a linguagem de programação Python, com as bibliotecas Selenium, ZipFile e Pandas, para armazenar os dados foi utilizado o Banco de Dados MongoDB. O problema apresentado para nosso grupo tem origem nos dados extraídos no site https://www.kaggle.com/anderas/car-consume sob o título de Car Fuel Consumption tendo como alvo a identificação das variáveis que influenciam no consumo de combustível dependendo do seu tipo. O dataset possui dois tipos de combustível e os dados foram extraídos em duas estações distintas no ano, primavera e inverno. Na rotina desenvolvida foi possível identificar o potencial para a automatização dos processos de captura, extração e análise de dados como forma de identificar soluções para problemas que tenham origem dados disponíveis na internet. A partir da implementação desta rotina e do conhecimento das tecnologias aplicadas os integrantes da equipe identificaram diversas outras aplicações. Após execução da rotina que capturou e armazenou os dados foram identificadas e extraídas as variáveis independentes distância, velocidade, temperatura interna, temperatura externa, tipo de combustível, ar condicionado, chuva e sol do dataset original e a variável “consumo” como dependente. Dentro do processo de testes realizados com as variáveis para a busca da correlação significativa o estudo em questão ainda está em fase de desenvolvimento.

Downloads

Publicado

2019-11-12

Como Citar

Cardoso , F. ., Poletto , F. ., Roberto , J. ., Jaramillo , A., Boa Sorte , A. ., Silva , E. ., Lima , P. A. ., Menendez , E. ., Loschenkohl , B. ., & Fernandes , R. F. . (2019). APLICAÇÃO ANALYTICS COM ESTUDO DE CORRELAÇÃO: FATORES QUE INFLUENCIAM NO DESEMPENHO DE CONSUMO DE COMBUSTÍVEL. CADERNOS DE INICIAÇÃO CIENTÍFICA, 4(1). Recuperado de https://cesuscvirtual.com.br/CIC-CESUSC/article/view/447

Edição

Seção

Resumos - Análise e Desenvolvimento de Sistemas

Artigos mais lidos pelo mesmo(s) autor(es)

1 2 > >>