@article{Júnior_Pereira_Guerreiro_Malicheski_Gomes_Dias_Costa_2019, title={APLICAÇÃO ANALYTICS COM ESTUDO DE CORRELAÇÃO: FATORES QUE INFLUENCIAM NO PREÇO DE MOTOCICLETAS USADAS}, volume={4}, url={https://cesuscvirtual.com.br/CIC-CESUSC/article/view/443}, abstractNote={<p>Em 8 de maio de 2019 os alunos de todos os semestres de 2019 do curso de Análise e Desenvolvimento de Sistemas participaram do III Aula Aberta. No evento estes foram organizados em equipes com no máximo 10 integrantes, para cada equipe foi entregue um problema de ordem quantitativa. Os professores indicaram um Dataset (conjunto de dados disponibilizados para pesquisa) para cada grupo com dois objetivos a serem alcançados. O primeiro, desenvolver uma rotina automatizada para captura, tratamento e carga dos dados de um site da web para um Banco de Dados Não Relacional; o segundo, extrair os dados, armazená-los em uma planilha e realizar um estudo estatístico de correlação para identificar quais variáveis apresentam relação direta com a variável alvo determinada no problema apresentado. Para desenvolver a rotina automatizada utilizamos a linguagem de programação Phyton, com as bibliotecas Pandas, CSV e Pymongo, para armazenar os dados foi utilizado o Banco de Dados MongoDB. O problema apresentado para nosso grupo tem origem nos dados extraídos no <em>site</em> <a href="https://www.kaggle.com/dan195/ebaymotorcycles">https://www.kaggle.com/dan195/ebaymotorcycles</a> sob o título de <em>Ebay Motorcycle Prices </em>tendo como alvo a identificação das variáveis que tem correlação com a preço de motocicletas a venda no <em>ebay</em>. O dataset foi obtido do site do ebay O conjunto de dados foi retirado do site do Ebay em 21 de agosto e mostra todas as listagens disponíveis naquele momento. Na rotina desenvolvida foi possível identificar o potencial para a automatização dos processos de captura, extração e análise de dados como forma de identificar soluções para problemas que tenham origem dados disponíveis na internet. A partir da implementação desta rotina e do conhecimento das tecnologias aplicadas os integrantes da equipe identificaram diversas outras aplicações. Após execução da rotina que capturou e armazenou os dados foram identificadas e extraídas as variáveis independentes Condição, Modelo, Marca, Milhagem e Números de Revisão do dataset original e a variável Preço como dependente. Nos testes realizados as variáveis que apresentaram correlação significativa foram Milhagem= -0,684 e número de revisão = 0,825.</p>}, number={1}, journal={CADERNOS DE INICIAÇÃO CIENTÍFICA}, author={Júnior, Gildo and Pereira, Vinicius and Guerreiro, Marcos and Malicheski, Mateus and Gomes, Nicholai and Dias, Ibsem Agrello and Costa, Rejane}, year={2019}, month={nov.} }