Projeto realizado para a disciplina de ciências de dados. O dataset escolhido pelo grupo foi o imdb-and-tmdb-movie-metadata-big-dataset-1m disponível no kaggle.
O projeto contém distintas etapas de exploração dos dados disponíveis. Por exemplo, descobrimos que o dataset possui uma grande quantidade de budget e revenue faltantes, cerca de 95% do dataset. Por isso, nossa análise financeira foi prejudicada, mas ainda assim a fizemos apenas com os dados disponíveis.
Além disso, realizamos o pré processamento, contando com a limpeza e exploração dos dados. Após fizemos a análise univariada das features. E por fim, a análise bivariada.

