A ciência de dados é um campo interdisciplinar que utiliza métodos, processos, algoritmos e sistemas científicos para extrair conhecimento e informações valiosas de dados estruturados e não estruturados. Para transformar dados em conhecimento significativo e útil são necessárias ferramentas e habilidades especializadas. Em vista disso, a ciência de dados é um conceito amplo, que busca unificar técnicas estatísticas, análise de dados, aprendizado de máquina, conhecimento de domínio e ciência da informação com o intuito de entender e analisar “fenômenos reais" com os dados. A análise exploratória de dados (EDA) é uma abordagem para analisar conjuntos de dados para resumir suas principais características, geralmente com métodos visuais. Um modelo estatístico pode ser usado ou não, mas principalmente a EDA é para ver o que os dados podem dizer para além da tarefa formal de modelagem ou teste de hipóteses.