Os dados que foram utilizados estão disponíveis na plataforma Kaggle. É um dataset da Amazon, composto pelo número de estrelas, as reviews e as URLs de cada livro de data science. Será feita uma classificação dos comentários, a partir da quantidade de estrelas que apresentou. Para saber mais sobre o dataset, confira o link: https://www.kaggle.com/vvorotnikov/amazon-data-science-book-reviews
Para este projeto de Processamento de Linguagem Natural (em inglês Natural Language Processing - NLP), utilizei fundamentalmente as bibliotecas NLTK e Scikit-Learn.