Dans ce projet, nous disposons des données permettant de décrire un ensemble d’articles scientifiques autour de l’intelligence artificielle tirés de Pubmed. Ces données sont regroupées dans un fichier json nommé ai_pub_samp.json. Au total, on a 10000 articles et pour chaque article on a le titre ‘title’, la catégorie ‘categories’, l’abstract 'abstract', et plusieurs autres informations comme les auteurs, le journal, l’année, les mots-clés, l’année ...
Nous nous proposons d’entrainer des modèles et de comparer leur performances. Ces modèles ont pour but de classifier les articles dans des catégories spécifiques ‘categories’ en fonction de leurs titres, abstract, ou les 2 rassemblés.
Pour mieux comprendre le travail et l'ensemble des résultats obtenus, vous pouvez voir le fichier PDF.