Le Monde en Surface et Le Monde profond
On distingue pour ce projet deux sous-corpus : Le Monde en surface et Le Monde profond. Le Monde en surface est composé des flux RSS récupérés de manière automatique et continue à partir du journal Le Monde. Le Monde profond se base sur l'archivage des flux RSS et des articles complets associés aux items décrits dans les flux.