Common Crawl es una fuente de datos web que expone de fuentes de datos y servicios de los datos recolectados por su robot de indexación web. Dispone de ejemplos de proyectos en muchos lenguajes y con diversas funcionalidades