Ces grands ensembles de données ont des sources multiples: contenus publiés sur le web ou échangés par messageries (images, vidéos, textes, sons, etc.) ;données émises par les capteurs (conditions météo, qualité de l' air, etc.) ;données transmises par les objets connectés; archives numérisées, opérations dématérialisées, etc.