Seturi de date extrem de mari și complexe, care sunt analizate computațional pentru a dezvălui modele, tendințe și asocieri, adesea în legătură cu comportamentul și interacțiunile umane. Aceste date sunt prea mari sau complexe pentru a fi tratate de software-uri tradiționale de procesare a datelor.