Big Data er et begreb, der dækker over datasæt, som er for store, for komplekse eller flyder for hurtigt til at kunne håndteres med traditionelle databaseteknologier. Begrebet defineres ofte gennem de tre V’er: Volume (mængden af data), Velocity (hastigheden hvormed data genereres) og Variety (forskelligheden i datakilder og formater). Nogle tilføjer yderligere to V’er: Veracity (kvaliteten og pålideligheden) og Value (den forretningsværdi, der kan udvindes). I praksis kan Big Data komme fra mange kilder: sensorer i Internet of Things-enheder, sociale medier, transaktionslogs, satellitbilleder, video- og lydoptagelser, og meget mere. Datamængderne er i dag så store, at vi taler om petabytes og endda exabytes – milliarder af gigabytes. Hvad der gør Big Data særligt spændende, er ikke bare størrelsen, men mulighederne det skaber. Med tilstrækkelig data kan maskinlæringsmodeller opdage mønstre, der er usynlige for mennesker, forudse begivenheder før de sker, og optimere processer på måder, der aldrig før har været mulige.