Die Verarbeitung/Analyse von Daten umfasst insbesondere Aggregation von Daten, aber auch die Erzeugung neuer Informationen aus Daten unter Nutzung verschiedener Datenanalysemethoden, wie zum Beispiel Clustering, Assoziation und Klassifikation.
Beim Aggregieren von Daten geht es darum mehrere Datenpunkte zu Information zu verdichten. Um zu erfahren, wo besonders viele Menschen an Cholera gestorben sind, lassen sich all jene Einträge in der Tabelle cholera tote mit denselben Koordinaten zählen. Jetzt enthält die Tabelle die Koordinaten nicht mehr mehrfach, sondern lediglich einmal und die entsprechende Anzahl dort verstorbener Personen.