„The Obscure Art of Data Design“ – oder ich glaube auch nur an den Datensatz, den ich selbst erzeugt habe.

· · · | Daten

Lesedauer < 1 Minute

Dies ist für mich das Äquivalent des digitalen Zeitalters zu dem schönen Satz: „Ich traue keiner Statistik, die ich nicht selbst gefälscht habe.“ Viele halten Daten heutzutage ja für das neue Öl. Zumindest scheinen sie das Material und der Rohstoff einer digitalen Alchemie zu sein, der vermeintlich alles in „Gold“ verwandeln kann.

Aber ist das wirklich so? Und was macht das „Versprechen“ der Datenanalyse so attraktiv? Viele glauben mit nur genug Mathematik kann man aus jedem Datensatz die „Wahrheit“ oder „Realität“ extrahieren. Sie versprechen quasi die ultimative Objektivität eines Sachverhaltes herstellen zu, wenn man nur die richtige Analyse fährt.

Allzuoft wird dabei vergessen, dass selbst schon bei der Auswahl der Datenpunkte oder Sätze bereits intentionale und subjektive Entscheidungen getroffen wurden, die keineswegs zu Objektiven Ergebnissen führen. Das heißt nicht, dass man anhand von Datenanalysen zu relevanten Informationen und Erkenntnissen kommen könnte. Es heißt aber auch, dass nicht jeder Datensatz in „Gold“ verwandelt werden kann.

„don’t equate data with magic. Garbage doesn’t turn into gold, no matter how much math you throw at it. Industry’s fascination with data alchemy is as embarrassing as the 15th-century fascination with muttering Latin mumbo jumbo over iron filings.“

In ihrem Artikel „The Obscure Art of Data Design“ beschreibt Cassie Kozyrkov auf wundervolle Weise, dass man Daten eben nicht mit Magie verwechseln sollte und man viel häufiger auf Müll/ Garbage trifft als auf Gold. Datensätze nutzbar zu machen ist harte Arbeit. Nützliche Informationen und Erkenntnisse aus ihnen abzuleiten ist ungleich härter.