Benutzerdaten und ihre Analyse – Verwendung der Daten
In diesem Beitrag geht es um Daten und ihre Analyse. Im Internet, gerade in Sozialen Netzwerken, werden extrem viele Daten über das Verhalten und Angewohnheiten der Nutzer gesammelt. Diese Daten lassen sich strukturiert auswerten und es lassen sich Tendenzen für die Zukunft abgeben.
Datentypen
Verschiedene Arten von Daten werden als verschiedene Datentypen angesehen.
Personenbezogene Daten sind Daten, die zu einer natürlichen Person zurückführen. Dies wären z.B. Phisiologische Daten, wie Verhaltensmuster oder Angewohnheiten und z.B. Biographische Daten, wie z.B. Alter, Geschlecht, Name usw.
Big Data sind Daten, die auf Verhaltensmuster einer breiten Masse schließen lassen. Es werden keine personenbezogene Daten abgespeichert. Es werden lediglich Daten einer breiten Masse abgespeichert.
Es lassen sich von verschiedenen Datentypen verschiedene Statistiken ablesen. Es gibt im wesentlichen 2 verschiedene Statistiken.
Beschreibende Statistik (descriptive) sind Statistiken, die z.B. Mittelwerte oder Tendenzen angeben. Beschreibende Statistiken zielen hierbei auf vergangene Daten ab. Also alle Daten, die bereits bewiesen und gesammelt wurden.
Vorhersagende Statistik (predictive) sind Statistiken, die Vorhersagen angeben, wie etwas sein könnte in z.B. 5 Jahren. Vorhersagende Statistiken zielen gegenteilig zu der beschreibenden Statistik auf Daten ab, die noch in der Zukunft liegen.
Data Mining
Data Mining ist das Suchen nach Zusammenhängen in großen Datenmengen wie z.B. Big Data´s. Große Datenbroker in den USA sind unter anderem „Datalogix“, „eBureau“, „Peek You“ und „Recorded Future“.
Durch das Verknüpfen von Datensätzen durch Datenpunkte lassen sich Vorhersagen treffen. (Vorhersagende Statistik) Dies nennt sich dann Data Mining.
Datenquellen für die Datenbrooker sind z.B. Online-Shops, Webseiten, lokale Geschäfte, Unternehmen und Lokale Regierungsbehörden. Je nachdem welche Websites oder Dienststellen ihre Daten zur Verfügung stellen.