Version [61883]
Dies ist eine alte Version von WissMDataMining erstellt von LMesserschmidt am 2015-11-23 12:03:43.
Data Mining
Data Mining bezeichnet die Filterung des Wissens aus vorhandenen Daten, nicht das Generieren von Daten. D.h. die Daten sind bereits vorhanden und es geht nun darum, daraus Wissen abzuleiten.
Ziel: Querverbindungen und Trends erkennen
- Filterung von Zusammenhängen aus großen Datenmengen mit computergestützten Methoden
- Zusammenhänge wären anders nicht erkennbar
- Data Mining bezeichnet den Analyseschritt des Prozesses
Data Mining - Prozess:
- Fokussieren: die Datenerhebung und Selektion, aber auch das Bestimmen bereits vorhandenen Wissens
- Vorverarbeitung: die Datenbereinigung, bei der Quellen integriert werden, beispielsweise durch Entfernen oder Ergänzen von unvollständigen Datensätzen
- Transformation in das passende Format für den Analyseschritt
- Data-Mining, der eigentliche Analyseschritt
- Evaluation der gefundenen Muster durch den Experten und Kontrolle der erreichten Ziele