Adam Mohamed Ali Fadlalla
Data Mining ist der Prozess der Identifizierung gültiger, neuer, nützlicher und verständlicher Muster in Daten und der Extraktion oder Entdeckung nützlicher Zusammenfassungen von Datenmustern oder Wissen aus riesigen Datenmengen aus riesigen Datenmengen und wird auch als KDD Knowledge Discovery in Datenbanken bezeichnet. Ein KDD-Prozess umfasst Datenbereinigung, Data Mining, Datenauswahl, Transformation, Datenintegration, Musterbewertung und Wissenspräsentation. Es handelt sich um ein explosives Wachstum von Daten von Terabytes bis Petabytes. Die Zusammenführung mehrerer Disziplinen umfasst maschinelles Lernen, Statistik, künstliche Intelligenz, Visualisierung, Hochleistungsrechnen, Datenbanktechnologie, Algorithmen, Mustererkennung. Zu den Anwendungen gehören biologische und medizinische Datenanalyse: Klassifizierung, Clusteranalyse und Microarray-Datenanalyse, Web Mining.