Zeitschrift für Kernenergiewissenschaft und Energieerzeugungstechnologie

Kompakte Baumstrukturen für das Mining von Objektsätzen mit hohem Nutzen

Hailye Tekleselase

Das High Utility Itemset Mining (HUIM) aus großen Transaktionsdatenbanken hat erhebliche Aufmerksamkeit auf sich gezogen, da es den Umsatz der in einer Transaktion gekauften Artikel berücksichtigt. Während die meisten baumbasierten Algorithmen zum Mining von HUIs die Datenbank in einen Artikelpräfixbaum umwandeln, verwerfen sie die wenig vielversprechenden Artikel und verbrauchen viel Speicherplatz. Der Einsatz von Bäumen, die Informationen auf Transaktionsebene speichern, hat sich in Verbindung mit solchen Präfixbäumen als förderlich für den Mining-Prozess erwiesen. In dieser Hinsicht schlägt die vorliegende Arbeit speichereffiziente Bäume vor, nämlich Utility Prime Tree (UPT), Prime Cantor Function Tree (PCFT) und String based Utility Prime Tree (SUPT), die im Gegensatz zu den präfixbasierten Bäumen durch einen einzigen Datenbankscan gesamte Transaktionsinformationen in einem Knoten kodieren. Experimente, die sowohl mit realen als auch mit synthetischen Datensätzen durchgeführt wurden, zeigen, dass diese Strukturen im Vergleich zu den Baumstrukturen in der Literatur erheblich weniger Speicherplatz verbrauchen.

Haftungsausschluss: Dieser Abstract wurde mit Hilfe von Künstlicher Intelligenz übersetzt und wurde noch nicht überprüft oder verifiziert