Hailye Tekleselase
Das High Utility Itemset Mining (HUIM) aus großen Transaktionsdatenbanken hat erhebliche Aufmerksamkeit auf sich gezogen, da es den Umsatz der in einer Transaktion gekauften Artikel berücksichtigt. Während die meisten baumbasierten Algorithmen zum Mining von HUIs die Datenbank in einen Artikelpräfixbaum umwandeln, verwerfen sie die wenig vielversprechenden Artikel und verbrauchen viel Speicherplatz. Der Einsatz von Bäumen, die Informationen auf Transaktionsebene speichern, hat sich in Verbindung mit solchen Präfixbäumen als förderlich für den Mining-Prozess erwiesen. In dieser Hinsicht schlägt die vorliegende Arbeit speichereffiziente Bäume vor, nämlich Utility Prime Tree (UPT), Prime Cantor Function Tree (PCFT) und String based Utility Prime Tree (SUPT), die im Gegensatz zu den präfixbasierten Bäumen durch einen einzigen Datenbankscan gesamte Transaktionsinformationen in einem Knoten kodieren. Experimente, die sowohl mit realen als auch mit synthetischen Datensätzen durchgeführt wurden, zeigen, dass diese Strukturen im Vergleich zu den Baumstrukturen in der Literatur erheblich weniger Speicherplatz verbrauchen.