Strukturieren von Inhalten (Teil 2): Facettenklassifikation und Tagging

Im ersten Artikel zur Strukturierung von Informationen wurden die Formen, Möglichkeiten und Probleme der hierarchischen Ordnung von Content thematisiert. Spätestens im Zuge des Web-2.0-Booms hat sich eine weitere Methode zur Klassifikation von Inhalten etabliert: die Facettenklassifikation mithilfe des Taggings.

Facettenklassifikation: Objekte aus verschiedenen Perspektiven betrachten
Die Facettenklassifikation erlaubt es, Objekte aus verschiedenen Blickwinkeln zu betrachten und so große Mengen von Objekten zu differenzieren. Die Klassifikation nach Facetten bedeutet, die Eigenschaften eines Objekts zu identifizieren und in Einfachklassen zu unterteilen und diese Einfachklassen in gleichrangigen, voneinander unabhängigen Gruppen, den Facetten, zusammenzufassen.

Im ersten Artikel zum Thema wurde die hierarchische Ordnung von Informationen anhand der Sneaker verdeutlicht, die ein Kunde im Kaufhaus oder im Web-Shop eines Schuhhändlers sucht. Bleiben wir bei diesem Beispiel. Wer sich eine Übersicht aller angebotenen Sneaker erstellen ließe, erhielte eine kaum überschaubare, schwer zu handhabende und wohl seitenlange Liste. Nun hat jedoch jedes Paar Schuhe bestimmte Eigenschaften, die es charakterisiert und deren Gesamtheit es von anderen abgrenzbar macht. Bei der Facettenklassifikation könnte der Kunde also aus der Facette „Marke“ seinen bevorzugten Hersteller wählen und seine Auswahl mithilfe der Facetten „Schuhgröße“, „Farbe“, „Ledersorte“ etc. weiter präzisieren, um schließlich das Paar Sneaker zu finden, nach dem er sucht.

Die Ergebnisqualität bei der Suche in einer nach Facetten klassifizierten Menge von Objekten hängt dabei zunächst von einigen wesentlichen Faktoren ab, die bei der Erstellung einer Facettenklassifikation zu berücksichtigen sind:

  • Alle Merkmale sollten vollständig in Klassen aufgeteilt sein.
  • Die Anzahl der Klassen sollte so festgelegt werden, dass eine hohe Indexierungsgenauigkeit sichergestellt ist.
  • Alle Klassen sollten im Idealfall etwa gleichstark besetzt sein (mittlere Klassenbesetzung).

Das zweite Kriterium ist die Qualität der vergebenen Tags.

Tagging: Objekte durch spezifische Eigenschaften beschreiben
Die Zuteilung der passenden Begriffe zu jedem Objekt und damit das Füllen der Einfachklassen mit aussagefähigen Inhalten geschieht mithilfe des Taggings. Tagging (engl. „tag“ = Etikett) ist also das Auszeichnen von Informationen mit Daten: Die über die Facettenklassifikation eingeordneten Daten werden durch das Tagging auffindbar gemacht.

Beim Beispiel der Schuhe könnte die Einfachklasse „Farbe“ also beispielsweise mit den Tags „Weiß“, „Schwarz“, „Rot“ usw. beschrieben werden. Auf diese Weise kann ein umfassendes und konsistentes Bild von den Eigenschaften eines jeden Paars Sneaker entstehen, wodurch der User im Optimalfall schließlich eine überschaubare und gut zu handhabende Ergebnisliste für seine Suche erhält.

Generell führt Tagging bei Suchprogrammen zu hochwertigen Resultaten. Probleme treten allerdings dann auf, wenn Tags uneinheitlich gehandhabt werden – ein Würfel beispielsweise hat „Ecken“ und ist natürlich auch „eckig“. Die Herausforderung besteht darin, Klassen und Tags zu verwenden, die sich mit den Vorstellungen der User decken. Zwei Formen des Taggings sind zu unterscheiden:

Author Tagging: Beim Author Tagging bestimmt der Verfasser der Inhalte die Attribute der Tags. Von Vorteil ist die systematische und nahezu vollständige Auszeichnung. Zudem behält der Autor die vollständige Kontrolle über die Auszeichnung. Allerdings muss er gezwungenermaßen antizipieren, nach welchen Tags User in der Praxis suchen: Entsprechen Autoren-Tags nicht den Suchgewohnheiten der Nutzer, werden deren Suchergebnisse von geringer Qualität sein.

Social Tagging: Social Tagging ist das gemeinschaftliche Auszeichnen durch die Nutzer selbst. Die beim Social Tagging verwendeten Schlagwörter entsprechen naturgemäß zumeist den Suchbegriffen, die User tatsächlich eingeben. Problematisch ist jedoch, dass Nutzer gleiche Eigenschaften oder Sachverhalte oft mit unterschiedlichen Schlagwörtern taggen. Empfehlenswert ist daher die Festlegung eines Kennzeichnungssystems in Form eines kontrollierten Vokabulars.

Die Strukturierung von Inhalten mithilfe von Facettenklassifikation und Tagging eignet sich besonders zum Ordnen großer Mengen von Objekten, denn ein wesentlicher Vorteil von Facettenklassifikationen liegt in der Erweiterbarkeit: Kommt ein neues Objekt mit einer neuen Eigenschaft hinzu, kann problemlos eine neue Facette angelegt werden. Bei einer Hierarchie ist das nicht ohne weiteres möglich. Dies ist auf das Problem der Präkoordination zurückzuführen, also auf die Verknüpfung der Elemente bereits bei der Erstellung der Struktur. Facetten hingegen sind voneinander unabhängige Gruppen.

Weiterführende Informationen:
Strukturieren von Inhalten (Teil 1): Informationsarchitekturen und Hierarchien
Hervorragende Suchergebnisse produzieren: Schwieriger, als es aussieht


Mehr über die Creative-Commons-Lizenz erfahren