Es kann die österreichische Musiklandschaft durchdeklinieren, hilft, Fußballschuhe auseinanderzuhalten und sorgt dafür, dass die Pokémon-Macher den Überblick über ihre Figuren behalten. Das Tool „PoolParty“, das die Semantic Web Company entwickelt hat, kann einiges. Florian Huber erklärt, wie es funktioniert.

Florian Huber, Technical Consultant bei der Semantic Web Company erklärt, wie PoolParty
funktioniert
und wie es eingesetzt wird.

Was kann PoolParty? „Erstaunlich viel“, sagt Florian Huber. Er ist „technical consultant“ bei der Semantic Web Company, ist mit der Entwicklung des Tools beschäftigt und muss auch Kunden immer wieder erklären, was dieses Programm kann. Die kurze Antwort: Man kann damit Unternehmensdaten verwalten und analysierbar machen. Wir wollen es aber genauer wissen.

„Eine Organisation hat einen Datenbestand“, so Huber, „üblicherweise in Form von Datenbanken. Ein Problem wird es, wenn es darum geht, über den Tellerrand hinaus zu schauen: Wie stehe ich da im Vergleich zu einer Partnerorganisation? Kann ich meine Daten mit öffentlichen Daten verknüpfen?“ Der Monopol-Verlag etwa will im Rahmen des Projekts NOLDE eine Datenbank über die österreichische Musiklandschaft aufbauen. Es sei nicht sinnvoll, wenn der Verlag das nur für sich mache – die redaktionelle Pflege der Daten würde zu viel Aufwand bedeuten. „Deswegen nutzen sie die Daten, die es bereits öffentlich verfügbar gibt. Da gibt es zum Beispiel Musikplattformen, Linked-Data-Quellen wie MusicBrainz. Dort werden alle möglichen Daten gesammelt zu Bands, Musikern, Veranstaltungsorten.“

Wie PoolParty funktioniert

Hier kommt PoolParty ins Spiel. Damit kann der Verlag seine Daten verwalten und mit Daten aus der „Linked Data Cloud“ verknüpfen. Der Kern von PoolParty ist der Thesaurus-Manager. „Er erlaubt, dass man an einer Stelle seine Begriffe sammelt, hierarchisch strukturiert und auch Beziehungen zwischen diesen Begriffen herstellt. PoolParty stellt dafür das Grundgerüst zur Verfügung“, sagt Huber. Wie kann das genau aussehen? Erklären wir es anhand eines Beispiels, das so in der Musiker-Datenbank von Monopol auftauchen könnte.

„Rainhard Fendrich ist eine reale Person. Sein Name ist eine Entität, ein Konzept, das mit anderen Konzepten in Verbindung steht. Sein Geburtsort ist ein weiteres Konzept. Schon haben wir eine Beziehung zwischen dem Konzept Rainhard Fendrich und seinem Geburtsort. Dann hat er verschiedene Lieder gesungen. Man kann jeden Song als einzelnes Konzept definieren.“ Da PoolParty auf dem Standard SKOS (Simple Knowledge Organisation System) aufbaut, sei es relativ simpel, damit seine Welt abzubilden.

Die nächste Stufe ist der Extraktor. „Sobald man sein Vokabular zusammengetragen hat, kann man zum Beispiel sein Archiv beschlagworten. Ein Extraktor zerlegt die Texte und schaut, dass die Zerlegung der einzelnen Wörter mit den Begriffen im Thesaurus zusammenpasst“, so Huber. „Man nimmt einen Text her und setzt die Wörter mit den zuvor definierten Konzepten in Beziehung. Die Idee ist, dass man dazu eine semantische Suche anbietet. Da wird wieder das Wissen vom Thesaurus genutzt.“ Auf diese Weise könnte man etwa gezielt nach allen steirischen Musikern suchen, die auf Englisch singen und mit Punk zu tun haben. PoolParty geht aber noch weiter: Man kann zusätzlich (maschinenlesbare) Daten aus anderen Quellen abholen und mit den eigenen Daten verknüpfen. Huber: „Da gibt es viel Material. Da könnte man Fotos übernehmen, die Biografie, Diskografie.“

Fußballschuhe und Pokémon

PoolParty wird bereits von verschiedensten Unternehmen genutzt. Ein entscheidender Vorteil des Tools ist laut Huber, dass es Mehrsprachigkeit unterstützt: „Man kann Labels in jeder Sprache verwalten. Das ist für internationale Unternehmen entscheidend.“ Beispiel gefällig? Ein Sportartikelhersteller will zur Fußball-WM eine Werbekampagne machen. Seine Fußballschuhe haben in allen Ländern unterschiedliche Bezeichnungen, weil sie auf den Markt abgestimmt sind. Für verschiedene Farben gibt es interne Codes. So könnte ein Schuh intern CX473 heißen, auf der Packung in Österreich steht aber: „Fußballschuh, laubgrün“. Das muss irgendwo übersetzt werden – PoolParty kann das.

„Mit Pokémon haben wir einen lustigen Kunden. Da gibt es eine enorme Zahl an Figuren. Das Unternehmen hat das Problem, dass die Mitarbeiter von vor 15 Jahren – als die Figuren erfunden wurden – teilweise nicht mehr im Unternehmen sind. Die Figuren sind aber überall. Die haben auch Entwicklungsstufen und Fähigkeiten, das muss natürlich immer stimmen. In welchen Filmen sind sie aufgetreten, in welchen Computerspielen haben sie gekämpft? Die Fans legen großen Wert drauf, dass eine Figur nach zwei Jahren nicht plötzlich etwas anderes kann. Das Unternehmen muss versuchen, die Welt, die es da erschaffen haben, auch konsistent abzubilden“, so Huber.

Das Gespräch mit Florian Huber führte Katrin Nussmayr.