„Mit PoolParty kann man relativ simpel seine Welt abbilden“

Es kann die österreichische Musiklandschaft durchdeklinieren, hilft, Fußballschuhe auseinanderzuhalten und sorgt dafür, dass die Pokémon-Macher den Überblick über ihre Figuren behalten. Das Tool „PoolParty“, das die Semantic Web Company entwickelt hat, kann einiges. Florian Huber erklärt, wie es funktioniert.

Read more →

August 18 / 2014
Category Allgemein
Comments No Comments
Tags

ONTEASY: „Es geht darum, Texte zu analysieren. Und mit den Ergebnissen Texte weiterzuverarbeiten“

Das Textanalyseprogramm ONTEASY des Compass-Verlags kann etwas, von dem viele Schüler wohl träumen: Es beherrscht die komplette deutsche Grammatik. Für das Projekt NOLDE werden damit die Kollektivverträge des ÖGB-Verlags analysiert und in ihre sprachlichen Einzelteile zerlegt. Jürgen Paulus, Senior Softwareentwickler beim Compass-Verlag, hat aber noch mehr vor. Sein Programm soll ihm einen Fantasy-Roman schreiben. Read more →

August 04 / 2014
Author Katrin Nussmayr
Category Allgemein
Comments No Comments

Monopol: „Mehr Zugriffe und mehr Verlinkungen mit anderen Webseiten“

Martin Mühl, Geschäftsführer des Monopol-Verlags, erklärt im Video-Interview, wie Monopol mit Hilfe von Linked Data Technologien seine Services verbessern will. Gestartet wird mit einer Musikplattform, danach sollen mithilfe von Linked Data auch die redaktionellen Prozesse des Verlags optimiert werden. Read more →

Juli 04 / 2014
Author Katrin Nussmayr
Category Allgemein
Comments No Comments

ÖGB-Verlag: „Bei Linked Data geht es auch um einen gesellschaftlichen Aspekt.“

Warum beschäftigt sich der ÖGB-Verlag mit Linked Data Technologien, wie werden sie eingesetzt und was bringt das? Christian Wachter, der für das Wissensmanagement im Verlag zuständig ist, im Video-Interview. Read more →

Juni 26 / 2014
Author Katrin Nussmayr
Category Allgemein
Comments No Comments

Bald zu sehen: Interviews mit unseren Projektpartnern

Was will ein Verlag, der hauptsächlich Kollektivverträge und arbeitsrechtliche Texte vertreibt, mit Linked Data anfangen? Was haben ein Musikmagazin und ein Social Media Monitoring Tool damit zu tun? Und warum arbeitete unser technologischer Partner mit Pokemon zusammen?

NOLDE vereint verschiedene Projektpartner. Was sie alle eint: Sie beschäftigen sich mit Linked Data Technologien, um ihre Services und Produkte zu verbessern und unstrukturierten Daten Ordnung einzuhauchen. In (Video-)Interviews beschreiben sie ihre Beweggründe und Visionen, erklären, wie ihre Linked Data Tools funktionieren und wie sie eingesetzt werden können.

Die Interviews mit dem ÖGB-Verlag, dem Monopol-Verlag, der Semantic Web Company und dem Compass Verlag werden demnächst hier auf unserem Blog präsentiert. Schauen Sie wieder vorbei!

Mai 29 / 2014
Author Katrin Nussmayr
Category Allgemein
Comments No Comments

Nutzen von Linked Data in der Content Value Chain

Jedes Unternehmen ein Medium: Im Zeitalter der Informationsgesellschaft beschäftigen sich immer mehr Unternehmen mit der Beschaffung, Verwertung und Veröffentlichung von Informationen. „Dies äußert sich etwa in der zunehmenden Service-Orientierung von Marketingaktivitäten, deren Grundlage oftmals Informationsprodukte mit Service-Charakter – wie etwa personalisierte Produktportfolios, Recommender-Services oder Programmierschnittstellen samt Service-Levels – sind“, schreibt Tassilo Pellegrini in seinem Essay „Linked Data Licencing – Die Bewirtschaftung vernetzter Daten auf Basis von Linked Data Technologien“.

Sieht man sich die Ursachen dieser Entwicklung an, wird gleich der Bezug zu Linked Data sichtbar: Erstens wissen Service-orientierte Unternehmen um die Bedeutung wohlstrukturierter Daten Bescheid; zweitens „basieren Diversifikationsstrategien in der Service-Orientierung vielfach auf Konzepten der Zweit- und Drittverwertung bestehender Assets – idealerweise mittels Automatisierung“. Dafür müssen die Daten maschinell lesbar und verarbeitbar sein – was uns wieder zu Linked Data bringt.

Zwischen den Trends zur Service-Orientierung und zu Linked Data-Technologien scheint also ein Zusammenhang zu bestehen. Die folgende Abbildung illustriert diesen Zusammenhang:

Linked Data in der Content-Value-Chain

Linked Data in der Content-Value-Chain

Linked Data kann bestehende Dienste weiterentwickeln wie auch der Erschließung neuer Produkte und Dienstleistungen dienen – denn vernetzte Daten werden immer mehr verfügbar sein. Was das genau heißt, wird nun anhand verschiedener Perspektiven erklärt:

Produkt- und Service-Diversifikation: Erweiterung bestehender Recherchetools um konzeptbasierte Ansätze (moderierte Suche, Recommender-Systeme, Filtersysteme). Personen, Orte, Produkte, Preise, Aussagen u.v.m. könnten extrahiert und in weiterer Folge kosteneffizient zu personalisierten Dossiers verdichtet werden. Stichwort: „Roboter-Journalismus“.

Marktdiversifikation: Dynamic Semantic Publishing (DSP) führt zur Verlängerung wie auch Verdichtung bestehender Wertschöpfungsketten. So kann die semantische Anreicherung von Content (Verschlagwortung, Strukturierung) kann direkt im Entstehungsprozess des jeweiligen Content-Produktes stattfinden. Die Grenzen zwischen B2B- und B2C-Märkten verschwimmen.

Verwertungsmodelle: Metadaten werden zu Netzgütern, und mithilfe von Linked Data-Technologien können diese auch bewirtschaftet werden. In Sachen Urheber- und Datenrecht gehen die Ansichten aus dem web-Ökosystem und die traditionellen rechtlichen Ansätze allerdings noch auseinander.

Quelle: Tassilo Pellegrini – „Linked Data Licencing – Die Bewirtschaftung vernetzter Daten auf Basis von Linked Data Technologien“
Mai 06 / 2014
Author Katrin Nussmayr
Category Allgemein
Comments No Comments

Ontology Engineering Workshop

Ein weiteres wichtiges Treffen fand gestern in Form eines Workshops in Wien statt. VertreterInnen der FH St. Pölten, des ÖGB Verlags, des Monopol Verlags und der FH JOANNEUM beschäftigten sich angeleitet von Florian Huber und Thomas Thurner (Semantic Web Company) mit dem Thema Ontologie Modellierung.

Die technologischen Basics und die Modellierung wurden anhand von PoolParty erklärt. Nachdem es zunächst um den Aufbau eines Thesaurus und SKOS (Simple Knowledge Organisation System) als Ausgangsbasis für die Ontologien ging, wurde auch die Nutzung von Linked Data herausgearbeitet.

Mit Hilfe des einfach zu bedienenden User-Interfaces von PoolParty konnten schnell Teilbereiche aus den Use-Cases veranschaulicht und besprochen werden. Este Ideen zum Aufbau der Wissensmodelle im Musikumfeld beim Monopol Verlag und im Bereich des Arbeitsrechts beim ÖGB Verlag zeigen, dass es wichtig ist zu überlegen welche Art von Wissen repräsentiert werden soll. Das ist neben dem Arbeiten mit PoolParty nun Aufgabe der kommenden Wochen…

Ontologie Workshop

Ontologie Workshop in den Räumlichkeiten der Semantic Web Company

 

April 04 / 2014
Category Allgemein
Comments No Comments

Was bringt Linked Data in der Datenintegration?

Viele Unternehmen kennen wohl das Problem: Ihre Server und Festplatten sind voller Daten, die unorganisiert und unstrukturiert vor sich hin schlummern und nicht weiter verarbeitet werden können. Mithilfe von Linked Data-Technologien werden aus diesen unstrukturierten Datensammlungen wertvolle Wissenssysteme. Aber welche Vorteile bringt Linked Data genau?

Der Linked Data Ansatz strebt die höchstmögliche technische und semantische Interoperabilität zwischen Datenbanken, Repositorien und anderen werthaltigen Informationsquellen an. Das erlaubt die kosteneffiziente Zusammenführung verteilt vorliegender Datensets, die Entwicklung von service-orientierten Produkten und ermöglicht eine Bewirtschaftung des digitalen Contents entlang der gesamten Wertschöpfungskette (Mitchell & Wilson 2012; Cranford 2009).

Vorteile von Linked Data

Die Vorteile von Linked Data gegenüber konventionellen Integrationstechnologien lassen sich laut Auer (2011) folgendermaßen beschreiben:

De-Referenzierbarkeit: Die Verwendung von URIs erlaubt nicht nur, Ressourcen im Web eindeutig zu identifizieren, sondern auch diese Ressourcen inklusive der angereicherten Zusatzinformation abzurufen.

Kohärenz: Die Verwendung von RDF (Resource Description Framework)  als universelles Datenmodell erlaubt die kohärente Vernetzung von Informationen aus unterschiedlichen Namensräumen und ermöglicht auf diese Weise die semantische Anreicherung von Information durch sogenannte typisierte Links.

Integrierbarkeit: Das normierte RDF-Datenmodell erlaubt – aus technischer Perspektive – die niedrigschwellige Integration von Informationen aus den vernetzten, dispers vorliegenden Datenquellen. Mittels Schema-Mapping (z.B. von RDF Vokabularien) und Instance Matching können in Folge semantisch hoch expressive Informationsbestände aggregiert und abgefragt werden.

Aktualität: Die Datenquellen und ihre Netzstruktur können aufgrund des geteilten Datenmodells leicht aktualisiert und veröffentlicht werden – ohne zusätzliche Integrationsaufwände oder Performanceverluste, wie sie üblicherweise bei konventionellen Extraktionsmaßnahmen oder Datentransformationen entstehen. Dies garantiert unter anderem eine hohe Aktualität der Daten und darauf aufbauender Dienste.

Beispiele: Wer nutzt Linked Data, und wie?

Als konkrete Manifestation des Linked Data Paradigmas lässt sich die seit 2007 stetig wachsende Linked Data Cloud, eine dezentrale und kollaborativ gewachsene Infrastruktur aus RDF-Daten, anführen. Diese Data Cloud umfasste mit Stand 2013 mehrere hundert Milliarden Fakten aus unterschiedlichsten Themenfeldern und mittlerweile tausenden Datenquellen (z.B.: datahub). Diese Daten sind vorwiegend offen lizenziert und werden bereits aktiv kommerziell genutzt.

Unternehmen und öffentliche Organisationen veröffentlichen ihre Datensets in der Linked Data Cloud und nutzen gleichzeitig deren Daten, um hauseigene Datenbestände anzureichern und Rich Content Anwendungen darauf aufzusetzen. Insbesondere Unternehmen aus der Pharma-Industrie (z.B. Roche, Merck, Elly Lilly) und der Medienbranche (z.B. BBC, NY Times, Reuters, Reed Elsevier, Wolters Kluwer, Pearson Publishing, Springer Verlag, ACM, Agence France Press, Google, Facebook) haben sich als Early Adopter von Linked Data Technologien hervorgetan.

Literatur:

  • Auer, Sören (2011). Creating Knowledge Out of Interlinked Data. In: Proceedings of WIMS’11, May 25-27, 2011, p. 1-8
  • Cranford, Steve (2009). Spinning a Data Web. In: Price Waterhouse Coopers (Ed.). Technology Forecast, Spring 2009. http://www.pwc.com/us/en/technology-forecast/spring2009/index.jhtml, aufgerufen am September 20, 2013
  • Mitchell, Ian; Wilson, Mark (2012). Linked Data. Connecting and exploiting big data. Fujitsu White Paper, March 2012. http://www.fujitsu.com/uk/Images/Linked-data-connecting-and-exploiting-big-data-%28v1.0%29.pdf, aufgerufen am  September 12, 2013
März 31 / 2014
Author Katrin Nussmayr
Category Allgemein
Comments No Comments

Was ist Linked Data?

Unsere Welt ist voller Daten. Eine Information, die nicht mit anderen Daten verknüpft ist, ist jedoch wie ein Buch, das in keinem Bibliothekskatalog aufscheint: Im wachsenden Datenurwald, der um uns in die Höhe ragt, wird sie irgendwann nicht mehr gefunden. Die Lösung für dieses Problem heißt „Linked Data“: Damit werden im Netzjargon Daten bezeichnet, die untereinander vernetzt und nach internationalen Standards organisiert sind.

Sind denn nicht eh schon alle Daten vernetzt?

Nicht ganz. Im Regelfall werden Daten in Formaten wie HTML, CSV oder auch in Form von proprietären APIs bereitgestellt. Das birgt aber einige Probleme:

  • Die Integration zusätzlicher Quellen ist aufwendig
  • Veränderungen in der Datenbankstruktur gehen oftmals zu Lasten der Systemintegrität
  • Aktualisierungen der Datenbasis in Echtzeit sind meist nur unter hohen Aufwänden möglich

Ein dynamisches, hoch vernetztes Datensystem sieht anders aus. Hier kommt Linked Data ins Spiel: Daten, die in einem Standard-Format vorliegen und von Maschinen gelesen und verwaltet werden können. Ein Computer kann damit etwa die Bedeutung von Informationen oder die Beziehungen zwischen unterschiedlichen Datenätzen erkennen, leichter nach bestimmten Daten suchen und ähnliche Daten automatisch verknüpfen. Aus einem unstrukturierten Datenfriedhof werden wertvolle Wissenssammlungen.

Linked Data im Detail

Linked Data bedient sich sogenannter Semantic Web Standards um existierende Datenbestände hoch strukturiert aufzubereiten und plattformunabhängig für die Integration und Syndizierung bereitzustellen.  Hierbei werden Daten mittels des normierten Datenmodells RDF (Resource Description Framework, siehe W3C 2004) strukturiert und verfügbar gemacht. Die semantisch angereicherten Daten werden im konventionellen Sinne nicht relational sondern als Graph  repräsentiert. Sowohl die Knoten als auch die Kanten des Graphen sind über URIs (Uniform Resource Identifiers) eindeutig identifizierbar und referenzierbar. Dieser semantische RDF-Graph kann mittels der normierten Abfragesprache SPARQL (W3C 2008) feingranular und in hoher semantischer Tiefe abgefragt werden. Dies erlaubt die leichte Formulierung expressiver Datenbankabfragen, die mit konventionellen Mitteln entweder gar nicht oder nur mit hohen technischen und personellen Aufwänden machbar wären.

Die Idee von Linked Data geht übrigend auf Tim Berners-Lee, den Begründer des WWW, zurück. Seine Ausführungen zu Linked Data sind hier nachzulesen.

Literatur:

 

 

März 17 / 2014
Author Katrin Nussmayr
Category Allgemein
Comments No Comments

Zwei Beiträge für die Rechtsinformatik-Konferenz „IRIS 2014“

Für das Internationale Rechtsinformatik Symposion IRIS 2014, das heuer unter dem Generalthema „Transparenz“ steht, haben Projektmitarbeiter von NOLDE zwei wissenschaftliche Papers verfasst, die sich mit verschiedenen Aspekten von Linked Data auseinandersetzen.

In Linked Data Licensing: Datenlizensierung unter netzökonomischen Bedingungen geht Tassilo Pellegrini, Gesamtprojektleiter von NOLDE, auf die immaterialgüterrechtlichen Aspekte vernetzter Daten ein und erörtert die Erfordernisse nach einer „Linked Data Licensing Policy“ im Spannungsfeld von Urheber- und Datenbankrecht.

Das Paper Vernetzte Rechtsinformation: Der Einsatz von Linked Data Technologien am Beispiel des ÖBG-Verlags von Tassilo Pellegrini, Christian Wachter, Andreas Blumauer und Jürgen Paulus zeigt, wie Linked-Data-Technologien die redaktionellen Workflows bei juristischen Fachverlagen verbessern können. Weiters werden die Mehrwertpotenziale, die sich durch die Vernetzung und semantische Anreicherung von Content-Beständen ergeben, erörtert. Als Beispiel dient hier der ÖBG-Verlag, der sich mit seinen umfassenden Datenbanken voller arbeitsrechtlichen Inhalten auch als Projektpartner in das Projekt NOLDE einbringt.

Beide Papers und die dazugehörigen Vortragsfolien sind in unserer Ressourcen-Sektion verfügbar.

Februar 04 / 2014
Author Katrin Nussmayr
Category Allgemein
Comments No Comments