Intellisem ist ein Unternehmen, das sich auf die Entwicklung der nächsten Generation von intelligenten und semantischen Informationssystem konzentriert.
Unsere Vision:
“Natürliche Kommunikation mit Systemen ermöglichen”
Intellisem is a company which focuses on the development of the next generation of intelligent and semantic information systems.
Der Zeitgeist
Die heutige Fülle von verfügbaren Daten (Stichwort: Big Data) birgt ein enormes Potential für besseres Entscheidungsverhalten.
Unternehmen die Fremdwissen benutzen können diese Daten benutzen um ihre Prozesse zu optimieren, kritische Probleme zu behandeln aber auch um zu innovieren. Das Problem ist jedoch, dass dieses Wissen aus den Daten extrahiert werden muss, was in vielen Fällen stark abhängig ist von der Verfügbarkeit großer Teams die Suchanfragen, Analysierung und die Visualisierung des erlangten Wissens durchführen müssen.
Häufig sind bereits simple Anfragen sehr zeitintensiv und abhängig von der Verfügbarkeit von IT-Profis, was dazu führt, dass das Potential von vorhandenen Daten nicht voll ausgeschöpft wird und die weitere Auswertung von Daten unwirtschaftlich wird.
Wir konzentrieren uns auf dieses reele Problem:
Der Bedarf, große Mengen von heterogen strukturierten Daten zu verwenden nimmt immer mehr zu, insbesondere bezogen auf Anwendungen.
Und das heißt was?
Der Aufwand diese Daten zu verwenden, mit ihnen zu arbeiten, ist eine große Hürde. Teilweise sind die Daten über mehrere Datenbanken von Dritten verteilt.
Das Problem?
Der Kern des Problems ist die Kluft zwischen den Suchanfragen von Nutzern (beziehungsweise deren Formulierung bezogen auf das, was gesucht wird) und der Darstellung und dem Zugriff auf die Daten.
Wir bieten:
Hier bei IntelliSem haben wir StarGraph und Natural entwickelt, robuste Frameworks die Nutzern ermöglichen mit großen wie auch kleinen Datenbanken zu arbeiten, anhand von natürlichsprachigen Suchanfragen. Es ist ein Tool wie “Google” für strukturierte Daten, mit dem Nutzer nach bestimmten Daten suchen können.
Nutzer können auf Informationen zugreifen mit Anfragen wie:
- “Liste alle Schulen mit den schlechtesten Leistungen im Gebiet im München?”
- “Wie viele Baustellen auf den Straßen von Passau gab es im November 2015?”
- “Wer sind die Bau-Auftragnehmer von Aufträgen im Jahr 2016 des Freistaats Bayern und was haben sie bisher gekostet?”
Was macht Natural?
Natural bietet ein natürlichsprachiges Interface mit einem assoziierten semantischen Index um das Vokabular von Suchanfragen über Linked Data / Semantic Web Daten von der Suchanfrage an sich zu entkoppeln. Das wird mit einem distributional-compositional semantics Ansatz erreicht.
Was ist “Distributional semantics”?
Distributional semantics konzentriert sich drauf, automatisch semantische Modelle anhand von statistischer Verteilung von häufig zusammen erscheinenden Wörtern in großen Texten zu bauen.
Der Kern unserer Anwendungen basiert auf dem Finden von Wissen und baut auf der Forschung im Bereich Distributional Semantics auf, ein Forschungsgebiet, das wohl eines der strategischsten in den kommenden Jahren sein wird.
Eines unserer Kerngebiete unser Forschung basiert auf Technologie für Big Data-Analysen mittels Distributional Semantics. Distributional Semantics ist ein vielversprechendes Forschungsfeld mit dem ansonsten verlorenen gehendes Wissens aus komplexen Datensätzen extrahiert werden kann. Diese Daten können Text, bereits vorstrukturierte Daten, Bilder, Tonaufnahmen und Videos sein. Damit können breite Nutzergruppen abgedeckt werden und individuelle Bedürfnisse befriedigt werden.
Semantische Modelle die wir benutzen konzentrieren sich auf:
- semantische Approximierung mit niedrigem Adaptionsaufwand (unabhängig von manuell erstellten Ressourcen wie Ontologien, Thesauren oder Dictionaries)
- umfassendes semantisches Matching, unterstützt durch die Einbindung großer Mengen von verteilten (unsortierten) Daten / Wissen in den semantischen Prozess
- expressive natürlichsprachige Anfragen.
Der letzte Punkt ist der, auf den sich das größte Interesse unser Nutzer und Kunden richtet (wie drücken Menschen ihr Informationsbedürfnis in Sprache aus um Antworten aus Systemen zu bekommen), allerdings sind alle drei Punkte wichtig.
Die Verwendung von Distributional Semantic Modellen unterstützt zudem die Entwicklung von Lösungen die einfach in andere Sprachen übertragbar sind. Weiterhin können Nutzer neue Informationen direkt in den Graph mittels natürlicher Sprache eintragen. Das Modell baut auf auf einem Jahrzehnt von Forschung durch Unternehmenspartner in den Bereichen Question Answering, Semantic Search, Natural Language Queries, Distributional Semantics und Information Extraction. Die existiertende Plattform, StarGraph, hat das Ziel Barrieren um den Zugriff und das Erstellen von Daten durch natürliche Sprache als Hauptpunkt der Interaktion mit Datenmedien zu reduzieren.
Und wie bewegt sich der Markt?
Google Knowledge Graph ist nur ein aktuelles Beispiel für die Vorteile die die Verwendung von großen, strukturierten Daten in Anwendungen bringen kann.
Weiterhin, Open Linked Data ist in den vergangenen Jahren zum Standard für die Veröffentlichung von strukturierten Daten im Web geworben und spielt jetzt eine wichtige Rolle für die nächste Generation von Anwendungen die diese Daten verwenden. Jedoch ist der Aufwand mit diesen Daten zu arbeiten sehr hoch für Konsumenten.
Also heißt das was?
Um mit diesen Datensätzen zu arbeiten, müssen Nutzer zuerst einmal für sie interessante Datensätze finden, die Struktur und das Vokubalur verstehen und dann eine Anfrage stellen, die der Syntax des zugrunde liegenden Systems genügt (zum Beispiel SPARQL oder SQL).
Am Besten für Nutzer ist es ihr Informationsbedürfnis direkt in natürlichser Sprache zu stellen, ohne sich um das Vokabular (“Schema”) der Datensätze kümmern zu müssen, sondern die Anfrage direkt an das System abgeben können, dass sich intern um die Übersetzung der Anfrage in zum Beispiel gültiges SQL kümmert.
Die meisten Semantic Models benutzen baustein-ähnliche Konstrukte und benutzen sehr einfachte Annahmen, unter Laborbedingungen.
Das führt allerdings dazu, dass nur die einfachsten Modelle und Anfragen funktionieren.
Actionable Data
Hier bei Intellisem bieten wir unseren Kunden Actionable Data – eine Ressource, die das Potential von zunehmender Rationalisierung im Management von Firmen-Ressourcen birgt, damit Entscheidungen anhand von quantitativer Analyse getroffen werden können. Die Verwendung von Actionable Data als Mediator um Entscheidungsprozess und zur Entstehung von Dialog birgt die Möglichkeit zur Steigerung der Qualität im Management von Ressourcen und dem Schutz der Interessen von Teilhabern.
Weiterhin, durch einfacheren und breiteren Zugriff auf Daten können Firmen besser Marktsituationen verstehen und individuell auf Kundenwünsche antworten.