Menschen fragen, Maschinen antworten - Natural Language Question Answering

Frage-Antwort-Systeme oder Natural Language Question Answering sind in der Informatik Schnittstellen zwischen Mensch und Maschine, die es ermöglichen sollen, dass Sie auf natürliche Art und Weise mit einem digitalen Interface sprechen können.
Dabei kommt es zu einer gewissen Schwierigkeit in der Übersetzung menschlicher Sprache mit den strukturierten Inhalten, über die Maschinen arbeiten. Gerade hier liegen die Herausforderungen im Natural Language Question Answering.

Die Geschichte digitaler Frage-Antwort-Systeme

Bereits in den 60er und 70er Jahren wurden erste Frage-Antwort-Systeme entwickelt, welche es Usern ermöglichten, auch ohne Vorerfahrung mit dem System Fragen zu stellen und entsprechend von der Maschine Antworten zu erhalten.
Möglich wurde dies nur durch eine extreme Einschränkung der digitalen Fachbereiche. Dies limitierte sowohl die Zahl der möglichen Antworten, als auch die Zahl der gestellten Fragen.
LUNAR und BASEBALL beschäftigten sich so etwa mit den geologischen Spezifikationen gesammelter Mondsteine bzw. mit einer Saison der amerikanischen Baseball Oberliga.
In den folgenden Jahrzehnten wurden die Systeme weiter entwickelt, so dass in den 80ern etwa ein kompletter Katalog zur Unix Systemarchitektur mit Fragen durchsucht werden konnte.
Es entwickelte sich die Disziplin der Computer Linguistik, auf der moderne Natural Language Question Answering-Systeme basieren.
Grundsätzlich gibt es immer noch Unterscheidungen zwischen Closed- und Open-Domain, wenn es um die Datenbestände verschiedener Frage-Antwort-Systeme geht.

Closed-Domain und Open-Domain

Unterteilt werde Frage-Antwort-Systeme in Closed-Domain und Open-Domain.
Closed-Domain bedeutet, dass das System sich auf einen fachspezifischen Punkt fokussiert. Es können etwa Fragen zu einem medizinischen Thema gestellt werden oder die Funktionsweise eines technischen Gerätes wird anhand von Fragen erklärt. Diese Form des Natural Language Question Answering wird von Menschen oftmals als weniger natürlich empfunden, da sie die Zahl der möglichen Fragen und Antworten stark einschränkt.
Open-Domain bedeutet im Gegenzug, dass Sie beliebige Fragen stellen können und das System aus der Datenbank heraus nach bestem Wissen antwortet. Dies ist für Systeme entsprechend komplex, da diese viel mehr Bausteine von natürlich gestellten Fragen erkennen und verarbeiten müssen. Mit einer Anbindung ans Internet ist die Größe der Datenbank längst nicht mehr entscheidend.
Weit verbreitete Natural Language Question Answering-Konzepte finden Sie heute in Ihrem Smartphone oder Smart Home.

Das natürliche Sprechen mit Maschinen hat in den letzten Jahren und Jahrzehnten enorme Fortschritte gemacht und die Unterhaltung mit einem Smartphone wirkt kaum mehr futuristisch.
Dennoch stellt Natural Language Question Answering Frage-Antwort-Systeme vor extreme Herausforderungen, vor allem im Zusammenspiel mit Spracherkennung.
Alleine das Zerlegen einer natürlich formulierten Frage in semantische Blöcke, welche auf den Inhalt verweisen, ist für Maschinen eine Herausforderung und erfordert eine gigantische Datenbank mit Erfahrungswerten. Aber Frage-Antwort-Systeme beweisen bereits heute Ihre Nützlichkeit, indem sie wie IBMs Watson Ärzte bei der Krebsbehandlung unterstützen. Oder in der Spielshow Jeopardy menschliche Kontrahenten bezwingen. Natural Language Question Answering macht auch große Datenmengen für Menschen zugänglich, ohne die Hintergründe einer Computersprache erlernen zu müssen.

Aufgrund hoher Auslastung kann ich zur Zeit keine neuen Projekte oder Aufträge annehmen. Ich hoffe auf Ihr Verständnis.