Die Einbindung der Sprachtechnologie des IAI in ein bestehendes Web-basiertes Groupware-System, wie dem Shared Workspace System BSCW, stellt eine besondere Herausforderung dar, da hierdurch erstmalig ein Groupware-System befähigt würde, die Leistung der existierenden Sprachtechnologie voll auszuschöpfen.

Die folgenden Sprachtechnologie-Komponenten werden den spezifischen "int.unity"-Anforderungen angepaßt:

Term Mining (TM) / Terminologieermittlung: Terminologie ist für den Aufbau einer gemeinschaftlichen Kommunikation und einer Shared-Workspace-System-Umgebung von zentraler Bedeutung, da hiermit fachspezifische Begriffe und die verschiedenen sprachspezifischen Umsetzungen dieser Begrifflichkeiten definiert werden, einschließlich möglicher Synonyme und Antonyme. TM basiert auf einem Modul zur Analyse der menschlichen Sprache (Morphologie und einfache syntaktische/semantische Analyse; d.h. IAI Kern-Sprachtechnologie) und liefert mögliche Begriffsoptionen einschließlich einer Häufigkeitsangabe und Kontextinformationen. Das XML-Output eignet sich zur weiteren Bearbeitung in XML-fähigen Umgebungen.

Language Proofing (LP) / Sprachüberprüfung: Rechtschreibung und grammatikalische Korrektheit sind zur Übermittlung von Informationen in unterschiedlichen Formen unerlässlich. Die Einhaltung eines vorgegebenen Fachwortschatzes (Terminologie) und bestimmter den Stilrichtlinien entsprechender Schreibregeln verbessern den Einsatz der Language Technology und ermöglichen die Kommunikation in verschiedenen Sprachen.

Bi-lingual Glossary (BG) / Zweisprachiges Glossar: Die Wahl der richtigen Formulierung gewährleistet eine reibungslose Kommunikation und Übersetzung zwischen den Mitgliedern der "int.unity"-Community. Die Erzeugung einer zweisprachigen Wörterliste unterstützt diese Auswahl.

Bi-lingual Search (BS) / Zweisprachige Suche: Die Suche nach spezifischen Informationen in verschiedenen Sprachen ist zur Vermeidung unnötiger Übersetzungen sinnvoll. BS unterstützt diese Erfordernis der sprachübergreifenden Informationsabfrage.

Information Gisting (IG) / Informationsextrakt: Die Rohübersetzung eines bestimmten Informationsobjektes aus der Fremdsprache in die Muttersprache und umgekehrt ermöglicht die Beurteilung der Relevanz dieses Objektes für einen vorgegebenen Satz an Informationssuchparametern. Die Übereinstimmung mit einer vorgegebenen multilingualen Terminologie gewährleistet, daß beim Übersetzungsprozeß die richtigen Informationen erhalten bleiben.

Summarisation (SUM) / Zusammenfassung: Das Extrahieren der wichtigen Fakten eines bestimmten Informationsobjektes, ein- und mehrsprachig, ermöglicht eine bessere und einfachere Navigation innerhalb eines bestimmten Informationsraumes sowie das Herausfiltern von Informationen nach bestimmten persönlichen Anforderungen.


Für die Anpassung der Sprachtechnologie (Language Technology) des IAI sind folgende Schritte durchzuführen:

Sprachtechnologie Resource Building / Ressourcenaufbau: Die Terminologieermittlung gewährleistet die Auswahl und den Aufbau einer geeigneten bilingualen "int.unity"-Terminologiedatenbank und erstellt die Wortschatzbasis für die Anpassung der anderen Sprachtechnologie-Komponenten. Hierzu werden "int.unity"-Informationsobjekte verarbeitet, und die Gemeinschaft der Anwender (Community) ist für die Auswahl der relevanten Terminologie verantwortlich. Das Ergebnis dieser Terminologieauswahl wird in das Sprachtechnologie-interne Format der Kern-Sprachtechnologie des IAI konvertiert und in einer Terminologiedatenbank mit einem "int.unity"-spezifischen User Interface gespeichert.

Sprachtechnologie Rule Base Building / Aufbau von Regelsätzen: Die Sprachüberprüfung gewährleistet, daß die Kommunikation unter Einhaltung eines Satzes gut definierter "Sprachregeln" erfolgt. Der Satz der englischen und deutschen Kernregeln muß entsprechend dem in den Informationsobjekten des "int.unity"-Konsortiums verwendeten Stils erweitert werden. Für die Erprobung kann nur eine Untergruppe dieser Informationsobjekte geprüft und beurteilt werden. Die ermittelten "int.unity"-spezifischen Grammatik- und Stilregeln werden auf ihre Umsetzbarkeit geprüft (Formalisierung) und dann in die bestehenden Software- und Lingware-Komponenten eingebunden. Da dies Schritt für Schritt durchgeführt wird, erfolgen mehrere Testphasen durch die Anwender, bis eine stabile "int.unity"-Konfiguration der Sprachüberprüfung umgesetzt ist.

Sprachtechnologie-Integration: Um die Leistungsfähigkeit der adaptierten Sprachtechnologie voll auszuschöpfen, müssen die neuen Sprachtechnologie-Komponenten in die übergeordnete "int.unity"-Umgebung integriert werden.