Freitag, 28. März 2014

Im Zoo der Dokumente.

These: Systemkontextanalyse öffnet die Augen für optimale Software

Artikelübersicht
1. Teil Ordnung für Dokumente.
2. Teil Im Zoo der Dokumente.


In der Systemkontextanalyse sammeln wir eine Reihe von Kontextobjekten, um uns über das Umfeld der zu schaffenden Software und über die Features der Software klar zu werden. Das letzte behandelte Kontextobjekt war das Dokument, beschrieben in Ordnung für Dokumente. Im Verlaufe der Entwicklung eines Systems können sich eine große Menge von Dokumenten ansammeln. Im Folgenden möchte ich einige Beispiele aufzählen:

  1. Wiki, in dem die Anforderungen des Altsystems beschrieben sind
  2. Wiki, in dem die Architektur des Altsystems beschrieben ist
  3. Quellcode des Altsystems
  4. Wiki, in dem die Programmier- und Architekturstandards beschrieben sind
  5. Gesetzestexte
  6. Benutzerhandbuch des Altsystems
  7. Installationshandbuch des Altsystems
  8. Betriebshandbuch des Altsystems
  9. Handbücher zu verwendeten Standards
  10. Sammlung der Geschäftsprozesse als Blattsammlung
  11. ...
Diese Menge an Dokumenten sollten wir klassifizieren, um sie besser handhabbar zu machen. Für die Klassifikation versuchen wir das Mittel der semantische Netze einzusetzen. "In einem semantischen Netz wird Wissen als Graph dargestellt, wobei die Knoten in dem Graphen Begriffe darstellen und die Verbindungen Relationen zwischen den Begriffen. Die wichtigsten Relationen zwischen den Begriffen sind Relationen zwischen Teilklassen und Klassen und Instanzrelationen zwischen bestimmten Objektinstanzen und ihren übergeordneten Klassen." [S.28, CAW03] Sehr wichtig ist es, "die Semantik einer Repräsentationssprache so präzise wie möglich anzugeben, sodass wir genau wissen, was Terme bedeuten und welche Folgerungen richtig sind." [S.30, CAW03] Klassenknoten stellen in unserem System eine Menge von Dokumenten dar. Teilklassenrelationen definieren Teilmengenbeziehungen, also eine Teilmenge der Dokumente.

"Semantische Netze erlauben es uns, Wissen über Objekte und Relationen zwischen Objekten auf eine einfache und recht intuitive Art darzustellen. Die konventionelle Repräsentation mit Hilfe von Graphen ermöglicht es uns, schnell zu erfassen, wie das Wissen organisiert ist." [S.30, CAW03] Für einfache Wissenspräsentationen sind semantische Modelle eine sehr gute Wahl, wobei sie bei komplexen Systemen mehr oder weniger versagen. Da wir davon ausgehen, dass es sich beim System der Dokumentendarstellung nicht um ein komplexes System handelt, versuchen wir uns mit der Darstellung in einem semantischen Netz mit den beiden angeführten Relationen (ist Teilmenge, ist Instanz).

Wir können verschiedene Teilmengen bilden. Im Post Ordnung für Dokumente haben wir ein Dokument als Information auf einem Medium definiert. Es liegt also nahe, eine Unterteilung auf der Basis von Medien durchzuführen. Folgende Teilklassen wären auf dieser Basis z.B. möglich:
  1. bedruckte Medien
  2. elektronische Medien
  3. akustische Medien
  4. visuelle Medien
Die Teilmenge der bedruckten Medien könnte man wiederum in die folgenden Teilmengen unterteilen:
  1. Bücher
  2. Zeitschriften
  3. Ausdrucke



Eine weitere Unterteilung haben wir im Post Ordnung für Dokumente dadurch definiert, indem wir in Dokumente im Sinne einer Quelle (Quelldokument) und in Dokumente als gewonnene Information (Essenzdokument) unterteilt haben. Die Abhängigkeit zwischen diesen Dokumentenformen wird durch die Ermittlungtätigkeit zur Gewinnung von Information beschrieben. Im obigen Text hatten wir erst einmal nur Teilmengen- und Instanziierungsbeziehungen zugelassen. Somit können wir diese Beziehung in unserem semantischen Netz noch nicht darstellen. Wir könnten eine neue Form der Relation dafür definieren. (Ermittlungstätigkeit)



Es wären weitere Klassifikationssysteme für Dokumente möglich. Diese können nach belieben geschaffen werden und sich gegenseitig ergänzen. In unserem Fall wäre ein schriftlich fixiertes Interview in der Klassifikation der Medienart unter bedruckte Medien und dann unter Ausdrucke zu suchen. Innerhalb der einfachen Zeichen, die im Post Ordnung für Dokumente abgebildet wurden, ist auch eine Klassifizierung zu erkennen. Dieses Zeichen haben uns angezeigt, um welches Medium es sich handelt, auf dem die Information hinterlegt ist. In diesem kleinen Beispiel könnte es ein Interview-Zeichen sein. Die dritte Klassifikation zeigt uns an, dass es sich um ermittelte Information handelt. Man kann sich also vorstellen, dass es weitere Systeme gibt, um bestimmte Formen von Dokumenten noch besser zu klassifizieren.



Darstellen können wir diese Formen verschiedener Klassifizierungen in sogenannten Frames. "Frames sind eine Variante der semantischen Netze und eine beliebte Methode, um Fakten in einem Expertensystem darzustellen. Alle Informationen, die für einen bestimmten Begriff relevant sind, werden in einer einzigen komplexen Dateneinheit gespeichert (die Frame genannt wird). Oberflächlich betrachtet sehen Frames einfachen Datensätzen und Datenstrukturen sehr ähnlich. Frames unterstützen mindestens aber die Vererbung." [S.30, CAW03] Dabei wird auch die Mehrfachvererbung abgebildet. So können wir verschiedenen Klassifikationssysteme in einem Frame erfassen. Die Datenstruktur für unser kleines Beispiel sehe z.B. so aus:
  1. schriftlich fixiertes Interview
    1. Oberklasse Medienform: Ausdrucke
    2. Oberklasse Medienart: Interview
    3. Oberklasse Erstellungsart: ermitteltes Dokument
Im Frame können weitere Attribute vermerkt werden. Diese können an die Unterklassen vererbt werden und sie können dort auch überschrieben werden. Zu bedenkende Attribute wären z.B. die Verknüpfung mit anderen Kontextobjekten. In unserem Fall wäre es der Stakeholder, der das Interview geführt hat und der Stakeholder, mit dem es geführt wurde. Eine Indizierung von Begriffen wäre eine weitere große Hilfe. Die indizierten Begriffe kann man dann mit einem Glossar verbinden, so dass schnell eine einheitliche Begriffsbildung, Synonyme und Homonym gefunden werden können.

  1. [CAW03] Alison Cawsey: "Künstliche Intelligenz im Klartext", Pearson Studium, München, 2003


vorheriger Post dieses Themas


Print Friendly Version of this page Print Get a PDF version of this webpage PDF

Keine Kommentare:

Kommentar veröffentlichen