Datenbankrecherchen

 

Seitdem Bibliotheken bestehen, wird in deren Büchern, Zeitschriften und Katalogen von Hand und damit "konventionell" recherchiert. Mit dem Aufbau externer Datenbanken, d.h. Datenbanken, die außerhalb eines Unternehmens bei Datenbankanbietern (Hosts) geschaffen und zum Durchsuchen angeboten werden, kam die Online-Recherche als zweite Rechercheform hinzu. Sie ermöglicht jedem, mit geringem technischen Aufwand in großen Datenmengen zu suchen und innerhalb kürzester Zeit Ergebnisse zu erhalten. Erst durch diese neue Rechercheart besteht eine Chance, die heutige Informationsflut zu bewältigen.

Mit der Möglichkeit, externe Datenbanken direkt online durchsuchen zu können, steht jedem das Wissen der Welt zur Verfügung, so daß es nur abgefragt werden muß. Hierbei sind folgende Vorteile zu beobachten,

  • hohe Schnelligkeit
  • hohe Vollständigkeit
  • hohe Aktualität
  • hohe Exaktheit
  • suchen vom Arbeitsplatz aus
  • zeitunabhängig suchen
  • preiswert

Aufbau einer externen Datenbank

Eine Datenbank kann als elektronische Datei bezeichnet werden. Jede Datei besteht aus einer Vielzahl von Karteikarten, die geordnet in einem Kasten stehen. Jede Karte bildet eine Informationseinheit, die in einer Computerdatei (engl.: file) "Datensatz" (record) genannt wird. Die Zeilen werden bei einer Datei "Felder" (fields) genannt. Das wichtigste Feld, unter dem der Datensatz in einer Datei abgelegt ist, ist das "Haupt- oder Schlüsselfeld" (key). Ferner werden für einen Datensatz noch die folgenden Bezeichnungen verwendet:

Zitat (citation)

Referenz (reference)

Dokumentationseinheit (documentation unit)

Die meisten Datenbanken enthalten nur begrenzte Informationsmengen wie bibliographische Daten und allenfalls Zusammenfassungen (abstracts) zu einem technischen Aufsatz. Sie kommen daher mit einer begrenzten Anzahl an ausfüllbaren Zeilen bzw. Feldern aus. Datenbanken, die große Mengen an Informationen, die also den gesamten Text in einem Datensatz gespeichert haben, werden "Volltextdatenbanken" genannt.

Bei einer Recherche in einer Datei bzw. Datenbank geht es also immer darum, bestimmte Datensätze zu finden. Suchen Sie z.B. in einer deutsche Unternehmen enthaltenden Datenbank nach allen holzverarbeitenden Unternehmen im Raum München, so werden durch Eingabe der Postleitzahl und des Wortes "Holz" oder sinnverwandter Ausdrücke die Anzahl vorhandener Datensätze erhalten und diese auf einem Bildschirm oder Drucker ausgegeben. Diese gefundenen Datensätze werden auch "Treffer" genannt.

Eine elektronische Datenbank besitzt neben den Datensätzen noch ein Programm, das die Datensätze verwaltet. Hierdurch können die Datensätze angelegt, beschrieben, geändert und gelöscht werden. Wenn ein Außenstehender in der Datenbank online nach Datensätzen suchen will, steht ihm das "Retrievalprogramm" (retrieval = Abfrage) zur Verfügung. Durch diese Trennen der Programme zum Aufbauen bzw. Verwalten und zum Abfragen kann eine Datenbanken verschiedener Hosts (Datenbankanbietern) unter verschiedenen Retrievalsprachen jedermann angeboten werden.

Es ist üblich, eine Datenbank aus mehreren Dateien aufzubauen. Die erste Datei (Dokumentendatei) enthält die Datensätze in derselben üblichen Ordnung wie eine Kartei, und die zweite Datei (Indexdatei oder Index) enthält für die eigentliche Suche alle Worte aller Datensätze alphabetisch geordnet. Bei der Eingabe eines Suchwortes wird nur die alphabetisch geordnete Datei durchsucht. So kann die Anzahl der Datensätze, in denen das Suchwort vorkommt innerhalb von Sekunden ermittelt werden. Im Index fehlen nur unwichtige Wörter wie Artikel und Hilfsverben. Diese "Stopwörter" würden eine Datenbank unnötig aufblähen.

In den meisten Index-Dateien kann nach einem Anfangsbestandteil eines Wortes – wie z.b. "Schuh$" gesucht werden. Dies wird "Maskieren" oder "Trunkieren" genannt. Das $-Zeichen ist eine Art Joker und bedeutet, daß auf der rechten Seite des Stammbestandteils "Schuh" dieser beliebig weitergeführt sein kann.

Es gibt zwei verschiedene Sucharten in Index-Dateien:

Bei der oben beschriebenen "Direktsuche" wird danach gesucht, ob ein eingegebenes Wort exakt oder entsprechend der Maskierung oder Trunkierung als Bestandteil der Index-Datei vorhanden ist. Zu allen in der Index-Datei gefundenen Worten ist gespeichert, in wievielen Datensätzen jedes dieser Worte vorkommt. Diese Zahlen werden addiert und als sogenannte "Treffer" auf dem Bildschirm angezeigt. Hierdurch wird angegeben, in wievielen Datensätzen das gesuchte Wort vorkommt.

In der zweiten Suchart – der Indexsuche – wird wiederum in der Indexdatei gesucht, aber diesmal wird nicht die Anzahl der Treffer angezeigt, sondern es wird derjenige Bereich der Index-Datei als Liste dargestellt, in dem das gesuchte Wort vorkommmt bzw. die dem Suchwort gleich oder ähnlich sind. Durch die zweite Suchart kann nachgesehen werden, welche ähnlichen Worte zum interessierten Bereich vorhanden sind. Dies ist z.b. bei einer Suche mit Namen oder bei in der Schreibweise unklaren Worten von Vorteil.

Um in einer Datenbank suchen zu können, müssen zuvor mehrere Fragen beantwortet worden sein. So muß gewußt werden:

  • welche Datenbanken zu meinem Problem bestehen,
  • bei welchem Host die ausgewählten Datenbanken liegen,
  • welche Retrievalsprache (Abfragesprache) bei einem bestimmten Host verwendet wird und
  • wie die Datensätze bei einer bestimmten Datenbank aufgebaut sind.

U.a. zu diesen Fragen wird in dem Programm "INFO & RECHERCHE" von Dr. H.B. Cohausz ausführlich Stellung genommen.

Weitere Dokumente:
Methoden von Patentrecherchen
Download Lehrprogramm INFO & RECHERCHE
Online-Patentrecherchen / Datenbankanbieter
Patentinformationszentren /-stellen in Deutschland

 

Zurück zur HOMEPAGE


Diese Seite wurde zuletzt geändert am 16.07.01/Me um 12:30 Uhr.
(c) Cohausz Hannig Dawidowicz & Partner 1998-2001