Die Geschichte des WWW Was also ist das Internet? Wie funktioniert es? Begriffsklärungen Verschiedene Zonen Browsen im Internet Suchmaschinen Wie wird nun gesucht? Operatoren Bool‘sche Algebra Bewertung der Ergebnisse Ordnerstruktur und Dateiname Suchen innerhalb der Seite

Die Geschichte des WWW

Das Internet ist ein weltweiter Verbund von Rechnern zum Austausch von Informationen. Es wurde in den USA zu militärischen Zwecken aufgebaut, später erweitert um Universitäten und Behörden – das Militär klinkt sich später aus Sicherheitsgründen wieder aus. Das Netz blüht und mit ihm die Großrechnertechnologie – es wird angreifbar (Hacker, die sich in Rechnersysteme einhacken).

Anfang der 80er Jahre wird der erste Personalcomputer PC von IBM gebaut und findet in der Mitte der 80er Absatz in Europa. Anfangs wurden Telefonleitungen für das Internet genutzt – das Netz wird ausgeweitet auf eigene Kabelverbindungen, die größere Mengen an Daten transportieren können. Erste Strecken nach Europa werden ausgebaut. der Schwerpunkt liegt immer noch bei Wissenschaft und Forschung.

Durch die PC-Technologie werden kleinere lokale Netzwerke möglich (LAN = Lokal Area Network)

Die Blüte der Großrechnerzeit ist vorbei und die Dinosaurier beginnen auszusterben – sog. Workstations gewinnen immer mehr Marktanteile und entwickeln sich rasend weiter – die Technik wird ca. alle 2 Jahre überholt.

Einzelne LANs finden Anfang der 90er Jahre Anschluß an das Internet. Das WWW (World Wide Web) tritt seinen Siegeszug an. „Multimedia“ wird zum Schlagwort (elektronische Verarbeitung von Text, Grafik/Bild, Ton, Video und Animation) und hält Einzug ins WWW.

Was also ist das Internet?

Ein grober technischer Umriss ist bereits oben gegeben worden – das Internet läßt sich abstrakt besser beschreiben:

  • - Ein Recherchemedium – jegliche Art von Information ist greifbar. Für diese Zwecke werden Suchmaschinen programmiert.
  • - Ein Präsentationsmedium – Firmen, Universitäten, Privatpersonen etc. stellen sich im Netz dar.
  • - Ein Kommunikationsmedium – auch die Emails laufen über das Internet, Newsgroups und Foren.
  • - Ein Werkzeug zur Kooperation – weltweit verbreitete Firmen tauschen Dateien, arbeiten über ein Netz verteilt an Projekten.
  • - Es ist ein interaktives Medium und ein interdisziplinäres Medium.

Wie funktioniert es?

Nach dem Client-Server-Prinzip:

Ein Rechner (Server) hält die Informationen – ein anderer (Client) ruft sie ab und zeigt sie an. Eine Verbindung wird aufgebaut, die Informationen übertragen und die Verbindung wieder abgebaut.

Wie kommt es, daß die Rechner miteinander kommunizieren können?

1. Die Rechner müssen eine gemeinsame Sprache sprechen – d. h. ein gemeinsames Protokoll benutzen.

    TCP = Transmission Control Protocol
    HTTP = Hypertext Transfer Protocol
    SMTP = Simple Mail Transfer Protocol
    FTP = File Transfer Protocol

2. Die Rechner müssen eindeutig zu identifizieren sein – jeder Rechner im Internet hat seine Adresse

    DNS = Domain Name System
    DNS-Adresse z. B.: uni-wh.de
    IP = Internet Protocol
    IP-Adresse z. B.:193.175.76.75

URL = Unified Resource Locator = Adresse einer Internetseite

- Aufbau einer URL

http://www.uni-wh.de
benutztes Protokollbenutzter DienstDNS-AdresseZon

Begriffsklärungen

    Gateway: Tor/Zugang zum Internet
    Provider: Anbieter eines Internetzuganges
    Router: Verteilt Nachrichten
    NIC: Network Information Center
    Browser: Programm mit dem Internetseiten angezeigt werden
    HTML: Hypertext Markup Language = Programmiersprache, in der Internetseiten programmiert sind (neuer jetzt auch XML=eXtended Markup Language)

Verschiedene Zonen

Zonen können unterschieden werden nach organisatorischen und geographischen Namen.

Organisatorische Namen (3-stelliger Zeichencode):

    com Kommerzielle Organisationen, Unternehmen
    edu Ausbildungsinstitute, i. d. R. Universitäten (hauptsächlich in den USA)
    gov Regierungsinstitutionen (USA)
    net Organisationstyp für Institutionen des Netzes
    org... alles weitere

Geographische Namen (2-stelliger Zeichencode):

    at Österreích
    ch Schweiz
    de Deutschland
    fr Frankreich
    ru Rußland
    uk Großbritannien
    us USA

Inzwischen reichen die Zonenkürzel jedoch für das rasende Wachstum des Netzes nicht mehr aus und es wird in Zukunft Neue geben. Weitere Namen, die dann auch mehrstellig sein können, sind schon vereinbart worden, z.B
info Informationen

Browsen im Internet

Ein Browser (z. B. Netscape, Internet Explorer) ist ein Programm ohne eigene Intelligenz, das die Programmiersprache des Internets (meistens HTML) verstehen, interpretieren und anzeigen kann. Dabei werden in HTML meist nur die logischen Zusammenhänge der Seite programmiert, Hintergrundfarbe, Position der Bilder, Links etc. Einzelheiten der Darstellung hängen wiederum meist vom Browser ab.

Natürlich hat Browser auch eigene Funktionen – man kann „Lesezeichen“ speichern, eine History wird geführt (URL’s der Seiten, die angewählt wurden), Seiten werden zwischengespeichert (gecached), so daß man bequem ohne Verzögerungen vor- und zurückgehen kann usw.

Die neuen Browser verstehen nicht nur HTML sondern auch Java. Durch sogenannte Plug-Ins können auch Applikationen ausgeführt werden – z. B. Flash, Shockwave oder Sounddateien etc.
 Recherche im Internet

Es gibt kaum etwas, was man im Internet nicht findet. Um Informationen zu finden, bedient man sich einer Suchmaschine. Die Suchmaschinen sind zwar von der Bedienung her recht ähnlich – vom Ergebnis können sie doch sehr verschieden sein.

Um effektiv zu suchen, ist es wichtig, zu wissen, an wen man die eigentliche Suchabfrage stellt. Es gibt im wesentlichen 3 Arten bzw. Kombinationen von Suchsystemen:


    - Manuell erstellte Kataloge
    - Robotergenerierte Indizes
    - Spezielle Suchdienste

Stellt jemand eine Seite im Internet, so kann sie nur gefunden werden, wenn sie bei den Suchdiensten angemeldet wird und so für Abfragen mit indiziert wird. Daher auch die teilweise unterschiedlichen Abfrageergebnisse – nicht jede Seite wird bei jedem Suchdienst angemeldet.

Bei manuell erstellten Katalogen wird die angemeldete Seite meist besucht und in einen Schlagwortkatalog eingeordnet – das trifft eher auf spezielle Suchdienste zu – z. B. Suchmaschinen, die sich mit bestimmten Fachgebieten oder Themen beschäftigen.

Suchdienste wie Yahoo, Lycos bieten Kombinationen aus einerseits menschlicher Redaktion – Seiten werden zu Themengebieten kategorisiert und direkt angeboten (sogar mit kurzer Inhaltsangabe und/oder Bewertung)– andererseits stehen robotergenerierte Indizes zur Verfügung.

Daraus erklären sich bereits die Vor- und Nachteile der einzelnen Systeme. Bei robotergenerierten Indizes entscheidet nur das gesuchte Wort, das, in welchem Zusammenhang auch immer, auf der Seite erscheint – redaktionell überarbeitete Kataloge orientieren sich mehr am Inhalt, haben jedoch den „menschlichen Faktor“, der eine Seite gut bewerten kann oder eventuell auch nicht.

Suchmaschinen

bis auf WebCrawler auch deutschsprachig vorhanden – nur statt der Zone .com die Zone .de einsetzen.

Wie wird nun gesucht?

Zunächst sollte man genauere Überlegungen anstellen, was man eigentlich sucht bzw. zu finden wünscht. Der nächste Schritt ist die Auswahl einer geeigneten Suchmaschine – „geeignet“ aus den vorgenannten Gründen. Sucht man in einem wissenschaftlich umgrenzten Fachgebiet, z. B. Medizin, so wird man eine Suchmaschine benutzen, die dieses Fachgebiet gut abdeckt.

Jetzt geht es ans Suchen und hier kommen die Vorüberlegungen zum Tragen. Will man beispielsweise etwas über Förderprogramme für Solarenergie in Entwicklungsländern wissen, so wäre es müßig, einfach nach einem Stichwort – wie z. b. „Solarenergie“ oder „Förderprogramm“ - zu suchen – Sie würden zigtausende von Treffern erhalten – und wie bereits beschrieben, denkt der Computer meist nicht mit und zeigt Ihnen sämtliche Seiten an, in denen der Begriff vorkommt, die dann nicht unbedingt entfernt etwas mit dem gewünschten zu tun haben müssen.

Sie sollten also kombinieren und dazugehörige Begriffe mit abfragen – z. B. Entwicklungsland, ev. ein spezielles Entwicklungsland, Dritte Welt, ev. Entwicklungshilfe etc.

Sie dürfen allerdings auch nicht zu viele Begriffe kombinieren – eventuell ist der Datenbestand nicht ausreichend genug und Sie erhalten vielleicht überhaupt keinen Treffer. Hier bietet es sich an, die Suche immer weiter einzugrenzen – also erst mit einem Begriff anfangen und innerhalb des Ergebnisses mit einem neuen Begriff weitersuchen.

Für die Verknüpfung der Begriffe gibt es bestimmte Regeln. Bei vielen der Suchmaschinen sind spezielle Optionen anwählbar – meist sind auch Optionen vorgegeben und Sie brauchen die Verknüpfungsoperatoren (sog. Bool’sche Suchoperatoren) nicht mit einzugeben.

Operatoren

und, and, &, + jeder der verknüpften Begriffe muss in dem gesuchten Dokument vorkommen
oder, or, | mindestens einer der verknüpften Begriffe kommt vor
nicht, not, ! Ausschlusszeichen
„Begriff“ Textkette, String – z. B. für feststehende Begriffe oder Namen wie „Bundesministerium für auswärtige Angelegenheiten“

Der String ist sehr nützlich, wenn genaue Begriffe gesucht werden – die meisten Suchmaschinen sind so eingestellt, bei der Abfrage nach „Katze“ auch zusammengesetzte Begriffe wie z. B. „Katzenfutter“ gefunden werden. Oder auch für Namen – „Steffi Bayer“.

Weiterhin kann bei den meisten Suchmaschinen angegeben werden, wie nah die Begriffe beieinander stehen sollen, ob in der Überschrift oder im Text. Bei manchen kann auch ausgewählt werden, ob die Seite eine Bilddatei oder Sounddatei enthalten soll und zuletzt in welchem Bereich gesucht wird – im ganzen Internet, nur deutsche oder nur deutschsprachige Seiten etc. – allerdings bedienen manche Suchmaschinen auch nur deutschsprachige Seiten.

Leere Worte

Manche Worte werden von den Suchmaschinen einfach ignoriert – die sogenannten Stopwords. Solche Worte sind Artikel, Präpositionen: der, die, das, ein etc. und deren fremdsprachlichen Entsprechungen. Diese Wörter können nur als Teil eines Strings gesucht werden.

Bool‘sche Algebra

Herr George Boole hat diese Algebra entwickelt, die sich mit der Verknüpfung mittels Operatoren beschäftigt. Hier wird an dieser Stelle jedoch nicht ausgiebig darauf eingegangen, da dies einerseits zu weit führen würde, andererseits diese Sprache nicht unbedingt bei jeder Suchmaschine angewandt werden kann, da hier meist die Logik (d.h. ob mit und oder oder verknüpft wird) vorgegeben ist. Ein wenig verstehen sollte man dies allerdings schon, damit man sich nicht über die Ergebnisse wundert und Abfragen besser differenzieren kann.

Stellen wir uns vor, wir gehen einkaufen und haben bestimmte Vorstellungen, was wir kaufen möchten - wir suchen einen Rock, grün oder rot, aber nicht aus Seide. Der Auftrag an die Verkäuferin würde lauten:

Rock UND grün ODER rot NICHT Seide
 Sieht einfacher aus als es ist ... stimmt aber leider nicht ganz – die Abarbeitung folgt der Reihe nach. Mit dieser Formulierung würde man einen Rock, grün, nicht aus Seide erhalten. Die richtige Auswahl an Röcken erhalten wir so:

Rock UND (rot ODER grün) NICHT Seide

Dies kann man jetzt natürlich beliebig fortsetzen, mit der Größe, mit Falten etc. – für den Anfang sei hier jedoch genug beschrieben.

Bewertung der Ergebnisse

Als Ergebnis erhalten Sie in jedem Fall eine Liste an Links – ob kommentiert, mit Kurzbeschreibung oder 2-3 Textzeilen und Erstelldatum, hängt von der jeweiligen Suchmaschine ab bzw. kann optional eingestellt werden.

Die Textzeilen, die Ihnen angezeigt werden, sind jedoch nicht immer ein Anhaltspunkt für die sich dahinter verbergende Seite – dieser Text kann ev. vom Ersteller der Seite verfaßt sein und in einer speziellen Datei im Hintergrund gespeichert sein – es hängt also vom Ersteller ab, was er Ihnen als Informationen anbietet. Größtenteils sind dies jedoch die ersten 2-3 Textzeilen auf der Internetseite.

Je nachdem wie populär das Gebiet ist wonach Sie gesucht haben oder auch wie genau die Abfrage formuliert werden konnte, erhalten Sie mehr oder weniger Ergebnisse, die alle mehr oder weniger sinnvoll sind.

Sie können natürlich jeden Link anklicken und anschauen, was sich dahinter verbirgt – dies ist aber meist aus Zeitgründen bzw. aufgrund der Anzahl der Ergebnisse nicht möglich. So müssen Sie die Links günstigerweise bereits am Aufbau der URL beurteilen können.

Anhand der Zone (z. B. .de, .com ...) der URL können Sie bereits erkennen, ob die Seite von Bildungseinrichtung ist (.edu), von einem kommerziellen Anbieter (.com) oder aus welchem Land die Seite stammt.

Ordnerstruktur und Dateiname

Auf einem Server bzw. unter einem Hostname (z. B. http://www.uni-bonn.de) liegen oft Seiten von verschiedenen Anbietern. Die einzelnen Verzeichnisse werden dann meist untergliedert in eine Ordnerstruktur – hier „meist“, weil die Ordnung zwar so erfolgt, nur nicht zwangsläufig sichtbar sein muß. Auch daran kann man schon einiges erkennen.

http://www.uni-bonn.de/studenten/meier/das-bin-ich.html

An dieser URL kann man erkennen, daß es auf diesem Server ein Verzeichnis für Studenten gibt, in das die Studenten private Homepages ablegen können – aus dem Namen der Datei (das-bin-ich.html) kann man schließen, daß sich dahinter wahrscheinlich keine wissenschaftlichen Ausarbeitungen verbergen.

http://www.uni-bonn.de/bibliothek/oeffnungszeiten.html

Normalerweise sind die Dateien mit selbstredenden Namen belegt – hier würden sie also die Öffnungszeiten der Bibliothek der Universität Bonn erfahren können.

Suchen innerhalb der Seite

Manche Seiten sind so umfangreich, daß man sich ersteinmal fragt, wo der gesuchte Begriff steht, um dann auch den Zusammenhang zu sehen.

Jeder Browser hat im Menü Bearbeiten eine Suchfunktion (Suchen, Rahmen durchsuchen o. ä.) – geben Sie einen Begriff ein und klicken Sie auf OK.

Eine weitere und weitaus schnellere Möglichkeit unter Windows ist die Tastenkombination Strg (oder auch Ctrl) und F – schon wird das gesuchte Wort markiert.

Originaltext: Steffi Bayer / Web-Adaption & Ergänzungen: Horst Christian Vollmar, Nik Koneczny 2001


 

[Home] [EbM-Curriculum UW/H] [Allgemeine Info-Suche] [Medizin-Info Laien] [Medizin-Info Profis] [Datenbanken+Leitlinien] [Evidenzbasierte Medizin] [Medizinische Studien] [News/ Über uns]

www.MedizinalRat.de
powered by:

evidence.de

 

Universität Witten/Herdecke
webmaster www.ju-ko.de