Donnerstag, 9. Juni 2011

Schluss mit Beta

Was Gadgets, Kommunikation und soziale Netze angeht, sitze ich in der Fakultät für Informatik zwangsläufig am Puls der Zeit. Da sind einmal unsere Studenten, die traditionell zu den ersten Anwendern halbwegs ausgereifter Informationstechnologien zählen. Wir in der Forschung müssen sogar versuchen, in die Zukunft zu schauen, um rechtzeitig an den Themen zu forschen, die in fünf Jahren hip sind. Glauben Sie mir: die Wirtschaft lebt von uns "early adaptors". Die Forschungs- und Entwicklungsabteilungen (und die Kapitaldecken) der Firmen sind heute so klein, dass immer erst mit unausgereiften Zwischenprodukten (sogenannten Beta-Versionen) Geld verdient werden muss, um die Mittel für weitere Forschung zu haben...

Ich will Sie nicht langweilen und sage Ihnen gleich, warum mir dieser Trend missfällt:

  1. Weil Beta-Versionen zur kritiklosen Hinnahme verleiten
  2. Weil die breite Annahme von Beta-Versionen deren Fortentwicklung verhindert.

Das klingt jetzt vielleicht theoretisch, ist es aber nicht. Nehmen Sie nur mal eine Suchmaschine ihrer Wahl. Die Dinger sind der Hit. Wenn meine Studenten in den Übungen ein Problem lösen wollen, googeln sie erst mal nach den Stichworten der Aufgabenstellung und hoffen, dass es die Lösung schon im Netz gibt. So schaffen sie dann auch den Bachelor bolognese (Insiderwitz) in der vorgeschriebenen Zeit. Die Unibibliothek liegt dagegen derart verwaist da, dass ich niemand über den Lärm beschwert, der durch schon ein Jahr Sanierung entstanden ist.

Allerdings waren Suchmaschinen bei ihrer Einführung noch nicht mal in der Beta-Version angekommen. Suchmaschinen erstellen, grob gesagt, einen ständig aktualisierten Katalog aller Wörter, die in Internetdokumenten auftauchen, und ihre Intelligenz liegt darin, in diesem Katalog schnell blättern und die Suchergebnisse zur Zufriedenheit aller Seiten ordnen zu können. Das war vor 12 Jahren schon so, und das ist heute so.

Hier tauchen auch schon die Kritikpunkte auf. Die Suche mit Suchmaschinen, wie wir sie heute betreiben, ist geradezu steinzeitlich. Wissen Sie z.B., wie sie logische Operatoren (und, oder, nicht) bei Google verwenden können? Nehmen wir an, Sie wollen alle moralischen Fehltritte eines gewissen italienischen und eines gewissen französischen Politikers außerhalb ihrer Heimatländer suchen. Der Google-Ausdruck sieht so aus:
Sex ((Strauss-Kahn -Frankreich) | (Berlusconi -Italien))
. Wissen Sie, wie Sie reguläre Ausdrücke verwenden? Wenn Sie die Vornamen eines gewissen fränkischen Adligen nicht kennen, können Sie ein "ich-weiß-nicht"-Sternchen verwenden:
"Karl Theodor * zu Guttenberg"
, und sie finden alle Varianten, wobei die angegebenen Worte in genau dieser Reihenfolge auftauchen.

Nicht gewusst? Gewusst, aber nie verwendet? Sehen Sie. Die Suchmaschine verlangt von Ihnen nicht, vor der Suche nachzudenken und einen Suchauftrag zu formulieren, der genau Ihrer Frage entspricht. Sie tippen einfach

dominik sylvio sex
ein und hoffen, dass Google ihre Tippfehler korrigiert und die Millionen Webseiten so ordnet, dass das Interessante vorne steht. Viel besser wäre es doch, wenn Google Sie da nicht bevormundet, sondern wenn Sie die Frage so genau stellen könnten, dass es vielleicht nur 10 Ergebnisse gibt, die Sie selber gewichten können.

Sie sind jedoch kritiklos - die erste Suchmaschine konnte nur Worte suchen, und damals konnte man nicht mehr von ihr verlangen. Aber: Sie verlangen von ihr auch heute nicht mehr. Wie wäre es mit einer Anfrage wie: "In der Überschrift soll der Name eines Politikers und ein Verkehrsmittel vorkommen, im Text soll keine Partei mehr als drei Mal erwähnt werden, und der Artikel soll von einer deutschen Zeitung in den letzten drei Jahren verfasst worden sein". Wow! Das gibt vielleicht zwanzig Treffer, und bei zwanzig Treffern übersehen Sie garantiert keinen relevanten Artikel mehr. Sie verlangen das aber nicht von Google. Sie tippen lieber fünf Anfragen mit verschiedenen Politikern, Parteien, Autos und Verlagen, die Ihnen gerade einfallen, und halten Googles Pflicht und Schuldigkeit für getan, wenn es Ihnen 100.000 Dokumente in 0.03 Sekunden zurückliefert.

Ich finde, das ist ein Hohn!

Vor allen Dingen, weil die Technologie, die richtig ausdrucksstarke Anfragen zulässt, seit Jahren existiert. Sie heißt manchmal Semantic Web und beschreibt den Versuch, alle Inhalte im WWW zu beschreiben. Zum Beispiel würde um das Wort "Smart" in der Überschrift stehen, dass es sich dabei um ein Auto handelt, was schonmal falsche Funde nach dem englischen Wort "smart" (für "klug") ausschließt und außerdem eine Menge Folgen hat (dass es auch ein Verkehrsmittel ist, für Individualverkehr geeignet ist usw. ergibt sich nämlich automatisch).

Sie können jetzt schon riechen, warum es dazu nie kommen wird: Wer will schon die Milliarden Dokumente im Netz alle anfassen und jedem Wort eine Bedeutung und einen Kontext zuweisen, nur damit Google bessser wird? Damit sind wir beim zweiten Problem: Die frühe Lösung, das WWW einfach nach Stichworten abzusuchen, hat viel zu lange den "Leidensdruck" nach der inhaltlichen Suche aufgehoben, die ich Ihnen oben erklärt habe. Nun aber sind alle Webseiten so geschrieben, alle Suchmaschinen so programmiert und alle Benutzer so gepolt, dass eine Änderung viel zu aufwändig wäre, selbst wenn sie alles viel besser machte. Die Beta-Versionen von Webseiten, Suchmaschinen und Ihnen als Benutzer verhindern den Fortschritt!

Ich würde gern dafür plädieren, eine Sache erst mal zu Ende zu denken und dann auf die Welt zu bringen. Das stärkt unsere Kritikfähigkeit und öffnet den Weg zu dramatischen Fortschritten. Leider kann ich Ihnen auch nicht sagen, wie wir das anstellen könnten.

Schlagwort: Geschichten aus der heilen Welt

Mir etwas anheimstellen