blogoscoop

10 Januar 2006

Was ist Information? Und wieviel gibt es?

Grad hab ich eine Webseite gefunden, auf der Peter Lyman und Hal Varian von der University of California in Berkeley der Frage nachgehen, wieviel "Information" pro Jahr geschaffen wird. Diese Studie stammt von 2003, d.h. verwendet Daten von 2002, und ermöglicht einen Vergleich mit deren Vorgängerstudie von 2000 (1999):
Lyman, Peter and Hal R. Varian, "How Much Information", 2003. Retrieved from http://www.sims.berkeley.edu/how-much-info-2003 on [10.1.2006].

Der Zusammenfassung kann man entnehmen, dass pro Jahr 5 Exabyte oder 37.000 mal die Library of Congress (die 20 Mio Bücher enthält) an "Information" "kreiert" wird.
Was ist Information? Heißt das einfach, dass, wollte man die Medien der Library of Congress in einem bestimmten Datenformat abspeichern, man das 37.000 mal tun müsste, damit man den Speicherplatz verbraucht, den die übrigen wie immer gearteten Daten verbrauchen, die jedes Jahr neu geschaffen werden? Der Vergleich mit der LoC sorgt eher dafür, dass es klingt, als würde jedes Jahr 37.000 mal so viel Wissen produziert wie in den Büchern der LoC gespeichert ist. Aber der Gedanke natürlich quatsch. Schließlich lässt sich die Menge an Daten (= "Information") nicht in die Menge an Wissen etc. (= Sinn der Daten) übersetzen. Wieviel Wissen in so verstandenen Informationen steckt, kann man diesen gar nicht ansehen. Dieser Text hier z.B. würde eine unterschiedliche Menge an Information sein, je nachdem, ob ich ihn als .txt, als .rtf, als .doc oder als .pdf ablege. Was die Informationswissenschaftler als "Information" dabei mitrechnen, sind solche Dinge wie Schriftformatierung und die automatisch erzeugten Metadaten, welche die Programme dem Text mitgeben. Dabei reden wir aber kontinuierlich vom selben Text (was für eine Art von Identität ist das?), entsprechend vom selben Wissen, das er transportiert.
Der Vorteil des engen Informationsbegriffs der Studie ist natürlich, dass sich Information so messen lässt. Das scheint mir aber auch der einzige zu sein...

1 Kommentar:

  1. Das ist wirklich der Witz des Jahrhunderts. Denn es geht ja noch weiter. Was ist, wenn ich alle Daten oder wenigstens zum Teil Zip- oder ähnlich koprimiere?
    Was für Bilder verwende ich? Viele, wenig, gar keine? Ein Bildband von Argentinien hätte ein 100faches an Information wie alle Literatur von und über Platon zusammen seit der Antike.
    Sind Filme inbegriffen? So mit Rohmaterial, Vorversion, Schnittverion, endgültige Version, Directorscut, DVD Specialedition. Ein einziger Kinofilm kann dann so viel Information sein, wie die gesamte abendländische Philosophie zusammengenommen und zwar in alle Sprachen die es gibt übersetzt. Plus Sekundärliteratur!
    Wie viele (manchmal ja notwendige) Redundanzen werden gezählt? Was ist mit Pardcover und Paperback?
    Was ist mit mit Neuauflagen, Zitaten, Übersetzungen, Editionen...

    Dass jemand mit solch einem naiven Informationsbegriff in die Öffentlichkeit gehen kann und nicht unverzüglich und auf er Stelle von seiner, ja doch sehr renomierten, Universität gefeuert wird, ist das eigentliche Wunder.

    AntwortenLöschen