Informationsauswahl als Bildungsaufgabe am Bsp. der automatischen Informationsreduktion durch spam assassin

Aus Philo Wiki
Wechseln zu:Navigation, Suche

1. Einleitung

2. Informationsbegriff

3. Bildungsaufgabe

4. Spam - assassin

5. Informationsreduktion als gegenwärtige Bildungsaufgabe

6. Assassin statt Lehrerinnen und Lehrer?

7. Schlussfolgerungen

8. Quellenverzeichnis


1.Einleitung

Ausgehend von der Prämisse, dass sich das jeweils gegenwärtige Bildungsverständnis in Medienentwicklung und -gebrauch widerspiegelt, stellt sich die Frage, ob Informationsreduktion, -auswahl und -dimensionierung zu primären gegenwärtigen und zukünftigen Bildungsaufgaben zählen . Die Eigenlogik des Mediums Internet ermöglicht jedem Benutzer eine interaktive Teilhabe, was zu einer Informationsflut und einem Bedürfnis der zielgerichteten Reduktion dieser Information geführt hat. Marotzki et al meinen hierzu, dass der Umgang mit grossen Wissensbeständen und Informationsmengen nur bei einer klaren und konsistenten Problemorientierung möglich sei und heben hervor, dass eine eigentliche Leistung bei der Informations- und Wissensarbeit im Internet vor allem Strukturierung der herangezogenen Wissensbestände darstelle. (http://www.medienpaed.com/03-1/marotzki03-1.pdf, Marotzki, Nohl, Ortlepp, S. 10 ; 14.1.06). Im folgenden Aufsatz soll im Rahmen einer hermeneutischen Interpretation dargestellt werden, in welchem Verhältnis spam assassin (Eliminierung unerwünschter-mails) zu einem derzeitigen Bildungsverständnis steht. Dabei werden zuerst Grundbegriffe geklärt, wie Information, Bildung(saufgabe), Spam und assassin. Danach wird die sich durch übergroße Mengen an Information ergebende Problematik, sowie das derzeitig gegebene Unvermögen diese Schwierigkeit zu meistern, aufgezeigt.

2.Der Informationsbegriff

(informare = lat. durch Unterweisung Gestalt geben)

Der Informationsbegriff kann als ein potentiell oder tatsächlich vorhandenes nutzbares oder genutztes Muster von Materie und/oder Energieformen, das für einen Betrachter innerhalb eines bestimmten Kontextes relevant ist definiert werden. Gegenwärtig ist für die Information die Wiedererkennbarkeit sowie der Neuigkeitsgehalt ein wesentliches Charakteristikum (http://de.wikipedia.org/wiki/information ,09.01.06). Höhlenmalereien stellen nach gegenwärtiger Definition in Wikipedia demnach keine Information dar, da der Neuigkeitsgehalt fehlt. (An dieser Stelle muss zwischen der Verbreitung der Information bezüglich der Entdeckung einer neuen Höhlenmalerei und die tatsächliche Aktualität der Botschaft der Höhlenmalerei differenziert werden).

Nach Postman ist die Behauptung, dass die Computertechnologie das Informationszeitalter erst hervorgebracht hätte irreführend. Für ihn beginnt schon im frühen 16.Jahrhundert, im Rahmen der Erfindung der Druckerpresse, eine neue Ära. Informationen, die bis dahin für viele Menschen unzugänglich waren, wurden plötzlich nutzbar (Postman 1992, S.70 ff). Spätestens ab der Erfindung des Telegraphen (Mitte des 19. Jahrhunderts) wurde dann die zweite Phase der Informationsrevolution eingeläutet. Postman meint: "Vor der Erfindung des Telegraphen konnte sich die Information nicht schneller fortbewegen als ein Zug." Informationen waren bis zu jener Zeit in der Regel von lokalem Interesse (Postman 1992, S.75 ff). Information, wie wir sie heute verstehen und die Möglichkeit eines raschen Informationstransportes hängen demnach eng zusammen. Neue Technologien führten nach und nach zur Akzeleration und heute erreicht der Informationsfluss über Internet die nach Einsteins Relativitätstheorie nicht zu überbietende Lichtgeschwindigkeit. Bezüglich Geschwindigkeit ist der Computer dem Menschen weit überlegen. Der Informationsbegriff wird zumeist von Wissen und Bildung abgegrenzt. Wissen bezeichnet dabei die Gesamtheit aller organisierten Informationen und ihrer wechselseitigen Zusammenhänge, auf deren Grundlage ein vernunftbegabtes System handeln kann. Wissen entsteht erst durch rationale Stellungnahme zu Information und kann auch als potentielle Nutzinformation bezeichnet werden (http://de.wikipedia.org/wiki/Wissen, 14.1.05). Dabei wird ersichtlich, dass in einem hierarchischen System Information unter dem Wissen zu bestimmen wäre.

Zusammenfassend kann festgestellt werden, dass sich der Informationsbegriff im Spiegel der zur Verfügung stehenden Medien entwickelt. Gegenwärtig steht die Begriffscharakteristik "Neuigkeitswert" im Vordergrund, wobei moderne Technologien ein Maximum an Informationstransportgeschwindigkeit bereits erreicht haben, d.h. der theoretisch mögliche Aktualiätsgrad einer Nachricht kaum mehr optimiert werden kann. Im Falle einer Informationsflut ergibt sich aus der Sicht des Betrachters das vordringliche Problem der sinnvollen Informationsselektion.

3.Der Bildungsbegriff

Es besteht im Rahmen der vorliegenden Arbeit an dieser Stelle keine Notwendigkeit sich an Bildungsdogmatiken zu klammern. Festzustellen ist lediglich, dass der Bildungsbegriff im Plural vorliegt und der Bildungswissenschafter/die Bildungswissenschafterin aus reflektieren Überlegungen heraus dieser oder jener Theorie näher steht. Da es nicht Anliegen und Ziel des vorliegenden Aufsatzes ist einen bestimmten Bildungsbegriff, wie neuhumanistische Überlegungen nach Humboldt oder konstruktivistische Ansätze, zu bevorzugen und argumentativ zu untermauern, unterbleibt an dieser Stelle eine Begriffserklärung im klassischen Sinne. Geleitet durch die Prämisse, dass sich der gegenwärtige Bildungsbegriff im Entwicklungsprozess der Medien widerspiegelt, bzw. dass Medientransformation und Bildung in stetiger Wechselwirkung stehen, soll der Moment der Informationsreduktion als Bildungsaspekt hervorgehoben werden.

Bei Marotzki findet sich klar der derzeit bestehende Widerspruch zwischen der geforderten "Komplexitätsproduktion der Wissenschaft" und der "Notwendigkeit der Dimensionierung" (http://www.medienpaed.com/03-1/marotzki03-1.pdf, Marotzki, Nohl, Ortlepp, S. 9, 14.1.05). Hat die Gesellschaft in der Wissenschaft bereits ein Maximum an Komplexität erreicht und wird nun die sinngeleitete Reduktion die "neue Kunst der Forschung"? Auf der einen Seite steht die "Angst vor Informationsverlust", auf der anderen Seite findet sich die "Notwendigkeit der Informationsreduktion".

Im Bildungssektor hat Dietrich Schwanitz versucht den Menschen Bildung innerhalb einer Lebensspanne zu ermöglichen. Auf 697 Seiten hat er eine Auswahl an kulturellen Wissensbeständen der Menschheit zusammengefügt und dabei auch ein Kapitel zum Thema "Was man nicht wissen sollte" verfasst. In diesem Kapitel definiert er eindrucksvoll, was er unter Info-Müll (Spam?) versteht (Schwanitz 2002, S.613).

Wie können wir sicher sein, dass die Streichung von gewissen Inhalten nicht wesentliche Wissensfortschritte blockiert? Beruhen nicht zahlreiche überwältigende Forschungsergebnisse auf Zufallsbefunden? Befinden wir uns aufgrund scheinbar gezielter Informationsauswahl bereits auf einem „blinden Fleck“?

4.Was ist Spam?

Die Kommission der Europäischen Gemeinschaften definiert den Begriff Spam als unverlangt zugestellte e-mails. Der Name Spam ist dem Dosenfleisch SPAM (Spiced Porc and Ham) der Firma Hormel Foods entliehen (http://spam.trash.net/was.shtml, 07.11.05). Ein Monty Python Sketch der 70-er Jahre führte zur Prominenz des Begriffes. Dabei servierte die Kellnerin (Terry Jones) ein Abendessen welches aus egg and bacon, egg sausage and bacon, egg and Spam, egg bacon and Spam, egg bacon sausage and Spam,Spam bacon sausage and Spam, Spam egg Spam Spam bacon and Spam, Spam sausage Spam Spam bacon Spam tomato and Spam, u.s.w bestand.


Das erste Spam wurde am 3.Mai 1978 von einer Computerfirma verteilt. (http://wiki.apache.org/spamassassin/Spam?action=print, 14.1.06)

Die meisten Spams sind kommerziell und werden aufgrund der geringen Kosten für den Versender in grossen Massen verschickt (Millionen!).

Man kann 3 Typen von Spam unterscheiden:

-Kommerzielle Spams (UCE = Unsoliticted Comercial e-mail) -Kettenbriefe und Viruswarnungen -Durch Viren versandte e-mails

Der kommerzielle Spammer hat eine Datenbank mit Millionen Adressen. Diese erhält er durch Absuchen von Newsgroups, Homepages oder e-mail Verzeichnissen. Es spielt dabei keine Rolle, wenn Adressen ungültig sind. Um keine unverschämten Antworten oder Fehlermeldungen zu erhalten setzt der Spammer eine falsche Rückantwortadresse ein (siehe header). Dadurch wird es auch schwierig seine Identität herauszufinden.

Das SMTP- Protokoll (simple mail transfer protocol) ermöglicht es dem Versender den Spam-Text zusammen mit einer Liste von 100 e-mail Adressen zu schicken und der Mailserver arbeitet diese Liste dann ab. Der Spammer hat dabei lediglich die Kosten für ein mail, ein Großteil der Kosten wird auf den Empfänger und die Provider überwälzt. Es fällt auch wenig Arbeit an, denn es existieren Programme, die den automatischen Versand von Millionen mails ermöglichen. Bereits wenige Reaktionen sind ein Gewinn für den Spammer (http://spam.trash.net/was.shtml, 14.01.06)

Auch Kettenbriefe mit der Aufforderung Geld zu überweisen sind im Grunde genommen kommerzieller Spam.

Spams sind ein Ärgernis für alle e-mail Empfänger, da die mailbox überlastet wird und Verzögerungen eintreten, da oft bis zu 30% der zugestellten e-mails unerwünscht sind (http://spam.trash.net/was.shtml, 14.01.06)

Spam Filter sind eine teilweise Lösung, da sie nach dem Wahrscheinlichkeitstheorien arbeiten (siehe Kap. 5) und so einerseits erwünschte mails den Adressaten nicht erreichen, andererseits unerwünschte Post einlangt.

Abb. 1: Beispiel für Spam-header (kommerzieller Spam)

Anmerkung: Ich habe versucht den header autodidakt und garantiert ohne fachliches Vorwissen nach http://www.th-h.de/fay/headerfaq.php zu analysieren).

Return-Path:

Diese Zeile sollte den sg. SMTP – Envelope enthalten. Verglichen mit einer Briefsendung wäre dies der Briefumschlag mit Absender- und Empfängeradresse, der eigentlich einfach weggeworfen wird. Der Nutzer bekommt ihn im Normalfall nicht zu sehen, die Adresse kann beliebig angegeben werden und bringt für eine Rückverfolgung des mails nichts.

Delivered-To: gskacel@aon.at

In dieser Zeile findet sich die Adresse der Empfängerin.


Received: (qmail 1217 invoked from network); 15 Dec 2005 16:47:17 -0000


Hier finden sich Zustellvermerke, die vor dem Versenden einer e-mail vom mailserver vorne angefügt werden. Man sollte sie rückwärts lesen. Diese Zeile ist die oberste, sie wurde vom eigenen mailserver (dem des Anbieters) erstellt. „qmail“ bezeichnet eine Mailserversoftware. Weiters findet sich der Zeitpunkt der Mailauslieferung. Für die Rückverfolgung haben diese Daten wenig Bedeutung.


Received: from unknown ([172.18.5.238])by mailbox04.aon.at (qmail-ldap-1.03) with QMQP; 15 Dec 2005 16:47:17 -0000


Hier ist lediglich die IP-Nummer (in der eckigen Klammer) des liefernden Rechners angegeben. Dieser stellt sich jedoch nicht weiters vor, was für ein spam-assassin Programm (je nach Programmierung) ein Faktor wäre, der besagt, dass es sich bei diesem mail mit großer Wahrscheinlichkeit um ein unerwünschtes handelt. Der eigene server hat das mail empfangen in der runden Klammer befindet sich wieder die Bezeichnung der empfangenden Mailsoftware.

Delivered-To: CLUSTERHOST smarthub74.highway.telekom.at gskacel@aon.at


Received: (qmail 31570 invoked from network); 15 Dec 2005 16:47:03 -0000


Received: from 64.10.90.85.dyn.pero.cust.eefpowernet.ch ([85.90.10.64])(envelope-sender )by smarthub74.highway.telekom.at (qmail-ldap-1.03) with SMTP for ; 15 Dec 2005 16:47:03 -0000

Von unten nach oben gelesen wird hier jeweils der Empfänger und Sender angegeben. Der Sender mit der IP- Nummer 85.90.10.64 stellt sich nach meiner Interpretation mit einer anderen ID-Nummer vor. Dies wäre für ein spam-assassin Programm wieder ein möglicher Verdachtmoment


Received: from insignificant by 64.10.90.85.dyn.pero.cust.eefpowernet.ch with local (Exim 4.14 (Mac OS X)id irknc7-000ZDR-M0 for gskacel@aon.at; Thu, 15 Dec 2005 17:42:20 +0100

5 Minuten dauert es von der Versendung bis zum Empfang. Das ist lange für eine Übertragungszeit, möglicherweise verfälscht und damit verdächtig.

To: gskacel@aon.at

Subject: Press Release

From: Hatchure@lewintermoulding.com

MIME-Version: 1.0

Content-Type: multipart/related; boundary="=_b3a90a91ae8df0ef689f5dd524207654"

Message-Id:

Sender: Leticia Hoffman

Date: Thu, 15 Dec 2005 17:42:19 +0100


5.Spam assassin

Spam assassin basiert auf der Axiomatik der Wahrscheinlichkeitstheorie. Ausgangspunkt ist, dass für Ereignisse, die als Mengen aufgefasst werden, Wahrscheinlichkeiten zugeordnet sind. Diese Definition gibt keinen Hinweis, wie man die Wahrscheinlichkeiten einzelner Ergebnisse ermitteln kann. Sie sagen auch nichts bezüglich des Verhältnisses von Zufall zu Wahrscheinlichkeit aus. Eine mathematische Formulierung bleibt daher offen. (http://de.wikipedia.org/wiki/Wahrscheinlichkeitstheorie, 14.01.06) Im Falle von spam assassin bedeutet dies, dass die Entscheidung bezüglich der "guten" und "bösen" mails letztlich auf der Seite des Programmierers ist.





Beispiel für spam assassin (http://www.boku.ac.at/zid-spam-beispiel.html, 14.01.06)



6.Assassin statt Lehrerinnen und Lehrer?

Im Curriculum manifestiert sich das Bedürfnis nach Richtlinien bezüglich dessen, was lehrenswert ist und was nicht. Karl Heinz Gruber meint hierzu 1992 im Standard in einem Artikel zur "Lehrplanentrümpelung":"Es gibt keinen allgemein verbindlich vorgeschriebenen Lehrstoff...Die österreichischen Lehrpläne geben als Rahmenlehrpläne die allgemeinen und fachspezifischen Bildungsziele vor und benennen Themenbereiche und Inhalte, mit denen diese Ziele zu erreichen sind. Was ein Lehrer tatsächlich unterrichtet, bzw. was Kinder tatsächlich lernen müssen, ist das, was der Lehrer nach dem Prinzip des Exemplarischen ausgewählt hat; niemand kann sich für ihn den Kopf darüber zerbrechen, ob ein bestimmter Lehrstoff für eine bestimmte Gruppe von Schülern in einer bestimmten Situation ideal oder irrelevant ist (Gruber: Standardausgabe vom 16. Dezember 1992, Seite 23)."

Niemand kann also die Auswahl der Information, die dem Schüler zukommen soll besser treffen als der Lehrer/die Lehrerin. Aber vielleicht kann eine Wahrscheinlichkeitsberechnung die gleiche Arbeit leisten, wenn die Prioritäten statistisch festgelegt werden? Kann eine Informationssuchmaschine den Lehrer und die Lehrerin ersetzen?

In der Wikipedia-Definition für den Informationsbegriff werden unterschiedliche Ebenen des Informationsbegriffes dargestellt:

Auf der syntaktischen Ebene wird Information als Struktur gesehen, die übermittelt werden soll. Inhalt der Information ist unwesentlich. Wesentlich ist, dass die Information verlustfrei übertragen wird (http://de.wikipedia.org/wiki/Informationen, 14.01.06). Diese Ebene ist für den Computer problemlos leistbar.

Weiters existiert die semantische Ebene der Information. Strukturierte, syntaktische Informationen werden dabei verwertbar, indem sie gelesen und interpretiert werden. Zur Strukturebene muss die Bedeutungsebene hinzukommen. Ein Bezugssystem muss angelegt werden, um Strukturen in eine Bedeutung überführen zu können (http://de.wikipedia.org/wiki/Informationen, 14.01.06). Durch Programme, die auf einer Wahrscheinlichkeitsberechnung beruhen kann auch diese Ebene durch den Computer theoretisch geleistet werden. Das heißt, das Programm entscheidet bezüglich einer "brauchbaren" und "unbrauchbaren" Information aufgrund einer hierarchischen Ordnung von Bedeutungen, die einzelnen Ereignissen zugeordnet werden.

Die sg. pragmatische Ebene der Informationsauswahl kann jedoch meiner Meinung nach niemals durch den Computer ausgeführt werden. Dabei geht es darum, dass Information das Subjekt, das die Information aufnimmt verändern (http://de.wikipedia.org/wiki/Informationen, 14.01.06). Der Computer kann jedoch nicht wissen, ob diese Information ein Ereignis ist, welches den Zustand des Empfängers tatsächlich verändert. Dies liegt auch in der Logik der Wahrscheinlichkeitstheorie begründet. Ein Ereignis, welches zu 99% für den Empfänger Bedeutung hat, hat immerhin eine 1%ige Chance doch als unbedeutend eingestuft zu werden. Aus einer Information, die zu 0,5% Bedeutung hat, kann ein überwältigendes Ereignis folgen. (Die Entwicklung des Penicillins beruht auf einem Fehler von Alexander Fleming und damit auf einem Zufallsbefund! Ein Computer hätte die verschimmelte Bakterienkultur verworfen!)


7.Schlussfolgerungen


Informationsreduktion ist aufgrund der Möglichkeiten einer nicht weiter zu optimierenden Informationsübertragungsgeschwindigkeit zu einem Bildungsanliegen geworden. Durch statistische Verfahren wird mathematisch versucht diesem Problem zu begegnen. Die Grenze von Informationsauswahlprogrammen ergibt sich durch die Charakteristik der Wahrscheinlichkeitsberechnung. Bedeutungen können Ereignissen zugeordnet werden, jedoch bezüglich einer tatsächlichen Veränderung im Tun entscheidet der Mensch.


8.Quellenverzeichnis

Postman Neil: Das Technopol. Die Macht der Technologien und die Entmündigung der Gesellschaft. Frankfurt am Main: Fischer 1992 (3. Auflage)

Gruber: Standardausgabe 16. Dezember 1992, Seite 23

Schwanitz Dietrich: Bildung. Alles, was man wissen muss. München. Goldmann. 2002 (15.Auflage!)


links

http://de.wikipedia.org/wiki/Information, 09.01.06

www.medienpaed.com/03-1/marotzki03-1.pdf, 14.01.06

http://de.wikipedia.org/wiki/Wissen, 14.1.05

http://spam.trash.net/was.shtml, 07.11.

http://wiki.apache.org/spamassassin/Spam?action=print, 14.1.06

http://de.wikipedia.org/wiki/Wahrscheinlichkeitstheorie, 14.01.06


zurück zu Ausbildungsformen der Wissensgesellschaft