Eidola und logos

Zur Verwilderung des Denkens im Kontext des ikonischen Komplexes

von Emmerich Nyikos

1.

Niemand, außer Bischof Berkeley (und, um uns nicht auf die abendländische Tradition zu beschränken, schon zuvor der islamische Philosoph Al-Ghazzali), wird wohl bezweifeln wollen, dass es eine objektive Realität außerhalb und unabhängig von unserem Bewusstsein gibt, und zwar in dem Sinne, dass, wenn die Menschheit (und damit das Bewusstsein) von der Erde verschwände, sich diese Realität nicht mit ihr desgleichen verflüchtigen würde. So wichtig sind wir nicht. Es wäre denn auch ein wenig vermessen zu glauben, dass die Wirklichkeit unseres Bewusstseins bedarf, um zu sein. Esse non est percipi, oder anders gesagt: percipi nihil est sine ente.

Nun, ist dem so, gibt es also eine objektive Realität außerhalb unseres Geistes, so ergibt sich daraus unmittelbar das Problem: Wie ist die Verbindung von beiden beschaffen? Oder genauer: Welche Zugangswege zu dieser „Welt da draußen“ stehen uns zur Verfügung jenseits der unmittelbaren Wahrnehmung durch unsere Sinne? Wodurch also ist diese Beziehung vermittelt?

Dieses unser (semiotisches) Problem – die Relation von Sein und Bewusstsein mit Blick auf ihre Mediation – hat, dies sei nebenbei bemerkt, prima facie nichts mit demjenigen epistemologischer Natur zu tun, das sich dahin resümieren lässt, dass die Repräsentationen im Geist natürlich in einer anderen „Substanz“ mit ganz anderen Qualitäten erfolgen, als es die der externen Realität sind: Sie sind mentale Konstruktionen (Descartes würde sagen: res cogitans), welche mit realen Fakten (der res extensa) korrespondieren (wenn sie korrespondieren), sie aber nicht eins zu eins reproduzieren – „abbilden“ oder „widerspiegeln“. Diese Konstruktionen sind kein „Spiegelbild“ im eigentlichen Sinn, sondern, figurativ gesprochen, Rekonstruktionen von Entitäten mit ihren (dynamischen) Strukturen und ihren Relationen, welcher Art diese immer auch seien, in einem anderen „Material“ – so wie es der Plan einer Stadt mit Bezug auf ihre Struktur ist –, es sind, wenn man so will, mentale Modelle, die nur das Essentielle des anvisierten Objekts, d.h. dessen funktionelle Struktur, reproduzieren. Die Farben existieren in der Realität so, wie wir sie erfahren, keineswegs, das, was wir Farben nennen und als Farben erleben, hat kein Sein außerhalb unseres Bewusstseins. Der jeweilige Farbeindruck entspricht lediglich jeweils einem bestimmten Abschnitt des Spektrums des sichtbaren Lichts (der elektromagnetischen Wellen). Dies aber ziemlich konstant. Die bestimmten Grenzen, die wir in diesem Kontinuum ziehen (zwischen Grün und Blau usw.), sind allerdings von Sprache zu Sprache verschieden, sie sind variabel, nichtsdestotrotz kann man immer auch die Nomenklatur verfeinern, indem man Nuancen introduziert („hellblau“ und „dunkelblau“ etwa), so dass die Willkür der primären Repräsentation dadurch ausgeglichen und eine intersprachliche Verständigung operabel wird. Man könnte auch sagen: Wir „übersetzen“ die Wellenlänge des Lichts, wenn wir es wahrnehmen, in unserem Geist in die „Sprache“ der Apperzeption, eine Übersetzung, die, wie jede Übersetzung, eben nur die Essenz der übersetzten Sache wiedergibt. Wenn wir aus dem Lateinischen etwa ins Deutsche übersetzen, dann übersetzen wir nicht die grammatischen Strukturen, die Satzmelodie, die Wortstellung usw., sondern nur den Inhalt des Texts. Bleibt dieser invariant, dann ist die Übersetzung gelungen. Mehr ist indes auch nicht nötig, wenn es sich nicht gerade um Poesie handeln sollte. Denn die Repräsentation im Geist hat keinen anderen Sinn, als dass wir uns in der „Welt da draußen“ zurechtfinden können: dass wir in einer tendenziell feindlichen Umwelt überleben, indem wir sie verstehen. Und weil wir, bis jetzt wenigstens, als Gattung überleben konnten, muss man vermuten, dass die Repräsentation der Realität im Geist zumindest phylogenetisch (mit Bezug auf die Leibnizsche mens, die Konrad Lorenz die „Rückseite des Spiegels“ genannt hat)mit der extra-mentalen Wirklichkeit korrespondiert. Ganz abgesehen davon, dass das Wissen, die konkrete Repräsentation der objektiven Realität, historisch (im Prinzip wenigstens) unentwegt anwächst (sieht man von Phasen der Regression ab, die es ja auch gab). Diese Wirklichkeit nun ist aber nicht, das sei hier noch gesagt, ein ungeordnetes Durcheinander oder ein Chaos, das der Geist „ordnen“ müsste, denn dann hätten wir wieder die Exaltation des Bewusstseins, das das Sein, über sein bloßes Dasein als aristotelischen Stoff hinaus, „schafft“, indem es ihm, also der Wirklichkeit, eine Struktur aufdrücken würde. Die Wirklichkeit ist von allem Anfang an strukturiert, denn sonst würde der Geist, das Bewusstsein oder genauer: die materielle Basis desselben, das Gehirn, gar nicht entstanden sein können.

Dies aber nur nebenbei. Was uns hier interessiert, ist kein epistemologisches Problem im engeren Sinn, es ist die objektive Vermittlung zwischen Außen und Innen, das „Medium“, die Vermittlungsinstanz außerhalb des Bewusstseins, in einem sehr weit gefassten Sinn – kurz: der semiotische Komplex –, und dessen Rolle mit Blick auf die Sicht der Subjekte auf die und damit ihr Verhalten zur Welt.

2.

Es versteht sich von selbst, dass das Konglomerat der externen Vermittlungsinstanzen über die Jahrtausende, ja Jahrmillionen hinweg nicht konstant blieb, dass sich im Laufe der Zeit zu den ursprünglichen „Mediatoren“ (semiotischen Mitteln im weitesten Sinn) immer neue hinzugesellt haben und mit den schon gegebenen zu jeweils neuen Mediationskomplexen verschmolzen.

Vor dem Abschluss der Anthropogenese war, wie bei allen Säugetieren, so auch bei den Prähominiden (vor der Ausbildung der Sprache mithin), der Zugang zur objektiven Realität exklusiv (oder beinahe exklusiv) durch den Wahrnehmungsapparat, ohne äußere Vermittlung, gegeben: durch die organismusinterne Apperzeption. Informationen erhielt der Organismus vornehmlich auf haptischem, optischem, auditivem oder olfaktorischem Wege. Der Zugang zur Welt war ein nicht-mediativer, sieht man von der gestischen Unterweisung und Hinweisgabe durch andere Individuen derselben Art ab, die es im übrigen bei allen Säugetieren gibt. Es soll hier, by the way, nicht verschwiegen werden, dass semiotische Systeme in gewisser Weise auch schon bei den Insekten anzutreffen sind: Bienen haben eine eigene „Sprache“ oder genauer: ein eigenes Zeichensystem (den „Bienentanz“), ein semiotisches Mittel, das allerdings genetisch bedingt, das angeboren und deshalb nicht kreativ (im Sinne von Noam Chomsky) ist. Es hat in etwa denselben Status wie der schallbasierte Orientierungssinn von Fledermäusen.

So ist zu sagen: Bei den Prähominiden war der Zugang zur Welt im Wesentlichen ein nicht-mediativer, man nahm Signale aus der Umgebung auf direktem Wege wahr, Signale, die dann für das Verhalten der Individuen ausschlaggebend waren: Man reagierte darauf. Diese Signale nun waren in der Regel zeit- und raumgebunden, d.h. der Radius, dessen Zentrum ihr Empfänger ist, war zeitlich und räumlich beschränkt, auch wenn bisweilen diese Signale auch auf Fakten aus der Vergangenheit oder von weiter weg verweisen konnten: Die Rauchsäule signalisiert eine Gefahr, die topologisch vom Standpunkt des Wahrnehmenden relativ weit entfernt sein kann, während ein geknickter Zweig darauf Hinweise gibt, dass vor einiger Zeit ein Raub- oder Beutetier hier vorbeigekommen sein könnte. Unwillkürliche Index-Zeichen oder Indices, die keinen Sender haben, sondern sich auf natürliche Weise ergeben, sind daher die ersten Vermittlungsagenten von Informationen, die räumlich oder zeitlich jenseits des unmittelbaren Umfelds des Subjekts angesiedelt sind.

3.

Mit dem Abschluss der Anthropogenese, die man sich als einen Prozess vorstellen muss, der sich über einen extrem langen Zeitraum hingezogen hatte und während dessen spätere humane Qualitäten (das Artikulieren von Lauten etwa, die antizipatorisch auf die spätere Sprachverwendung verweisen) natürlich schon in nuce präsent gewesen sind, tritt ein neues, das wichtigste semiotische Medium auf: die natürliche Sprache. Diese ist selbstverständlich viel mehr als nur ein semiotisches Werkzeug der Informationsübertragung: Sie hat darüber hinaus das rationale Denken jenseits von Assoziationen (bedingten Reflexen) erst wirklich ermöglicht. Dieser Aspekt kümmert uns hier aber nicht.

Was die Sprache als rein semiotisches Mittel, als Instrument der externen Mediation zwischen Geist und objektiver Wirklichkeit, betrifft, so erlaubte sie es dem Homo sapiens zum ersten Mal in größerem Umfang, Informationen zu erhalten, die weder zeitlich noch räumlich beschränkt sind, nicht an Ort und Zeit gebunden. Man konnte so Dinge erfahren, die vor dem aktuellen Moment (aber mit Einschränkungen auch solche danach) und die jenseits des Ortes, wo man sich gerade befand, sich ereignet hatten oder sich erst ereignen würden.

Man konnte auf diese Weise den Horizont der eigenen Erfahrung radikal erweitern, indem man verbale Nachrichten von anderen Mitgliedern der eigenen Gruppe erhielt, deren Gedächtnis Informationen aufbewahrt hatte, die von älteren und schon längst nicht mehr lebenden Vorfahren tradiert worden waren, die ihrerseits dann diese Informationen von einer noch früheren Generation übernommen hatten, und so immer fort. Und man konnte diesen Horizont auch erweitern – in einem räumlichen Sinn –, indem man, ein wenig zeitversetzt, über die Vermittlung von „Reisenden“, von Personen, die einen Ortswechsel vorgenommen hatten, auf sprachlichem Wege von Dingen erfuhr, die sich weit weg vom eigenen Aufenthaltsort abgespielt hatten.

Die „Augenzeugenschaft“, die Präsenz und damit der direkte visuelle Kontakt, verlor dadurch relativ an Bedeutung. Die Erfahrung war so nicht mehr exklusiv personell. Sie konnte nunmehr auch eine vermittelte sein. Dies gilt sogar für ihre haptische, auditive oder olfaktorische Dimension, wenn auch eher limitiert, denn die Beschreibung einer solchen Erfahrung, gegenüber der Beschreibung visueller Impressionen, lässt mit Blick auf die Präzision doch einiges zu wünschen übrig. Das Schildern des Angriffs eines Raubtiers in allen Details ist viel plastischer als die Wiedergabe der Laute, die es bei dieser Attacke von sich gab. Viel mehr, als dass „es brüllte“, kann man nicht sagen.

4.

Mit der Sprache ist also der Zugang zur Welt nicht mehr allein personell und unmittelbar, sondern dieser Zugang ist nunmehr auch über die Nachrichten, deren Quelle andere sind – von Individuen, die dieselbe Sprache sprechen –, vermittelt.

Allerdings: Auch wenn wir hier eine Ausweitung des (räumlichen und zeitlichen) Umkreises sehen, innerhalb dessen Information zugänglich wird, so ist diese Extension nichtsdestotrotz limitiert: Immer noch hängt die Informationsübertragung an den Personen als Sender (an ihrer persönlichen Präsenz), ganz zu schweigen davon, dass der Kreis derjenigen, die Informationen austauschen können, nicht unbedingt groß ist – die Gruppengröße paläolithischer Gemeinschaften in Rechnung gestellt. Und da dieser Austausch mündlich erfolgt, so ist immer davon auszugehen, dass, speziell mit Blick auf die Erfahrung, die bei früheren Generationen ihren Ausgangspunkt hat, aber nicht nur, das Stille-Post-Prinzip zur Anwendung kommt: Die ursprüngliche Nachricht wird im Zuge der Transmission sehr oft lädiert und verstümmelt oder kommt völlig umgeformt an. Es tritt hinzu, dass, wie man weiß, die Übermittlung von Nachrichten sehr oft im Kontext der Gegenwart modifiziert wird – in Abhängigkeit von dem, was hier und jetzt opportun ist. Darauf haben insbesondere auch die Forscher zum Neuen Testament mit allem Nachdruck hingewiesen. Es kommt auch vor, dass die Rezipienten aus späterer Zeit gar nicht mehr nachvollziehen können, welche Bedeutung dieses oder jenes ehedem hatte: Homer, der rund drei Jahrhunderte nach dem Untergang von Mykene und der Bronzezeit lebte, weiß, dass es Streitwagen gab, lässt aber, weil er sich darauf keinen Reim machen konnte, seine Heroen auf diesen Wagen nur bis zum Schlachtfeld fahren, wo sie dann absteigen und zu Fuß weiterkämpfen. Dies erstaunt nicht, denn der Kampf zu Fuß (wenn auch nicht in der Form der Hoplitenphalanx, die erst im 7. Jahrhundert von den Spartanern kreiert werden sollte, sondern in der des Einzelkampfes).war zu der Zeit üblich, als der Dichter „Homer“ seine Epen verfasste.

5.

Das ändert sich erst – wenn auch vorerst von eher geringer praktischer Bedeutung – mit den ersten dauerhaften, externalisierten Repräsentationen ikonischer Natur: mit den Felsen- oder Höhlenbildern auf der einen und den Statuetten, vornehmlich in weiblicher Form, auf der anderen Seite. Eine Nachricht – als ikonische ist diese indessen den natürlich-sprachlichen oder verbalen hinsichtlich des (möglichen) Informationsgehalts natürlich weit unterlegen – wird fixiert auf dauerhaftem Material, wie es etwa eine Felswand oder ein Holzstück, ein Knochen oder ein Gesteinsbrocken ist, so dass diese Nachricht (hinsichtlich ihrer Speicherung) unabhängig von humanen Informationsträgern wird, also vom menschlichen Gedächtnis, das, wie wir wissen, notorisch unzuverlässig ist. Auf diese Weise werden mithin Informationen (oder genauer: deren Träger, semiotisch gesprochen: signifiants) jenseits der aktuellen Sendesituation exteriorisiert, gewinnen ein nicht sofort wieder verschwindendes Dasein, ein dauerhaftes, kontinuierliches Dasein, das, im Gegensatz zu den Lauten (die nichts anderes als artikulierte Luftschwingungen sind), nicht sofort wieder verdampft, sondern für längere oder sogar sehr lange Zeit überlebt: Die Höhlenmalereien von Lascaux und Altamira und die Venus von Willendorf existieren noch heute. Der Informationskanal, das, was zwischen Sender und Empfänger einer Nachricht liegt, wird von der Emission unabhängig, existiert als Medium in eigenständiger und dauerhafter Form.

Wenn wir oben sagten: „von geringer praktischer Bedeutung“, so müssen wir dies hier allerdings relativieren, denn solche Malereien (und womöglich auch Statuetten) dienten vornehmlich als Szenerie für kultisches (magisches) Handeln. Und dieses darf man in einem Kontext, wo der Erfolg des praktischen Tuns (hier der Jagdtätigkeit) sehr von Zufällen abhängt, in seiner Bedeutung nicht unterschätzen. Wenn man in einer Höhle auf Darstellungen von gängigem Jagdwild mit realen Waffen schießt, so antizipiert man unweigerlich den Erfolg der sich daran anschließenden tatsächlichen Jagd, insofern die gemalten Tiere nicht in Bewegung sind, nicht vor den Jägern fliehen, und sich so offenbar dem Umstand nicht entziehen können, mit Sicherheit „getroffen“ zu werden. Ein solcher imaginärer Erfolg trägt aber viel dazu bei, die Jäger mental zu bestärken und sie so auch im realen Geschehen treffsicher werden zu lassen. Nichtsdestotrotz ist der Informationsgehalt solcher Gebilde doch eher gering und lässt sich nicht mit dem verbaler Enunziationen vergleichen.

Zudem ist, zumindest was die Malereien betrifft, diese Form der Fixierung von Information in einem äußeren Material strikt an den Ort der Herstellung gebunden, ganz abgesehen davon, dass nur wenige überhaupt mit ihnen in Berührung kommen konnten und daher die „Reichweite“ (den Ausdruck im Sinne der modernen Kommunikation genommen) extrem eingeschränkt war.

6.

Diese ersten semiotischen Repräsentationen auf dauerhaftem Material waren durchwegs ikonischer Natur: Malereien bildeten äußere Formen, die Umrisse und die Farbe jagdbarer Tiere, die Statuetten die Gestalt meist weiblicher Wesen mehr oder weniger realistisch ab, wobei natürlich das, worauf es insbesondere ankam, hervorgehoben wurde: bei Statuetten etwa die sekundären Geschlechtsmerkmale als Symbol der Fruchtbarkeit.

Indessen dürften auch schon recht früh abstraktere Zeichen benutzt worden sein, Einkerbungen auf Holz zum Beispiel als mnemotechnisches Mittel. Das waren die ersten Schritte hin zur Schriftlichkeit. Allerdings taucht die Schrift im eigentlichen Sinn erst viel später auf, in den ersten Zivilisationen, die sich in den Flusstälern des Euphrat und Tigris (im Schwemmland Mesopotamiens), des Nil, des Indus und des Hoangho auszubilden begannen. Und später auch anderswo, außerhalb des Bereichs der Bewässerungszonen, auf Kreta und in Mykene zum Beispiel, die sich im Ausstrahlungsbereich einiger dieser Zivilisationen befanden. Speziell ist das Beispiel der Maya, wo es nachweislich überhaupt keinen Einfluss von außen bei der Ausbildung ihrer Glyphenschrift gab.

Es darf nun keineswegs verwundern, dass gerade in diesen Gesellschaftssystemen sich die Schrift zuerst etablierte, waren sie doch durch das, was als Tempel- oder Palastökonomie bezeichnet worden ist, charakterisiert: durch eine zentralisierte Verwaltung. Und in einem solchen System ist die schriftliche Fixierung von Daten essentiell. Wer hat wann, von woher und wie viel an Getreide an den Palast oder den Tempel geliefert? Und an wen wurde dieses Getreide schließlich verteilt? Das musste man wissen und man musste es schriftlich fixieren, sonst wäre es zu einem heillosen Durcheinander in der Verwaltung des Palasts oder des Tempels gekommen.

Im Vergleich mit den Icons bedeutet nun aber die Schrift, in welcher Form sie auch immer sich im Laufe der Zeit auszubilden begann (als Keilschrift, Hieroglyphen, Alphabet, Logogramme oder Glyphen), dass

1. die Information, die schriftlich aufgezeichnet worden ist, verbalen Charakter besitzt (wir sehen hier von den Ideogrammen ab), daher aber auch viel komplexer sein kein als diejenige ikonischer Gebilde;

2. die Schrift fähig ist, auch abstrakte Gedanken (Abstracta) aufzubewahren;

3. durch die Schrift Zeitstufen (Präsens, Präteritum, Futur) fixiert werden können; und dass

4. die Information, anders als diejenige, die die Malereien auf Fels oder die Statuetten enthalten, nicht nur zeitlich, sondern auch räumlich mobil ist: Sie überdauert nicht nur die Zeit, in der sie notiert worden ist, sondern man kann sie im Prinzip auch weiträumig anderswohin transferieren.

Hier kommt freilich alles auf das Material als solches an, dessen man sich zur Fixierung bedient: Während die Felsmalereien und die Statuetten aus extrem dauerhaftem Stoff bestehen, sind sie überhaupt nicht (oder nur eingeschränkt) mobil (Statuetten, als offenbar sakrale Gegenstände, werden in der Regel nicht an Fremde weitergegeben). Demgegenüber ist zwar das Geschriebene im Raum transportierbar (sieht man von Inschriften auf Stein, auf Tempelmauern oder Stelen ab), das Material aber nur begrenzt von Dauer – Steininschriften überleben zwar Jahrtausende, sie sind jedoch quantitativ négligeable, während Tontafeln nur auf uns gekommen sind, weil der Ton bei einem Tempel- oder Palastbrand durch das Feuer gebrannt und die Schriftzeichen daher zufällig konserviert worden sind. Papyrus und Papier dagegen vergehen früher oder später und überdauern die Jahrhunderte nur im heißen Wüstensand (wie in Ägypten) oder in Tongefäßen, in denen sie von äußeren Einflüssen mehr oder weniger abgeschirmt sind (wie ein Teil der Manuskripte aus den Höhlen am Toten Meer); bisweilen bleiben sie auch bei einem Vulkanausbruch als verkohlte Volumina erhalten (wie in Pompeji), deren Schriftzeichen mit geeigneten Methoden heute wieder lesbar gemacht werden können. Das Pergament bildet hier einen Ausnahmefall, denn es ist weit haltbarer als Papyrus oder Papier, aber auch nicht endlos. Die Tradierung in der Zeit erfordert daher wiederholtes Kopieren.

7.

Der große Vorteil der Schrift gegenüber der mündlichen Tradition, rein technisch gesehen, besteht nun gerade darin, dass Informationen an spätere Generationen überliefert werden können, ohne dass diese Information durch den Stille-Post-Faktor verfälscht werden würde. Es kommt zwar des Öfteren vor, dass beim Abschreiben der eine oder andere Fehler gemacht wird, ganz zu schweigen von Manipulationen am Text, die bewusst herbeigeführt werden („Korrekturen“ oder „Ergänzungen“ durch spätere Kopisten, wie dies etwa beim Text des Neuen Testaments nicht selten der Fall gewesen sein dürfte), im Grunde aber sind schriftlich fixierte Informationen in der Regel weitaus authentischer als mündlich tradierte („Generationenlisten“ allerdings können bisweilen durchaus zuverlässig sein): Das „externe Gedächtnis“ ist eben stabiler als das interne – und dies aufgrund des „Speicher-Materials“, insofern sich Verbindungen in neuronalen Netzen in der Regel bilden, um sich dann, wenn das Gespeicherte nicht wieder aufgefrischt wird, auch wieder zu lösen, während sich schriftlich Fixiertes, wie wir sahen, nicht oder kaum Veränderungen unterworfen ist, sieht man einmal vom Verderben des Trägermaterials ab, das allerdings durch Kopieren konterkariert werden kann.

8.

Waren Schriftstücke (im Speziellen Volumina, Schriftrollen, und später Codices, Bücher) in den ersten Jahrtausenden der Schriftlichkeit zwar kopierbar, aber eben nicht massenhaft, da es Kapazitätsgrenzen gab – ganz abgesehen davon, dass aufgrund des Analphabetentums der unteren Klassen auch die Rezipienten größtenteils fehlten –, so änderte sich dies mit dem Druck. Nunmehr konnten schriftliche Dokumente, Bücher, Flugschriften, Kalender, fast unbeschränkt vervielfältigt werden, wodurch ihre Reichweite, die Anzahl der potentiellen Leser mithin, ungemein erhöht worden ist. Die Grenze war hier die Rate der Lesefähigkeit, die aber durch das Vorlesen bis zu einem bestimmten Punkt nach oben hin verschoben werden konnte.

Mit der Alphabetisierung schließlich, der Einführung eines Elementarunterrichts für die breite Masse (es sei hier nur Maria Theresia erwähnt), wurde das Gedruckte zu einem Medium, das, neben der unmittelbaren Mitteilung und dem Hörensagen, den Zugang zur Welt jenseits des persönlichem Erlebens mit dominierte – und dies immer mehr.

9.

Der Menschheit (dem homo sapiens) standen während der allerlängsten Zeit ihres Daseins also folgende Zugangswege zur Welt zur Verfügung, in der Reihenfolge ihres Erscheinens sind dies:

1. die direkte persönliche Wahrnehmung visueller, auditiver, haptischer oder olfaktorischer Natur;

2. die verbale Kommunikation zwischen den Gruppenmitgliedern oder überhaupt innerhalb einer Sprachgemeinschaft und jenseits davon, wenn wir die Zwei- oder Mehrsprachigkeit in Rechnung stellen wollen;

3. die ikonische Repräsentation, die sich freilich auf Zeichnen und Malen respektive Skulptieren und Modellieren beschränkte;

4. die Schrift, die schließlich sich durch den Druck vom händischen Schreiben emanzipiert hat und so erst wirklich dominant werden konnte.

Dabei handelt es sich im Falle der Wahrnehmung im engeren Sinn nicht um ein semiotisches Problem, da keine Zeichen, welcher Art sie immer auch seien, involviert sind, sondern man hat es lediglich mit Signalen zu tun. Da wir uns hier allerdings, wie schon gesagt, auf den semiotischen Aspekt der Produktion, Weitergabe, Speicherung und Verarbeitung von Information konzentrieren, blenden wir dieses „erste Signalsystem“, wie es Pawlow genannt hat, vollständig aus.

Was nun ändert sich für die Repräsentation der Welt im Bewusstsein, die Verarbeitung der externen Information und das Verhalten, das sich daraus ergibt, wenn nach und nach neue semiotische Formen zu den früheren treten?

Im Großen und Ganzen kann man sagen, dass mit der Ausweitung des semiotischen Raums die Kapazität, die Welt zu begreifen, sich mithin vom animalischen Verhältnis zu dieser Welt zu emanzipieren, dadurch nämlich, dass ein „zweites Signalsystem“, die Sprache, zum ersten hinzutritt, das schließlich dann durch diverse semiotische Methoden der Fixierung und externen Repräsentation von Informationen ergänzt wird, historisch mit jedem Schritt zunimmt.

Es versteht sich von selbst, dass die einfache „Aisthesis“ (die sensuelle Perzeption) vor dem Abschluss der Anthropogenese impliziert, dass der Erfahrungshorizont, jenseits der genetisch (instinktiv) bedingten Adaptation, sehr eng gezogen und auf das Individuum beschränkt ist: Nur das, was unmittelbar diesem Subjekt begegnet, kann sich als Erfahrung niederschlagen, während der zeitliche Horizont nur bis zur Schwelle des Beginns der personalen Gedächtnisleistungen reicht, also gerade ein paar Jahre oder Jahrzehnte zurückgeht. Dies gilt im Allgemeinen. Wir sehen hier von den gestischen, phonischen etc. Mitteilungen der anderen Mitglieder der eigenen Gruppe ab, die aber vergleichsweise und mit Bezug auf den Erfahrungshorizont keine allzu große Rolle spielen. Erst mit der Sprache kann sich dieser Horizont erweitern, sowohl räumlich als auch zeitlich, und er erweitert sich tatsächlich enorm.

Was die semiotischen Mittel betrifft, mithilfe deren sich Informationen in dauerhafter Form objektiv niederschlagen, so muss man sagen, dass sie bis zur Erfindung des Buchdrucks mit Blick auf die Repräsentation der Welt im Bewusstsein der unteren Schichten (also der übergroßen Mehrheit einer jeden Gesellschaft) eine bescheidene, wenn nicht sogar eine völlig zu vernachlässigende Rolle zu spielen pflegten; die Schrift war eben nur für die Elite akzessibel. Das ändert sich nach und nach mit der Verallgemeinerung der Bildung (des Alphabetentums) durch die Etablierung der Schule als gesellschaftliches Institut. Spätestens dann kann die Lektüre für die breite Masse ein Faktor ihres Lebens werden, zumindest prinzipiell.

10.

Was aber impliziert die Schriftlichkeit nun eigentlich? Nun, sie bedeutet zuallererst, dass der ganze epistemische Raum, die gesamte Erfahrung der Menschheit, soweit sie schriftlich fixiert worden ist, im Prinzip (und im Laufe der historischen Zeit immer mehr) dem lesenden Subjekt zugänglich wird (die Verfügbarkeit von Büchern und von Übersetzungen sowie die institutionellen Bedingungen, Schulen, Buchläden, Büchereien, Bibliotheken, Sprachkurse usw., immer vorausgesetzt). Es ist so, als ob dieses Subjekt mit jedem anderen Subjekt, das sich in Raum und Zeit, wann und wo auch immer, schriftlich äußern konnte (und dessen Äußerung auch überliefert wurde), in Kontakt treten würde. Die Stimmen multiplizieren sich, und damit auch, potentiell, die Blickpunkte, von denen aus eine Sache geprüft werden kann. Man tritt in einen Dialog mit all denen, die etwas zu sagen wussten, auch wenn dieser Dialog schließlich ein Dialog mit sich selbst ist, wobei die Gegenrede, die Antithese zur These, insofern der Urheber der These physisch nicht anwesend ist, sich nur an das Subjekt selbst richten kann, wodurch ein Prozess der Reflexion ganz automatisch in Gang gesetzt wird.

Die Erfahrung oder Kenntnis, die Episteme, löst sich darüber hinaus durch die Schrift endgültig von der Augenzeugenschaft des Subjekts (direkt oder durch andere mündlich vermittelt), sie wird von dem engen, bornierten Kontext, in dem sich die Personen bewegen, befreit, d.h. sie wird supra- und transpersonal (jetzt erst so recht) und als solche mehr als vervielfacht.

Weiters ist das Geschriebene (als Potenzierung des Verbalen) immer abstrakt (d.h. mit anderen Worten, dass das Belanglose bereits herausgefiltert wurde), wie „konkret“ etwa die Beschreibung von Personen, Gegenständen, Orten oder Situationen auch immer ausfallen mag – es sei denn, es handelt sich schlicht und einfach nur um ein banales Dokument ohne exemplarischen Spin.

Desgleichen kann man sagen: Das Sprachliche und, a fortiori, das Geschriebene sind Konsequenz von epistemischen Prozessen, der Analyse und Synthese. Dies impliziert, dass, im Gegensatz zum Augenschein, der nur das nackte sensuell wahrgenommene Faktum hier und jetzt kennt (wir sehen hier von dem in diesem Zusammenhang bedeutungslosen Umstand ab, dass natürlich auch schon die direkte Wahrnehmung „filtert“), schon vor der Reflexion über das in dieser Form Rezipierte, ohne dass man also selbst die Generalisierung, Analyse und Synthese, vornehmen müsste, Informationen epistemischer Natur, also Einsichten und nicht nur eine Impression, zur Verfügung stehen: Man wird durch die Lektüre mit „Theorien“ über die Welt konfrontiert, selbst wenn diese nicht als solche formuliert worden sind. Der Augenschein macht uns mit den Dingen bekannt, wie Hegel sich ausdrücken würde, sie sind dadurch aber bei weitem noch nicht erkannt. Dazu ist Reflexion nötig, die man aber, auf sich allein gestellt, in den allermeisten Dingen gar nicht leisten kann.

Die Erkenntnis setzt stets intellektuellen Aufwand voraus (Gedankenarbeit, Experiment usw.), die dann uns erspart wird, wenn uns diese Erkenntnis in schriftlicher Form bereits ausgearbeitet vorliegt. Diese Ersparnis an Zeit kann dann in Nachdenken (über die Information, die man aus der Lektüre gewinnt) umgesetzt werden. Und so kann man das Wissen weiter vertiefen – aufbauend auf dem, was uns schriftlich mitgeteilt wird –, ohne mit dem jeweils Elementareren beginnen und sich dabei aufhalten zu müssen. Es ist nicht nötig, dieses Elementare jedes Mal selbst von neuem zu finden. Das Rad ist schon da. Das hier Gesagte gilt zwar auch für jede verbale Information, die aber der Natur der Sache nach in der Breite beschränkt ist: So viele Spezialisten kann man persönlich nicht kennen, wie es Bücher gibt.

Schließlich: Im Gegensatz zum Augenschein (und dem persönlich Mitgeteilten) setzt der Text Distanz zwischen sich und dem Rezipienten, einfach dadurch, dass er räumlich oder zeitlich tatsächlich von diesem entfernt ist. Hier eröffnet sich daher ein Raum für Reflexion, jenseits der emotionalen Dimension, da es Betroffenheit (in welcher Form auch immer) nur indirekt, wenn überhaupt, gibt – die Sprache (losgelöst vom Sprecher, der immer durch Gesten, die Miene oder auch, im Extremfall, durch Tränen das Gesagte emotional einfärben kann), also der geschriebene Text ist ein Filter, der das allzu Emotionale, das, wie man weiß, das Denken meistens behindert, nicht durchlässt oder doch nur abgeschwächt. Wo dieser Filter nicht funktioniert, wo die Sprache sich als Vehikel von Emotionen erweist, da hat man es mit Poesie zu tun, die aber expressis verbis nicht zuallererst als epistemisch gelten will.

Die Lektüre wie auch das Schreiben, da sie Tätigkeiten sind, die keinem Zeitdruck unterliegen und deren Dauer im Prinzip beliebig ausgedehnt werden kann, erlauben Pausen, ein Innehalten, während dem man nachdenken kann. Das ist in einer Gesprächssituation eher nicht möglich.

Zudem ist, was das Schreiben betrifft, die Gefahr doch sehr gering, dass das Gedachte gleich wieder aus dem Bewusstsein verschwindet – dass man vergisst, was man vor kurzem gedacht hat –, eben weil es schon schriftlich fixiert ist. Die Ausarbeitung eines Gedankens wie auch das Überdenken desselben sind, wie es scheint, nur aufgrund der Schrift wirklich in aller Tiefe möglich. Man könnte auch sagen: Die Wissenschaft als solche ist ohne Schriftlichkeit schlechterdings gar nicht zu denken.

11.

Wir haben gesehen: Über die Jahrtausende hinweg verfügte die Menschheit über semiotische Mittel – die gesprochene Sprache, Bilder und Skulpturen, die manuelle und die gedruckte Schrift –, die den epistemischen Raum über die sensuelle Wahrnehmung hinaus (also die optische, auditive, haptische und olfaktorische) schrittweise ausgedehnt haben.

Dabei blieb es aber nicht. Im Rahmen des kapitalistischen Systems, das die wissenschaftliche Forschung, als eine Komponente des Produktivkraftkomplexes und schließlich als die dominante produktive Kraft, enorm vorantreiben sollte, entstanden neue Systeme der Kommunikation auf chemischer und elektromagnetischer Basis, zuerst die Photographie, dann der Film, die Schallplatte, Radio und Television, schließlich diverse Datenträger auditiven und visuellen Charakters (CD, Video und DVD) und zum krönenden Abschluss auch das Internet, wobei man es, mit Ausnahme der Photographie, des Stummfilms, der auditiven Medien und des Radios, mit einer Kombination von auditiver und optischer Dimension der Datenübertragung zu tun hat, also mit einer Annäherung der Repräsentation (signifiant) an das, was den Sinnesorganen (Auge und Ohr) direkt zugänglich ist – an die Wahrnehmungssituation des Alltagslebens oder, wenn man so will, an den Augen- sowie Ohrenschein, auch wenn es sich hier eben nur um eine Annäherung handeln kann, da ein vollständiges Replikat bedeuten würde, den gesamten Kontext der Botschaft zu reproduzieren.

Was nun die bildliche Repräsentation und ihre Genauigkeit betrifft (eine auditive hat es bis vor relativ kurzer Zeit nur in der Form von graphischen Noten gegeben – und dies auch nur für musikalische Stücke –, nicht aber im Medium der Töne selbst), so gibt es zwar Berichte, dass es manchen Malern durchaus gelungen sei, Gegenstände so lebensecht abzubilden, dass man dadurch getäuscht werden konnte – in dem Sinne, dass das Bild für Wirklichkeit gehalten wurde –, allein, man wird wohl davon ausgehen können, dass es dabei eher um ein Lob des Künstlers ging, dessen Meisterschaft dadurch betont werden sollte.

So soll der griechische Maler Apelles zur Zeit Alexanders des Großen ein Pferd so wirklichkeitsgetreu dargestellt haben, dass es von wirklichen Pferden dann angewiehert wurde. Auch wird überliefert, dass Zeuxis, ein Zeitgenosse Platons, Trauben gemalt hat, die dann Vögel aufzupicken versuchten. Dessen Rivale aber, Parrhasios, präsentierte ihm, Zeuxis, so wird erzählt, im Rahmen eines Wettstreits ein Gemälde, das so aussah, als ob es von einem Vorhang verdeckt werden würde. Zeuxis versuchte, diesen wegzuziehen, um das Bild betrachten zu können – der Vorhang war aber gemalt. Desgleichen wird von Giotto berichtet, dass er eine Fliege auf das Bild der Nase eines Heiligen malte, die dann sein Lehrer Cimabue wegzuscheuchen versucht haben soll.

Man darf getrost davon ausgehen, dass es sich hier um Übertreibungen oder Erfindungen handelt. Die Malerei kann zwar sehr genau sein, etwa im Falle von Porträts, an die Photographie, sofern diese farbig ist, reicht sie aber in der Regel mitnichten heran. Ganz zu schweigen vom Film, der bewegte Bilder, movies, liefert und dessen Vorführung daher schon sehr dem Erlebnis eines realen Geschehens nahekommen kann. Diese Illusion ist zwar nicht perfekt, und kann es nicht sein, meist wird man aber dennoch in den Bann gezogen, wenn auch nicht derart wie in den frühesten Tagen des Kinos, als die Zuschauer bei der Projektion des Films „Einfahrender Zug im Bahnhof von La Ciotat“ der Gebrüder Lumière aus dem Jahre 1895 in Panik gerieten. Warum, wird sich nie feststellen lassen, man kann sich aber durchaus den Impact imaginieren, den dieser Streifen auf das Publikum hatte.

Dasselbe mit Bezug auf die „Lebensnähe“ gilt natürlich auch für die Television und für das Internet (und die visuellen Datenträger, Video und DVD und wie sie alle heißen), wobei in diesem Fall die Reichweite natürlich eine viel größere ist, als sie das Kino je erreichen könnte.

Nicht anders ist es, wenn wir die auditiven Medien betrachten: Die Schallplatte (und die anderen auditiven Datenträger) sowie das Radio reproduzieren fast identisch die Welt der Töne und Klänge, der Eindruck dabei ist, dass man hört, was man hören würde, wenn man sich am Schau- oder besser: Hörplatz befände – es sei denn, man ist ein conaisseur. Im Prinzip gibt es keinen Unterschied mehr, was das reine Hörerlebnis betrifft, ob man nun im Konzerthaus, in der Oper respektive in einer Veranstaltungshalle sitzt oder zuhause vor dem Wiedergabegerät, wenn man von der Atmosphäre und einer anderen Akustik einmal absehen will. Das hat damit zu tun, dass im Falle der optischen Aufzeichnung das Bild zweidimensional, also flach ist (sieht man von 3D einmal ab), während bei der Wiedergabe eines auditiven Mitschnitts im Prinzip dieselben Luftschwingungen hervorgebracht werden, wie es sie bei der originalen Aufnahme gab.

Was nun die Reichweite betrifft, so spielen das Radio und die Television in der ersten Liga – eine Reichweite, die nur durch die Verfügbarkeit von Empfangsgeräten begrenzt ist –, die Krone indessen gebührt dem Internet, an das man über jeden Computer und jedes Smartphone angeschlossen ist, das sich aber darüber hinaus von der Sendezeit völlig gelöst hat, d.h. der Zeitpunkt der Transmission und der Zeitpunkt der Konsumtion (Rezeption) können auseinanderfallen, so dass man als Rezipient jederzeit auf die Inhalte zugreifen kann. Das gilt zwar auch für die Datenträger (Schallplatte, CD, DVD usw.) – und zuvor auch schon für das Buch –, aber nicht auf so unmittelbare Weise: Es genügt ein Klick, während man sonst in ein Geschäft gehen oder, wenn man sich die Sachen liefern lässt, ein paar Tage warten muss, sofern das Produkt dann überhaupt auf Lager ist.

Was aber am wichtigsten erscheint, das ist, dass zum ersten Mal mit dem Radiofunk, mit dem Fernsehen und dem Internet ein „Dabeisein“ in Echtzeit möglich wird – dass man Ereignissen beiwohnen kann, die unter Umständen Tausende von Kilometern vom eigenen Standpunkt entfernt (fast) im selben Augenblick erfolgen. Man ist „live dabei“. Bisweilen erfolgt dies ein wenig zeitversetzt, sowohl auf Seiten des Mediums (bei Nachrichtensendungen etwa) als auch auf Seiten des Rezipienten (dies ist beim Internet der Fall). Im Grunde aber bedeutet dies die Wiederauferstehung der Augenzeugenschaft, diesmal potenziert und auf globalem Niveau.

Ganz besonders gilt dies für das Internet und die social media, die an ihm hängen: Was irgendwer gesehen und mit dem Smartphone aufgenommen hat, kann wie ein Lauffeuer durch das Netz gehen, wenn dies geliked und dann gepostet wird. Das Hörensagen hat eine neue auditiv-visuelle Dimension gewonnen: Man erfährt es nicht nur (sprachlich vermittelt), man sieht und hört es auch. Und das können die banalsten Dinge der Welt sein.

12.

Das ist nun der springende Punkt: Nicht nur, dass der autonome Text (das Buch usw.) als das – zumindest für die Elite (aber später auch für die Massen) – wichtigste Semiotikum (Kommunikationsmittel) jenseits der unmittelbaren Rede (des Dialogs und Monologs) gegenüber den elektromagnetischen und elektronischen Medien schrittweise (und in beschleunigtem Tempo) in den Hintergrund tritt, diese haben auch, in ihrer spezifischen Form als Radio, Television und Internet (und dieses letztere dann ganz besonders) – also als Medien, die in der Lage sind, zeitgleich oder zeitnah zu senden –, die Augen- und Ohrenzeugenschaft (in modifizierter Gestalt) als dominante Zugangsform zur Welt aus der Versenkung geholt. Man könnte auch sagen: Die Augen- und Ohrenzeugenschaft wurde von ihren Fesseln befreit, wodurch erst sie erneut dominant werden konnte. Denn nunmehr hängt diese nicht mehr nur vom jeweiligen Standpunkt ab, dem bestimmten Aufenthaltsort, an dem man sich gerade befindet, man ist „Spektator“ oder „Auditor“ praktisch überall auf der Welt – sofern die Medien, die sich dazwischenschalten, dazu überhaupt die Möglichkeit geben, d.h. über die Dinge, die sonst wo geschehen, auch wirklich berichten. Findet irgendwo ein Terroranschlag statt, so ist man dabei – man sieht, wie die Zwillingstürme in sich zusammenstürzen, und hört den Krach, der bei diesem Zusammensturz entsteht.

Ja noch mehr: Selbst völlig Fiktives kann zur subjektiven Wahrheit werden, wenn es seh- und hörbar gemacht wird. Bisweilen genügt schon der Ton, um dem Publikum Fingiertes glauben zu machen. Selbst wenn, wie es scheint, die Berichte über Orson Welles Rundfunk-Inszenierung von 1938 und ihre Konsequenzen weit übertrieben waren, so bleibt doch das Faktum, dass das Hörspiel „Krieg der Welten“ für einen Moment bei nicht wenigen zu einer Panik geführt hat.

Was aber heißt das im Prinzip? Was bedeutet das Revival der Augen- und Ohrenzeugenschaft? Es bedeutet nichts Geringeres als die Verstümmelung des Denkens und die Lahmlegung, die Inhibierung der Vernunft in genau demBereich, wo der Alltagsverstand, der auf den sinnlichen Eindrücken aufbaut und sich damit begnügt, versagt und versagen muss – also jenseits dessen, wo es nur um Banalitäten zu tun ist (die für das Subjekt natürlich nicht so banal sind wie für die Gesellschaft als Ganzes). Es bedeutet mithin eine Regression auf frühere Stufen der Kognition der uns umgebenden Welt, eine Regression, die insofern, relativ gesprochen, eine Verwilderung des Denkens mit einschließt, als das, was über den Radius des Alltagslebens hinausgeht (und das zwangsläufig, durch die Medien selbst, in den Kreis des Wahrnehmbaren, der Rezeption eingeht) – nämlich gesellschaftliche Belange –, eine vertiefte Reflexion notwendig macht, eine Reflexion, ein Denken, das nicht primär sensuell, sondern logisch sein sollte: „logisch“ im Sinne von logos, dem Wort, der Überlegung, der kritischen Vernunft.

13.

Denn was man sieht (oder hört), das ist für uns „wahr“. Was man selbst gesehen (oder gehört) hat, das ist nicht anzuzweifeln, es ist so persuasiv, dass man gar nicht daran zweifeln kann. Noch mehr als für den Gehör- gilt dies für den Gesichtssinn. Das ist das Thomas-Prinzip: Man glaubt es dann, wenn man‘s gesehen hat. Das, was andere mündlich berichten, kann man in Zweifel ziehen – auch wenn das Augenzeugenprinzip hier sekundär wirkt: der oder die andere hat es gesehen und man glaubt ihm oder ihr, wenn er oder sie über einen Autoritätsstatus verfügt –, der eigene Blick dagegen trügt nie – wie man zu glauben geneigt ist. Das hat seine Gründe darin, dass man, schon in den frühesten animalischen Zeiten, in einer bestimmten Situation (sei dies nun eine Gelegenheit oder eine Gefahr) gar keine Zeit zur Verfügung hatte, das, was man sah, eingehend darauf zu prüfen, ob es wirklich so ist. Man musste sich auf den visuellen Sinn einfach verlassen, so dass sich, phylogenetisch gesprochen, die Gleichung durchgesetzt hat: Sehen = Wissen. (Das wird im klassischen Griechisch auch etymologisch deutlich: oida = „ich weiß“ ist ein Perfekt mit dem Stamm veid/vid, der mit Lateinisch video verwandt ist und „sehen“ bedeutet. Also: „Ich habe gesehen.“ = „Ich weiß.“)

Oder anders gesagt: Man kann getrost auf den Sehsinn vertrauen, ohne großartig räsonieren zu müssen. Und in der Tat: Die optische Täuschung spielt im Alltagsleben (also in einem rein praktischen Kontext) kaum eine Rolle, sofern man sich nicht gerade in einer Wüste befindet, wo man von Fata Morganas genarrt wird. Dasselbe gilt, mutatis mutandis, natürlich auch für den Hörsinn, wenn auch in geringerem Ausmaß.

14.

Was aber sind die Konsequenzen des Umstands, dass das, was man sieht, als „wahr“ begriffen wird, und zwar im Kontext dessen, dass der Gesichtssinn (die Augenzeugenschaft) gewissermaßen eine Renaissance erlebt? Ganz allgemein kann man sagen:

1. Die Reduktion des Wissens auf das, was man sieht – vidi, ergo scio –, oder genauer: die Expansion der visuellen Dimension auf den Bereich des Intelligiblen verengt den Spielraum dessen, was gewusst werden könnte. Die Folge davon ist Borniertheit, die Beschränkung des „Blickfelds“ mithin.

2. Insofern die visuelle Wahrnehmungsform einer Affirmation – oder wenn man so will: einer „These“ –, Überzeugungskraft verleiht, eben weil wir es sehen, diese Affirmation demnach a posteriori in eine „Wahrheit“ verwandelt, wird hier unbewusst eine Auswahl vorgenommen, welche Meinungen, die sich in visueller Form präsentieren, privilegiert. Alles andere, das nicht visuell „untermauert“ oder „abgestützt“ ist, fällt durch das Sieb der Aufmerksamkeit und der Beachtung.

3. Die visuelle Wahrnehmungsform verleiht darüber hinaus beliebigen Affirmationen Überzeugungskraft. Das bedeutet, dass auch falsche Thesen mit dieser Überzeugungskraft auftreten können, so dass das Gegenteil dessen, sofern es über keine visuelle Repräsentationsform verfügt, automatisch ins Hintertreffen gelangt.

4. Weil man es gesehen hat, kann man sich das Nachdenken darüber ersparen. Man kann sich im Speziellen ersparen, die näheren Umstände genau zu betrachten. Dabei fällt der Kontext ins Wasser, das größere Ganze, die Relationen, die Komplexität. Das ist für das Alltagshandeln meist gar nicht so wichtig, wichtig wird es indes, wenn es darüber hinausgeht: wenn es um die Episteme zu tun ist, um Einsichten, die die Gesellschaft als Ganzes betreffen. Die Macht des Gesehenen blockiert die Reflexion.

Die „Evidenz“ also, das, was „evident“ erscheint, weil man es sieht, schließt gleichsam das tiefere Nachdenken als unnötig aus. Wozu auch, wenn es doch „evident“ ist? Wenn alles gesehen werden kann, dann weiß man auch alles, ohne sich darüber Gedanken machen zu müssen, die über das passive Registrieren hinausgehen. Man „weiß“ es unmittelbar. Und das erübrigt das Denken. Das Wissen um die Welt da draußen wird so auf die Stufe der persönlichen Wahrnehmung der unmittelbaren Umgebung gedrückt – mit ein wenig Übertreibung könnte man sagen: auf das animalische Niveau. Denn die Tiere, sieht man von den Bienen ab, „wissen“ es nur, wenn sie es selbst unmittelbar sehen, hören, fühlen, riechen oder auch schmecken. Diese Welt, die Gesellschaft, alles das, was über den persönlichen Horizont weit hinausgeht, wird also jetzt auf dieselbe Weise wahrgenommen, wie man die Dinge im eng begrenzten Bereich des Alltagslebens wahrnimmt.

Kurz: Indem der Wissenserwerb auf den Augenschein, auf den direkten Blick, reduziert wird, wird das lästige Reflektieren umgangen – und damit eine vertiefte Einsicht in die Zusammenhänge der Welt. Man ist nicht mehr „anfällig“ für das Überdenken all dessen, was „auf den ersten Blick“ ja ohnedies einsichtig ist.

5. Was man gelesen hat oder was von anderen verbal mitgeteilt wurde, kann sein, oder auch nicht, man muss überprüfen, ob es wirklich so ist, wenn man „kritisch“ sein will; das fällt beim Augenschein weitgehend weg (selbst beim sekundären). Es wird nichts kritisch hinterfragt, es wird nichts angezweifelt, weil man es, wenn man es gesehen hat, als evident wahrnimmt (wobei der lateinische Ausdruck evidens eben nichts anderes als „augenscheinlich“ oder „ersichtlich“ bedeutet).

Insbesondere verflüchtigt sich das kritische Hinterfragen, das Evaluieren, die Prüfung, ob das, was man sieht, auch wirklich so interpretiert werden kann, automatisch. Denn man hat es gesehen. Das betrifft speziell die, um es einmal so zu nennen, „visuellen Konklusionen“, die man aus dem, was man sieht, in der Regel ganz ohne Überlegung abzuleiten geneigt ist. Sieht man Särge gestapelt, so schließt man unwillkürlich auf eine gröbere Seuche. Die kritische Infragestellung jedoch von solchen Konklusionen, die nicht zwingend sind und den „visuellen“ zur Grundlage dienen („Wenn A, dann B; es gilt B, also A.“), wird durch die „Evidenz“ der Bilder verhindert. Diese „Evidenz“ wird stillschweigend von der Conclusio auf die Prämisse übertragen. „Wenn eine Seuche grassiert, dann gibt es gestapelte Särge; es gibt gestapelte Särge, also grassiert eine Seuche.“ Man sieht die Särge und zweifelt somit nicht daran, dass eine Seuche grassiert.

6. Das, was man sieht, ist so eindringlich und so persuasiv, dass das einmalige visuelle Erlebnis für die Regelbildung (unter normalen Umständen) durchaus genügt, zumindest wenn es um Zusammenhänge und nicht um Induktionen zu tun ist. Es genügt, einmal zu sehen, wie ein Blitz zu einem Waldbrand geführt hat, um zu wissen, dass Brände auch von Blitzen ausgelöst werden. Man muss nicht warten, bis noch ein Blitz einschlägt oder Tausende, wie das notwendig wäre, wenn man die Behauptung aufstellen wollte, dass alle Schwäne „in aller Regel“ weiß sind. Das heißt aber auch: Der Ausnahmefall kann unter Umständen zur Bildung einer Regel führen. Das, was eine Ausnahme darstellt, kann, wenn diese Ausnahme visuell rezipiert wird, generalisiert, verallgemeinert werden, eben weil der isolierte Fall aufgrund seiner sensuellen „Wahrheit“ nicht hinterfragt werden kann – und wenn der eine Fall so gelagert ist (man hat es ja gesehen), warum dann nicht auch die anderen möglichen Fälle?

7. Weil man es sah – und es deswegen auch weiß –, deshalb ist alles, was dem Augenschein widerspricht, diabolisch: im Speziellen das theoretische Denken, das nicht mit dem, was man sieht, konform gehen will, weil es unter die Oberfläche des Sichtbaren dringt und den Schein hinter sich lässt, der oft das glatte Gegenteil des tatsächlichen Zusammenhangs ist. Denken wir nur an die scheinbare „Drehung der Sonne“ um den Planeten. Man wehrt es ab, man verunglimpft es, man macht sich darüber auch lustig oder glaubt, sich darüber lustig machen zu dürfen. Früher drohte das Autodafé. Das, was man sieht, ist so „evident“, dass Argumente, die dem Augenschein widersprechen, keinerlei Chance mehr haben, in Betracht gezogen zu werden.

8. Im Gegensatz zur Schriftlichkeit oder, allgemeiner, zum Verbalenreduziert die Ikonizität die Schwelle, ab der eine Sache als wahrscheinlich (glaubwürdig) eingestuft wird. Wenn etwas verbal oder schriftlich vorliegt, so ist es leicht, das Unwahrscheinliche (das meist auch faktisch unmöglich ist) als solches auszumachen. Liest man von einem abstrusen Ereignis, so fällt es in der Regel nicht schwer, dieses anzuzweifeln. Sieht man es, so zweifelt man nicht mehr daran. Man hat‘s ja gesehen. Würde man sehen, dass ein Kalb drei Köpfe hat, so würde man es glauben; der schriftliche Bericht davon überzeugt dagegen nicht. Man würde Beweise fordern. – Es sei denn, man glaubt es, weil man an sich schon leichtgläubig ist.

Sobald es also sichtbar ist, kann alles dieselbe Glaubwürdigkeit für sich in Anspruch nehmen, die das Wahrscheinliche besitzt. Die Schwelle oder die Hemmung, eine Sache als wahrscheinlich wahrzunehmen, sinkt in dem Augenblick, wo diese visuell wahrnehmbar ist.

9. Der Augenschein forciert die Oberflächlichkeit: Man sieht, sieht aber nicht hinter die Kulissen. Man sieht nur den Schein. Das „Bild“ kann immer nur Hinweise auf tiefer liegende Zusammenhänge und Strukturen geben; diese sind im Prinzip nur durch das dialektische (begriffliche) Denken begreif- und erfassbar.

10. Bilder sind mit Emotionalitäten behaftet, wie man bei denen aus Bergamo sah – eben weil sie eine „spürbare Wahrheit“ repräsentieren. Vergleichen wir nur den Bericht über ein Länderspiel im Sportteil einer Zeitung mit dessen Liveübertragung im Fernsehen, dann wir der Unterschied klar. Niemand springt auf, wenn er oder sie von einem Tor der eigenen Mannschaft im Spielbericht liest, wohingegen das vor dem Bildschirm regelmäßig geschieht. Die Emotion, die sich aus den Bildern speist, inhibiert indessen das Denken, und zwar insbesondere dann, wenn es um Angst und Panik zu tun ist. Da setzt es aus.

15.

Das soeben Gesagte gilt ganz allgemein. Es wird potenziert durch die Eigenart, das Format der spezifischen audiovisuellen Vermittlungsform der Welt, die man als „moderne Medien“ apostrophiert hat: Rundfunk, Fernsehen und Internet.

Kurz gesagt, handelt es sich um Medien, die

1. massenmedial sind, d.h. durch die Informationen breit gestreut werden können (wie der englische Ausdruck broadcast schon sagt),

2. überindividuellen Charakter besitzen, also gleichsam „Institutionen“ sind,

3. „von oben“ (im wahrsten Sinne des Wortes) senden, also keine Interaktion stattfinden kann, und wo

4. Senden und Empfangen zeitlich zusammenfallen (oder zumindest dies nicht ausgeschlossen ist), wodurch ein unmittelbares Verhältnis zwischen dem Rezipienten und dem Repräsentierten hergestellt wird. (Aber selbst da, wo das Gesendete später konsumiert wird, ist es doch so, dass man sehr oft, durch das Medium selbst, das Visuelle, den Eindruck gewinnt, in diesem Augenblick am Geschehen zu partizipieren.)

Erwähnen wir hier nur einige Punkte:

1. Man hört es aus der Lautsprecherbox und sieht es auf dem Bildschirm – nicht alleine jedoch. Es sind Tausende und mehr, die es gleichzeitig hören und sehen. Man ist Element einer Masse, die Information konsumiert. Das aber heißt, dass, was ich sehe, auch andere im selben Augenblick sehen, und was ich höre, auch andere im selben Augenblick hören, so dass das, was ich sehe und höre, d.h. meine Wahrnehmung, meine Rezeption, schon alleine dadurch bestätigt wird, dass nicht nur ich es höre und sehe. Sehen und hören es viele, so scheint es ausgeschlossen zu sein, dass ich mich in diesem konkreten Fall täusche. Ja, der Umstand, dass es andere auch rezipieren, macht das Gesehene und das Gehörte zu einer Wahrheit, denn es kann offenbar von vielen verifiziert und bestätigt werden. Und wenn ich nicht der einzige bin, der es gesehen oder gehört hat, dann wird es wohl stimmen.

2. In den Medien audiovisueller Provenienz fallen die Augenzeugenschaft des Rezipienten mit der Autorität und dem Standing zusammen, über die diese Medien dadurch verfügen, dass sie als Institution im weitesten Sinne agieren, als superiore Instanz – in einer Position mithin, die einst die Kirche innehatte. Althusser hatte seinerzeit in diesem Zusammenhang von „ideologischen Staatsapparaten“ gesprochen. Und in der Tat, man bekommt zu sehen und hören, was nicht irgendwer, sondern ein Kollektivum in die Welt gesetzt hat – eine „Körperschaft“, die schon alleine als solche Autorität beanspruchen kann. Diese Kombination ist durch nichts in seiner Beweiskraft zu schlagen: Man hört es und sieht es, und es wird zugleich durch die Autorität einer höheren Instanz „von oben“ beglaubigt.

3. Audiovisuelle Produktionen, durch Medien vermittelt, werden passiv aufgenommen. Es fällt hier völlig die Dimension der Praxis weg, die im Alltag, im Falle der realen Augenzeugenschaft, immer gegeben ist. Genau diese Auseinandersetzung aber ist es, die das Denken im Kontext des Alltagslebens aktiviert. Das Bild als Artefakt bietet dazu keinen Anlass.

4. Der Denkmodus, der vor allem von dieser Inflation an „Bildern“ profitiert, das ist die Generalisierung visueller Provenienz, der durch den ikonischen Komplex Tür und Tor geöffnet wurden. Denn bisher war diese auf den privaten Kontext beschränkt; nunmehr jedoch weitet sich deren Horizont ungeahnt aus – im Prinzip auf alles, das jenseits des persönlichen Alltags angesiedelt ist und sich dort massenhaft findet. Dies gilt in Hinsicht auf den Radius oder den Bereich der Informationsaufnahme, aber auch, was die Themen betrifft.

Was aber ist unter „visueller Generalisierung“ im Prinzip zu verstehen? Wenn man eine Sache sieht, dann geht man üblicherweise auch davon aus, dass dies nicht nur hic et nunc, sondern allgemein gilt. Sieht man einen Apfel auf die Wiese fallen, so ist es so abwegig nicht anzunehmen, dass Äpfel vom Baum auch woanders fallen, früher schon und auch später gefallen sind und auch fallen werden. Das folgt aus der notwendigen Annahme, dass, was mir hier heute passiert, mir (unter den nämlichen Umständen) morgen auch anderswo passieren kann. Denn nur so werde ich mich im Leben zurechtfinden können. Gehe ich von einer chaotischen Umwelt aus, ist das schlechterdings nicht möglich. Selbst wenn das Ereignis einmalig ist, wird man deshalb dahin tendieren, es zu verallgemeinern. Man hat es ja gesehen, es ist evident.

Mit der Inflation allerdings an „Bildern“ ist nunmehr eine Unmenge von visuellem Material in diesem Sinn generalisierbar geworden. Und hier ist nun zu bedenken: Was man im Alltag erlebt, das kann man generalisieren, ohne dass dies ein besonderes Problem aufwerfen würde. Erweist sich die Generalisierung als falsch, so wird sie unmittelbar durch die Praxis berichtigt. Die Generalisierung ist (wie in einem Experiment) kontrolliert. Doch dass, dies sei nebenbei bemerkt, solche Generalisierungen überhaupt falsch sind, kommt eher selten vor, handelt es sich, wenn es um den Alltag zu tun ist, ohnedies meist um Standardwissen. Das gilt indessen nicht, wenn sich der Augenschein multipliziert (sich von Ort und Zeit löst) und daher „Bilder“ von außen, jenseits der Alltagssphäre, ins Bewusstsein drängen. Denn dann fallen diese aus der Kontrollzone raus. Irrt man sich – d.h. wenn eine Generalisierung nicht angebracht ist –, dann bleibt dieser Irrtum bestehen und im Bewusstsein haften. Zudem handelt es sich bei diesem „Bildern“ sehr oft auch um Themenbereiche, die in Relation zur Gesellschaft stehen – zu Problemen, die ein ganz anderes Gewicht besitzen als die Dinge des persönlichen Lebens. Und da ist ein „Irrtum“ fatal, wenn er massenhaft auftritt.

5. Das Auditiv-Visuelle ist kontinuierlich, gleitend und stetig, eine Unterbrechung der Rezeption ist an keinem Punkt indiziert, nicht so wie beim Text oder auch Dialog, der sprachlichen Kommunikation mithin, wo am Ende eines Satzes (oder eines Redeteils) man innehalten oder einhaken kann, und dies gilt umso mehr, wenn es sich um an den Moment gebundene Emissionen, wie beim Radio oder beim Fernsehen, handelt, die nur „live“ konsumiert werden können, eben weil es hier, aufgrund der technischen Eigenart des Mediums, keinen Hiatus im Strom der Informationsübertragung, in der Transmission, geben kann. Aber es gilt auch, in abgeschwächter Form, für Audios, Videos oder das Internet (sofern es nicht ohnedies televisiv operiert), wo sehr viele Clips meist keine Einschnitte kennen, und wo es doch zu einem Schnitt kommt, so ist der Übergang (wenn die Sache gut gemacht ist) so smooth, dass es kaum auffällt, dass es ihn gibt. Man kann zwar die Rezeption unterbrechen, hat aber keinen Anhaltspunkt dafür, dies zu tun. Das heißt aber auch, dass die parallele, begleitende Reflexion über das Gesehene oder Gehörte ausbleiben muss. Man saugt es auf, ohne es kritisch zu akkompagnieren. Und am Schluss hat man das, was man hörte und sah, eigentlich schon wieder vergessen oder es bleibt davon nur ein blasser Eindruck zurück.

6. Das, was diese Medien zugänglich machen, wird nicht als vermittelt, sondern als real erlebt wahrgenommen, auch wenn man weiß, dass es sich um das Produkt eines Mediums handelt. Man erlebt es als Teil seines Alltags. Das, was man sieht oder hört, vermittelt den Eindruck, dabei gewesen zu sein. Das Verhältnis zur Welt jenseits des Alltags erscheint so als ein unmittelbares, obwohl es in Wirklichkeit medial herbeigeführt wird. Hier geht jede Distanz durchweg verloren, eine Distanz, die für das Denken, die Reflexion von Zusammenhängen gesellschaftlicher Dimension notwendig ist. Wer mitten drinsteckt, hat den Überblick nicht, den man hat, wenn man die Dinge „aus der Ferne“ betrachtet – aus der Perspektive des Adlers und nicht aus der Perspektive der Feldmaus, auch wenn diese Feldmaus, im Fall des Medienkonsums, sich ständig an unterschiedliche Orte versetzt sieht. Oder anders gesagt: Den Überblick erhält man nur, wenn man Abstand gewinnt. Und man gewinnt diesen Abstand dadurch, dass man nicht dabei ist.

16.

Das alles ist an sich schon bedenklich genug, es wird aber noch um einiges heikler, wenn man in Rechnung stellt, dass hinter der Kamera und/ oder dem Mikrophon Akteure agieren, die, im Gegensatz zur Situation der direkten Augen- und Ohrenzeugenschaft, das Visuelle und das Auditive „bearbeiten“ können – also das Repräsentierende (das Zeichen) dem Repräsentierten (dem Faktum) entfremden. Genau das aber kann aus offensichtlichen Gründen dann nicht geschehen, wenn wir die Dinge in unserer Umgebung, ohne mediale Vermittlung, betrachten: Nur wir allein können uns in diesem Fall täuschen. Das macht den Unterschied aus.

Der Punkt also ist: Man sieht und hört, aber man sieht und hört eben nur das, was man zu sehen und hören bekommt. Und das schließt immer ein, dass man getäuscht werden kann. Nicht nur das Sprechen, „welches die göttliche Natur hat, die Meinung unmittelbar zu verkehren“ (G.W.F. Hegel, Phänomenologie des Geistes, Ullstein (1980), S. 72f.), auch die visuell-auditive Kommunikation kann in die Irre führen, wobei dies den Operateuren, den medialen Gestaltern, gar nicht wirklich bewusst werden muss, denn sie können in gutem Glauben, entsprechend ihrem „Bild von der Welt“, das Material so aufbereiten, dass auf der anderen Seite des Kommunikationskanals ein verzerrtes Bild ankommt. Diese Manipulation, wenn wir das so nennen wollen (und die Intention dazu in Klammern setzen), wiegt umso schwerer, als das Visuell-Auditive eben die außerordentliche Überzeugungskraft besitzt, von der wir oben sprachen.

17.

Es ist klar, dass das, was man vermittelt über elektromagnetische oder elektronische Medien sieht oder hört, ganz von denen abhängt, die die Kontrolle über die Sendegeräte besitzen, seien diese nun das Mikrophon oder die Kamera. Der „Blick“ des Rezipienten ist nicht mehr autonom, sondern gesteuert. Das ist es dann, was die mediale Augen- und Ohrenzeugenschaft von der normalen unterscheidet. Wir haben dieses Problem der Steuerung freilich auch etwa bei einem beliebigen geschriebenen Text, allein, Texte sind nicht auditiv-visuell, also sind sie auch nicht in der Lage, so etwas wie Augen- und Ohrenzeugenschaft dem Publikum vorzugaukeln. Und das ist der springende Punkt.

Der große sowjetische Filmregisseur und -theoretiker Wsewolod Pudowkin hat es, mit Bezug auf den Film (aber es gilt ebenso gut für jedes andere audiovisuelle Medium) so ausgedrückt, ganz prägnant: „Die Kamera zwingt den Zuschauer, so zu sehen, wie es der Regisseur will.“ (W. Pudowkin, Filmregisseur und Filmmaterial, in: ders., Die Zeit in Großaufnahme, Henschelverlag (1983), S. 281) Und an anderer Stelle sagt er definitiv: „Die Aufmerksamkeit des Zuschauers ist völlig in ihre (der Kamera, N.E.) Obhut gegeben. Das Objektiv der Kamera – das ist das Auge des Zuschauers. Der Zuschauer sieht und erlebt nur das, was der Regisseur zeigen will, oder präziser ausgedrückt, das, was der Regisseur in der jeweiligen Erscheinung entdeckt.“ (ebd., S. 235)

Pudowkin plädiert hier natürlich nicht für die Manipulation, ganz im Gegenteil, er sieht den Film (und insbesondere die Montage) als eine „Methode, zur Enthüllung und erklärenden Darstellung aller in der realen Wirklichkeit vorkommenden Zusammenhänge, beginnend mit den an der Oberfläche sichtbaren bis zu den tiefsten und verborgensten.“ (W. Pudowkin, Über die Montage, in: ders., Die Zeit in Großaufnahme, Henschelverlag (1983), S. 336) Er setzt so ein Gleichheitszeichen „zwischen Montage und Denkprozess“ (ebd., S. 337), wobei er unter letzterem im Wesentlichen das dialektische Denken versteht. Dieser Denkprozess dialektischer Natur nun besteht für Pudowkin gerade darin, die jeweilige Erscheinung 1. in ihrem Werden und 2. in ihrem umfassenden Zusammenhang zu erfassen (vgl. ebd., S. 338), genau das eben, was die Montage nach Pudowkin auch wirklich zu leisten vermag. Sergej Eisenstein, Zeitgenosse und zeitweiliger Gegenspieler Pudowkins, ging hier noch etwas weiter, als er in einer seiner Schaffensphasen (zur Zeit der Dreharbeiten zu den Filmen „Oktober“ und „Das Alte und das Neue“) den „intellektuellen Film“ proklamierte, der in der Lage sein sollte, begriffliches Denken visuell abzubilden. Eisenstein ging sogar daran, „Das Kapital“ von Marx zu verfilmen, ein Projekt, das natürlich nicht realisiert worden ist (es blieb in den Kinderschuhen stecken) und wahrscheinlich auch gar nicht realisiert werden könnte.

18.

Wenn nun, und das ist nicht anzuzweifeln, der Film oder allgemeiner gesprochen: der audiovisuelle Komplex durchaus zur Aufdeckung innerer Zusammenhänge der Wirklichkeit eingesetzt werden kann, so kann er aber auch, und das ist banal, ein wirksames Mittel der Manipulation des Bewusstseins des Empfängers von audiovisuell gestalteten Nachrichten sein. Das folgt zwanglos daraus, dass, wie Pudowkin richtig gesagt hat, die Kamera den Zuschauer zwingt, so zu sehen, wie es der Operateur hinter dieser Kamera will. Und allein darauf kommt es an. Denn will er, dass der Rezipient sieht oder hört, was nicht so in der Realität existiert, wie es auf dem Bildschirm erscheint, so wird ein auditiv-visuelles „Bild“ fabriziert, das eben den, der es sieht, manipuliert: in die Irre führt oder blendet. Das muss, wie gesagt, gar nicht bewusst und mit Absicht geschehen, es genügt, dass dieser Operateur mit einem Vor-Urteil oder bornierten Blick an die Sache herangeht. Dessen Borniertheit wird also nur transferiert oder, so könnte man sagen, an den Adressaten weitergereicht.

Es sei hier nochmals gesagt, dass Manipulation in diesem Sinne natürlich kein Privileg der audiovisuellen Medien ist. Allein, der Umstand, dass es sich um „Bilder“ handelt, die mit der Qualität, Augen- und Ohrenzeugenschaft suggerieren zu können, ausgestattet sind, macht diese Manipulation effektiver als alles, was es bis dahin gab. Das, was man liest oder von anderen berichtet bekommt, kann man glauben – und man glaubt es auch dann sehr gern, wenn es ins eigene „Bild der Welt“ passt, wie schon Cäsar wusste –, man kann es aber auch durchaus bezweifeln, denn man hat es ja nicht selber gesehen (oder gehört). Was man selbst gesehen (oder gehört) hat indessen – wer würde daran zweifeln wollen? Dieser Zweifel würde unfehlbar das mentale Gleichgewicht des Subjekts ins Wanken bringen, ja man wäre, würde man das, was man sieht, ständig bezweifeln, gar nicht mehr fähig, sich in der Alltagswelt so zurechtzufinden, dass man unbeschadet über die Runden kommt.

19.

Wie aber funktioniert die Aufbereitung des visuell-auditiven Materials im Sinne der Deformierung des „Abbilds“ der Realität, wobei die Medien sozusagen den Leukippschen eidola, bevor sie zum Empfänger gelangen, eine „Behandlung“ zuteilwerden lassen?

Da hätten wir zuerst einmal die Auswahl der Objekte: Was wird gezeigt? Was ausgeblendet? Wird ein Objekt ignoriert, so taucht es banalerweise auf dem Bildschirm nicht auf und kann somit auch nicht in das Bewusstsein des Rezipienten gelangen. Das ist, wie gesagt, trivial, spielt aber eine große Rolle. Denn was man nicht zu sehen bekommt (oder allgemeiner gesagt: was nicht als Nachricht in die medialen Kanäle eingespeist wird), das existiert einfach nicht – für den Empfänger. In diesem Sinne stimmt dann auch, was Bischof Berkeley gesagt hat: esse est percipi.

Aber selbst wenn ein Objekt gezeigt und nicht glatt ignoriert wird, so kommt es immer darauf an, was man davon zeigt. Was wird von einem Objekt weggeschnitten, indem man den Bildausschnitt in bestimmter Weise wählt? Welche Details fallen dabei gleichsam unter den Tisch? Sind es gerade die, auf die es in Wirklichkeit ankommt? Man kann nämlich, und das ist nicht minder banal, den Fokus auch auf solche Einzelheiten richten, die nicht wesentlich sind oder die sogar ein verkehrtes Bild von der ganzen Sache vermitteln. Filmt man etwa eine Demonstration, fokussiert die Kamera aber auf Grüppchen, die abseits stehen und weit voneinander entfernt sind, so kann der Eindruck entstehen, dass die Teilnehmerzahl dieser Demonstration ziemlich gering ist. Man kann auch den Fokus auf Transparente richten, die mit Parolen bemalt sind, deren Tendenz der Gesamttendenz dieser Kundgebung entgegengesetzt, die ihr konträr sind; geschieht dies nun, so kann man den Protest in seiner Gesamtheit zwanglos als extremistisch oder sonst irgendwie diffamieren, sofern diese Parolen in der Tat extremistisch oder auf irgendeine andere Weise anrüchig sind. Und so etwas findet sich immer, wo es auch sei.

Der Operateur, indem er eine Auswahl vornimmt, konstruiert eine Bildschirm-Realität, die immer nur partiell ist, eben ein Ausschnitt aus der Realität. Das ist an und für sich nicht außergewöhnlich. Es versteht sich nämlich von selbst, dass eine Auswahl stattfinden muss – diese Auswahl nimmt selbst das natürliche Auge beständig im Prozess der Wahrnehmung vor –, denn man kann nicht alles bringen, dafür fehlt normalerweise der Platz; indessen, man kann das Nebensächliche, Akzidentelle, oder aber auch das Zentrale, den Kern der Sache, aus dem Gesamtkomplex amputieren – im Gegensatz zur Auswahl des Auges, das schon alleine deshalb das Zentrale privilegiert, weil es für das Leben (und Überleben) Bedeutung besitzt. Das hat, wie man leicht einsehen wird, seinen phylogenetischen Grund. Wenn nun aber ein anderer diese Auswahl vornimmt, so fällt diese „Orientierung“ auf das, was wesentlich ist, offenbar weg. Man bekommt also unter Umständen auch das Irrelevante zu sehen, das, weil es, durch die Auswahl selbst, nunmehr im Zentrum steht, auch als zentral aufgefasst wird, obwohl es an sich durchaus belanglos ist. Und weil man es sieht, glaubt man, dass es real ist – real als wesentliches Moment, insofern es eben ins Zentrum gerückt ist.

Der Standpunkt der Kamera spielt auch eine Rolle: Durch die Nähe (Großaufnahme) kann ein Detail, das von Bedeutung ist, sichtbar hervortreten, durch die Ferne (Panoramaaufnahme) wird es unsichtbar gemacht, da es nicht mehr wahrnehmbar ist. Umgekehrt kann eine Großaufnahme den Umfang eines Geschehens kaschieren, während eine Panoramaaufnahme genau diesen Umfang deutlich zu erkennen gibt.

Zudem: Von einer Seite aufgenommen sieht ein Objekt ganz anders aus als von einer anderen Seite. Die Vorderseite eines Objekts mag imposant sein, von hinten gesehen, erscheint dasselbe Objekt als verkommen. Je nach dem Standpunkt erhält man in einem potemkinschen Dorf glänzende Fassaden oder die Tristesse einer Bretterwand mit ihren hölzernen Stützen.

Kurz: Ein und dasselbe Objekt ändert seine Bedeutung je nach dem Standpunkt, den die Aufnahmegeräte beziehen. Das hat im übrigen seine Parallele im Bereich der sprachlichen Kommunikation: Je nachdem, mit welchem Ausdruck ich ein und dieselbe Sache bezeichne, ändert sich deren Bedeutung für den, der als Empfänger der Nachricht fungiert. Das Denotat ist dasselbe, das „Bild“, das davon im Rezipienten entsteht, hängt demgegenüber ganz an dem Zeichen, das zur Bezeichnung benutzt wird. Die Konnotationen sind das, worauf es hier ankommt: Sage ich „Hütte“ oder auch „Häuschen“, so transportiere ich einen ganz anderen Sinn, als wenn ich „Bretterverschlag“ oder „Bruchbude“ sage. Das referierte Objekt ist aber immer dasselbe, es ändert sich durch den Wechsel der Bezeichnungen nicht. Was sich ändert, das ist der Eindruck von dem Objekt, der im Empfänger der Nachricht entsteht.

Schließlich ist noch zu erwähnen, dass man durch die Perspektive, den Neigungswinkel, den die Kamera einnimmt, das Objekt mit einer additionalen Bedeutung versehen oder genauer: es in ein bestimmtes Licht rücken kann. Wird ein Objekt von oben gefilmt, so erscheint es uns unscheinbar, hilflos und mickrig, von unten gefilmt erscheint es uns demgegenüber potent und bedrohlich. Das Objekt selbst muss sich hier keineswegs ändern, sein Zustand kann ein und derselbe sein. So etwa hat Stanley Kubrick General Ripper in einer Einstellung von unten gefilmt, um ihn als dämonisch erscheinen zu lassen. Ironischerweise hat Chaplin in „Der große Diktator“ diesen filmischen Trick Dr. Garbitsch („Goebbels“) als praktisches Instrument anwenden lassen, als dieser Napaloni („Mussolini“) partout auf einen Stuhl setzen wollte, dessen Beine abgesägt waren, um Hynkel („Hitler“) seinem Diktatoren-Kollegen als dominant erscheinen zu lassen. Es hat dann allerdings nicht funktioniert, weil sich Napaloni nicht foppen lassen wollte.

Es gibt noch eine ganze Menge anderer filmischer Methoden, auf die wir hier nicht näher eingehen wollen und sie nur en passant erwähnen. So besteht ein eher plumpes Vorgehen darin, die „Kulissen“ zu modifizieren, um den gewünschten Eindruck zu erzeugen. Das ist beim Film gang und gäbe, da werden bisweilen Bäume umgeschnitten und Flüsse aufgestaut, wie man bei Pudowkin nachlesen kann. Man kann auch, um den gewünschten Effekt zu erzielen, die Szenerie wie durch einen Schleier filmen, aber auch unscharf, verzerrt usw. Schließlich werden durch den Einsatz von Musik gewisse Wirkungen hervorgerufen, die man nicht unterschätzen darf: Wird etwa das Porträt eines Mannes mit düsterer Musik unterlegt, so erscheint dieser unfehlbar als dämonisch.

20.

Die wichtigste Methode jedoch, auf die der visuell-auditive Komplex zurückgreifen kann, ist die Montage. Man kann unter „Montage“ ganz simpel das Zusammenkleben von einzelnen Filmstreifen, Aufnahmen oder shots, verstehen, die dann eine visuell-auditive Einheit ergeben mit Blick auf den Transport einer ikonisch-semantischen „Botschaft“. In Wirklichkeit aber ist die Montage viel mehr: Sie ist ein Generator von Bedeutung. Sergej M. Eisenstein hat dies so formuliert: „Werden zwei beliebige Stücke aneinandergefügt, so vereinigen sie sich unweigerlich zu einer neuen Vorstellung, die aus dieser Gegenüberstellung als neue Qualität hervorgeht.“ (S. Eisenstein, Montage 1938, in: ders., Gesammelte Aufsätze I, Arche (o.J.), S. 230) Und weiter: „Wir sind gewöhnt, beinahe automatisch ganz bestimmte schablonenhafte, verallgemeinernde Schlüsse zu ziehen, wenn uns diese oder jene einzelne Objekte nebeneinander gezeigt werden. Nehmen wir zum Beispiel ein Grab. Stellt man eine weinende Frau in Trauerkleidung daneben, wird wohl jeder sofort zu der Schlussfolgerung ‚Witwe‘ kommen.“ (ebd, S. 230) Und als Fazit stellt Eisenstein fest, „dass die Aneinanderstellung zweier Montageteile weniger der Summe beider Teile ähnlich ist als vielmehr einem qualitativ neuen Produkt; gegenüber einer Summe unterscheidet sich das Resultat solcher Nebeneinanderstellung qualitativ (sagen wir durch die Dimension oder das Maß) stets von jedem der beiden – einzeln betrachteten – Elemente.“ (ebd., S. 231f.)

Dies ging schon aus den Experimenten von Lew Kuleschow, einem sowjetischen Regisseur der ersten Stunde, hervor. Berühmt ist der Kuleschow-Effekt, der darin besteht, dass sich die Bedeutung oder der semantische Sinn eines Objekts je nach dem Kontext, in das es gestellt wird, wesentlich ändert. Kuleschow konnte zeigen, dass ein und dieselbe Aufnahme des Gesichts eines Schauspielers von den Zusehern als unterschiedlich interpretiert wird, je nach den dazu montierten Aufnahmen eines Tellers Suppe, einer Frau und eines Sargs. Man las aus diesem Gesicht einmal Hunger, einmal Begehren und einmal Trauer heraus, obwohl, wie gesagt, die Aufnahme und daher die Miene des Akteurs immer dieselbe war.

Das ist nur der eine Aspekt. Die Montage ermöglicht es darüber hinausgehend auch, eine künstliche Zeit und einen künstlichen Raum herzustellen.

So kann das, was in der Realität zeitlich auseinanderliegt, zusammengeführt, das, was unmittelbar aufeinanderfolgt, auseinandergerissen werden, ohne dass dies als Kompression oder als Bruch interpretiert werden würde. Es genügt hier, zwei Einstellungen, zwischen denen in der realen Zeit ein Zwischenraum liegt, unmittelbar aneinander zu kleben, oder aber eine Einstellung auseinander zu schneiden und dann ein Mittelglied einzufügen, das die Illusion hervorruft, dass Zeit vergangen wäre.

Was den Raum anbelangt, so stellte Pudowkin fest: Indem der Regisseur „die Einstellungen zusammenfügt, schafft er eine neue filmische Raumdimension.“ (Pudowkin, Filmregisseur …, S. 231) Er illustriert dies mit einem weiteren Kuleschow-Experiment, an dem er selbst beteiligt war: „1920 drehte Lew Kuleschow folgende Szene als Experiment: 1. Ein junger Mann geht von links nach rechts. 2. Eine Frau geht von rechts nach links. 3. Sie begegnen sich und drücken einander die Hand. Der junge Mann macht eine Handbewegung. 4. Es wird ein großes, weißes Gebäude mit einer breiten Treppe gezeigt. 5. Der junge Mann und die Dame gehen die breite Treppe hinauf. Die einzelnen Einstellungen wurden in der angegebenen Reihenfolge zusammengeklebt und projiziert. Der Zuschauer empfand die einzelnen Einstellungen als eine durchgehende Handlung.“ (ebd., S. 231f.) Nur, die einzelnen Aufnahmen wurden an den unterschiedlichsten Orten in Moskau aufgenommen (respektive wurde eine Aufnahme aus Washington aus einem US-amerikanischen Film eingefügt): in der Nähe des GUM, in der Nähe des Gogol-Denkmals, in der Nähe des Bolschoi-Theaters, vor dem Weißen Haus und schließlich in der Nähe der Erlöserkirche. „Durch das Zusammenkleben der einzelnen Einstellungen wurde ein in der Wirklichkeit nicht existenter, neuer filmischer Raum geschaffen. Die Gebäude, die tausende Werst auseinanderlagen, rückten im Raum zusammen und wurden an einigen Dutzend Schritten der Schauspieler neu messbar.“ (ebd., S. 232) Würde man nicht wissen, dass sich das Weiße Haus in Washington befindet, so könnte man durchaus glauben, dass es in Moskau liegt. So kann man in gewisser Weise „Berge versetzen“, d.h. einen Raumpunkt in eine andere Raumumgebung transplantieren. Das wurde auch schon mit Särgen gemacht.

Die Montage vermag darüber hinaus, die Zuseher in bestimmte Emotionen zu versetzen. Hier etwa spielt der Schnittrhythmus eine gewisse Rolle: Ein schneller Rhythmus kann den Rezipienten erregen, ein langsamer kann ihn beruhigen.

Damit sind die Möglichkeiten der Montage natürlich noch nicht erschöpft, es sollte indessen hier nur angedeutet werden, in welchem Sinne der Operateur der medialen Vermittlungsinstanz die Realität deformativ übertragen kann, wenn er will oder wenn er sich selbst schon in bestimmter Weise als konditioniert und programmiert erweist, so dass sein „Operieren“ ganz automatisch und unbewusst zur Deformation der „Abbilder“ führt.

21.

Diese Verfälschung fällt, wenn sie gut gemacht ist, in der Regel nicht auf. Sie ist nicht als solche erkennbar. Aber das ist nicht der springende Punkt. Denn selbst ohne manipulatives Präparieren der „Botschaft“ ist, wie wir sahen, der ikonische Komplex als solcher dazu angetan, Schaden anzurichten: id est, inhibierend und deformierend auf den logos, d.h. das Denkvermögen, zu wirken.

Um es nochmals zusammenfassend und in aller Deutlichkeit zu sagen: Das, was in Wirklichkeit zählt und worauf diese Inhibierung und Deformierung letztlich basiert, das ist der Umstand, dass der Augenschein – die Augen- und Ohrenzeugenschaft – sich erneut in den Vordergrund drängt und alle anderen Zugangswege zur Welt – alle Kanäle, die in der einen oder anderen Form durch die externe Reflexion wissenschaftlichen Zuschnitts moduliert sind – nunmehr weit hinter sich lässt. Aus einer Nische, in die ihn, was die Episteme betrifft, die Schriftlichkeit über weite Strecken der Weltgeschichte verdrängt hat, drängt er wieder hervor und überlagert alles, ja erdrückt es in einem Ausmaß, das noch bis vor kurzem nicht vorstellbar war. Die Informationsübermittlung, sobald sie mit der Augenzeugenschaft kombiniert wird, führt zu einer neuen Qualität in vielerlei Hinsicht. Und dies umso mehr, als die Bilderflut nahezu unbegrenzt ist.

Es ist nämlich so, dass es heute ein Kinderspiel ist, das, was man sieht, auch zu filmen. Ein Smartphone genügt. Und es ist ein Kinderspiel, dieses Gefilmte dann mit vielen zu „teilen“. Daher wird das Internet auch von Video-Clips jedweden Inhalts geflutet, Videos, die es bisweilen dann auch in die Mainstream-Medien schaffen und auf diese Weise noch viel mehr Empfänger erreichen. Die Nachrichten im Fernsehen sind davon übervoll. Kamera-Teams vor Ort bräuchte man eigentlich, so wie früher, nicht mehr. Man könnte sich auf die Video-Wut der „Smartphone-Zeugen“ verlassen.

Man ist heutzutage überall „live mit dabei“, auch wenn dieses „live“ in der Regel ein wenig zeitversetzt ist. Man wird mit „Bildern“ überschwemmt, Bilder, die, und darauf kommt es an, uns die Illusion vermitteln, das, was passiert ist, selbst gesehen zu haben – also es dann auch zu wissen. Was früher eng beschränkt war – der Radius der Augenzeugenschaft, also das, was man (in seinem Alltagsleben) selbst sieht –, erlebt eine Expansion – der sichtbare Raum weitet sich bis an die Grenzen, die noch denkbar sind, aus. Der Augenschein, einst punktuell, wird durch die „neuen Medien“ multipliziert und erstreckt sich bis in den letzten Winkel der Welt und bisweilen noch darüber hinaus (wenn wir an die Mondlandung denken). Oder anders gesagt: Der Horizont der Subjekte war, mit Bezug auf die direkte sensorische Wahrnehmungsform, bis vor kurzem auf ihren Alltag beschränkt. Fast alles, was darüber hinausging, wurde verbal oder schriftlich vermittelt. Das ändert sich nun. Und zugleich wird das, was an einem bestimmten Ort geschieht und bisher, der Natur der Sache nach, immer nur, wenn überhaupt, von wenigen gesehen werde konnte, sichtbar für viele, ja, theoretisch, für alle. Und das ist das eigentliche Problem.

22.

So wie sich die Sache dem Beobachter darstellt, leben wir mehr und mehr in einer Pseudo-Realität, in einer Welt des perfekten Scheins – in einer Welt, die der Reflexion keinen Raum lässt oder nur wenig. Hier ist es, wie es scheint, nicht verkehrt, von einer société infantile zu sprechen, von einer Infantilisierung der bürgerlichen Gesellschaft, einer Gesellschaft, die, indessen, nichts Kindliches an sich hat – denn dies würde bedeuten, zu staunen und nach allem zu fragen. Sie ist vielmehr kindisch.

image_print