Maschinelle Intelligenz und das menschliche Monopol

11.01.2024 | Data Management & Analysis | Lernende Systeme | Mensch Maschine Interaktion | Saarbrücken

Radiologen profitieren von Künstlicher Intelligenz als Befundungsunterstützung. Mitarbeitende in multilingualen, transnationalen Unternehmen freuen sich über die erreichte Qualität der maschinellen Textübersetzung. Aber es gibt keine Weisheit ex machina. Und man sollte auch nicht so tun als ob.

Ein Gastbeitrag von Reinhard Karger, Frankfurter Allgemeine Zeitung, 02.01.2024

Der Mensch erfindet seit Jahrtausenden Werkzeuge, die sein Leben erleichtern oder sein Überleben ermöglichen. Werkzeugautonomie oder die Idee der Mensch-Werkzeug-Kommunikation sind konzeptuell in der Antike angelegt. Schon Aristoteles thematisiert vor 2350 Jahren das selbsttätige Werkzeug, das „auf erhaltene Weisung, oder gar die Befehle im Voraus erratend, seine Verrichtung wahrnehmen könnte“. Automatisierung, im Sinne der Selbsttätigkeit, ist für Aristoteles mit einer egalitären, allerdings elitären gesellschaftspolitischen Utopie verbunden, denn „dann brauchten allerdings die Meister keine Gesellen und die Herren keine Knechte“. (Aristoteles, „Politik“, Buch 1, Kap. 4).

Werkzeuge erweitern menschliche Handlungsspielräume, erhöhen Freiheitsgrade bei der Ausführung, eröffnen effizientere Zielerreichungspfade. Die Arbeit wird erleichtert, aber nicht überwunden. Die Leistung ist benennbar, die Werkzeuge sind erkennbar. Mit Künstlicher Intelligenz fordert der Mensch sich und sein Selbstverständnis neu und prinzipiell heraus. Das ist kein Grund für Selbstverzwergung, aber Anlass genug, das Menschliche und das Selbstverständliche abermals und das maschinell Machbare kritisch in den Blick zu nehmen. Dabei sollten wir gleichzeitig bescheidener und anspruchsvoller sein. Es gibt zwar bedenkliche Nachrichten, aber überwiegend gute Perspektiven.

Künstliche intelligenz meint die Digitalisierung menschlicher Wissensfähigkeiten. Offensichtlicher wird der Spannungsbogen mit dem Begriff der „maschinellen Intelligenz“. Denn es geht erst sekundär um „natürlich“ versus „künstlich“, primär geht es um Mensch und Maschine. Zu den zahlreichen menschlichen Wissensfähigkeiten gehören das Lesen, Schreiben, Rechnen, die wir als Kulturtechniken auszeichnen. Natürlich das Sprechen, bei dem wir als vergesellschaftete Sprachsubjekte wissen, was wir durch Wortwahl, Sprechgeschwindigkeit, Satzmelodie, mit einer druckvollen oder zurückgenommen Betonung pragmatisch bewirken und persönlich erreichen können. Aber eigentlich geht es natürlich um das Denken und bei Künstlicher Intelligenz um die Fähigkeitsverstärkung für den Menschen.

Um das maschinelle Chancenportfolio axiomatisch eingrenzen zu können, müssen die prinzipiellen Unterschiede zu menschlichen Fähigkeiten benannt werden. Was kann der Mensch? Und was kann eine Maschine nicht können? Einen empirischen Anker als Antwortangebot auf die erste Frage liefert die evolutionäre Anthropologie, die sich mit den Unterschieden zwischen nichtmenschlichen Primaten und Homo sapiens beschäftigt. Arbeitshypothese ist, dass sich die artspezifische Differenz an der sogenannten Ontogenese des Individuums ablesen lässt. Obwohl sich Schimpansen-Neugeborene und menschliche Neugeborene in den ersten Lebenswochen ähnlich entwickeln, sieht der amerikanische Anthropologe Michael Tomasello (2002) die entscheidende sozial-kognitive Weichenstellung am Ende des ersten Lebensjahrs. Er nennt sie die „Neunmonatsrevolution“.

Ab dem neunten Monat beginnt der menschliche Säugling zusammen mit seinen engsten Bezugspersonen Teilnehmender und Akteur in Situationen, oder wie Tomasello es ausdrückt, in „Szenen gemeinsamer Aufmerksamkeit“ zu sein. Der neun Monate alte Mensch beginnt den Blick der Mutter oder des Vaters zu verfolgen und erfährt, dass sich eine Aktion auf ein Objekt richtet. in einer solchen „Szene gemeinsamer Aufmerksamkeit“ sind die Teilnehmenden triadisch auf das Gegenüber, auf sich selbst und gleichzeitig und gemeinsam auf dieselbe Person, denselben Gegenstand oder dasselbe Ereignis bezogen.

Der Säugling erlebt seine eigenen Absichten physiologisch unmittelbar, nimmt das Verhalten seiner Mutter oder seines Vaters wahr. Er versteht, dass die mimischen, gestischen oder lautlichen Äußerungen seiner engsten Bezugspersonen sich auf dasselbe Objekt beziehen. Und er verfügt über die erstaunliche Transferfähigkeit, zu schließen, dass die Äußerungen der anderen der eigenen Reaktion deshalb entsprechen, weil die Absichten, Wünsche und Motive ähnliche sind. Ausgehend von diesem vorsprachlichen Erleben beginnt ein Prozess, der Menschen, aber nicht Menschenaffen, ein Leben lang dazu befähigt, ihre Perspektiven wechselseitig übernehmen zu können. Für Tomasello ist diese Wegscheide konstitutiv: „Die Wichtigkeit von Szenen gemeinsamer Aufmerksamkeit kann nicht genug betont werden.“ (Tomasello, 2002, S. 132). Die Befähigung zur wechselseitigen Perspektivenübernahme ist die Voraussetzung für soziale Intelligenz und ein menschliches Monopol, das „sich bei keiner anderen Art auf diesem Planeten findet“ (Tomasello 2002, Habermas 2012). Das ist entscheidend. Aber dennoch der zweite Schritt vor dem ersten.

Der Mensch ist konfrontiert mit seiner Willkür und der eigenen Innenwelt, und mit der hochkomplexen natürlichen und gesellschaftlichen Umwelt. Er findet sich vor, wie der Philosoph und Mathematiker Edmund Husserl es im Jahr 1936 ausdrückte, in seiner „leiblichen Ichlichkeit“. Das tatsächliche Vorhandensein des Wunsches oder das wirkliche Erleben von Angst sind fundamental. Den erlebten, jeweils aktuellen subjektiven Empfindungsinhalt hatte der Mathematiker Charles S. Peirce schon im Jahr 1867 kategorial als „Erstheit“ ausgezeichnet und dafür den Begriff „Quale“ geprägt. Qualia sind die Materie der Empfindungsfähigkeit, sie werden durch die inneren oder äußeren Sinne vermittelt und vom Menschen körperlich erfahren. Auf Qualia gibt es einen subjektiven, aber keinen objektiven Zugriff – und auch wenn vielleicht manchmal ein falscher Eindruck erweckt werden könnte, Brain Computer Interfaces (BCI) können keine Gedanken lesen, sie können nur neuronale Aktivitätsregionen oder Aktivitätsmuster lokalisieren oder identifizieren.

Qualia sind die zweite notwendige Voraussetzung für soziale Intelligenz. Menschen können die Ich-Perspektive und damit die Wahrhaftigkeit eines persönlichen Erlebens in Anspruch nehmen. Sie können die Aktionen der anderen auf Absichten zurückführen, Ziele annehmen, hypothetische Pläne konstruieren und nächste Schritte prognostizieren, weil sie davon ausgehen können, dass die Wahrscheinlichkeit einer möglichen nächsten Aktion dem eigenen Handeln entsprechen würde, hätte man dasselbe Ziel. Angeleitet durch ihre Welterfahrung und orientiert durch die selbst erlebten Emotionen (Freude, Interesse, Überraschung, Furcht, Ärger, Trauer, Ekel) können sprachkompetente Menschen über das erwartbare Verhalten des oder der anderen Vorhersagen begründen, die laufend in anstehende Entscheidungen einfließen. Damit bewegen sich Menschen im Raum der sozial, kulturell und institutionell vernetzten Gründe, können Auskunft geben, Voraussetzungen erläutern, deskriptiv auf realweltliche Fakten verweisen, die wiederum ihrerseits als belastbare Basis für situationsadäquate Schlussfolgerungen dienen.

Die zweite Frage war, was können Maschinen nicht? Um die Dimension der Mensch-Maschine-Differenz konstruktiv aufzubauen und beginnend mit dem letzten Punkt: Maschinen können keine Qualia empfinden, sind ihnen aber auch nicht unterworfen. Es gibt per heute keinen Ansatz für eine erfolgversprechende psychophysische Reduktion. Konzepte wie Wunsch oder Mangel, Hoffnung, Angst, Lust oder Laune sind für Maschinen nicht nachvollziehbar, und deshalb sind sie auf sie nicht anwendbar. Maschinen können während der Verarbeitung einer Zeigegeste Blickverfolgung einsetzen, können wahrscheinliche Ziele identifizieren, sind aber nicht Teilnehmende oder Akteure in „Szenen gemeinsamer Aufmerksamkeit“. Sie haben keine Absichten oder Pläne, keine selbst gesetzten Ziele, keinen Willen, diese anzustreben, und kein Reenactment, um von der phänomenologischen Oberfläche auf die kausal verantwortlichen Motive zu schließen. Maschinen haben keine Ich-Perspektive und können keine Perspektive übernehmen. Sie haben keinen Zugang zum menschlichen Monopol der sozialen Intelligenz, sie können in der Auswahl von Handlungsalternativen eben nur eine gewisse Gewichtung erzeugen.

Visuelle und auditive Umweltreize werden rezeptiv sensorisch erfasst, mit Künstlicher Intelligenz ausgewertet und klassifiziert. Technische Sensoren wandeln einen Signalstrom in einen Datenstrom, Muster werden identifiziert, Information extrahiert, die Wahrscheinlichkeit einer folgenden Aktion festgestellt – aber Qualia werden nicht empfunden. Künstliche Intelligenzen können als selbstlernendes System bezeichnet werden, aber dieses technische Lernkonzept entspricht inhaltlich, formal, prozedural und resultativ nicht dem menschlichen Lernen, für das selbst erlebte Absicht, soziale Gemeinschaft und konzeptuelles Sprachverstehen notwendig sind. „In erster Linie ist es das Zusammenspiel von intentionalem Weltverhältnis, gegenseitiger Perspektivenübernahme, Verwendung einer propositional ausdifferenzierten Sprache, instrumentellem Handeln und Kooperation, welches die Lernprozesse einer vergesellschafteten Intelligenz ermöglicht“, schreibt der Philosoph Jürgen Habermas (2012, S. 52).

Die Bedeutung dieser Unterschiede kann nicht genug betont werden. Denn sie haben Folgen für die realistisch lebenspraktischen Erwartungen an die obere Schranke der prinzipiell erreichbaren maschinellen Leistungs- und Funktionsfähigkeiten. Entscheidend ist, dass Maschinen nicht Ziel von moralischen Ansprüchen sein können und dass es keine maschinelle Moralität geben kann, denn „Ethik ist aber Triebeinschränkung“, wie Sigmund Freud 1939 in seiner letzten Veröffentlichung „Der Mann Moses und die monotheistische Religion“ ausführte. Maschinen haben keine Triebe, sie brauchen auch keine Triebkontrolle. Und David Hume schrieb schon anno 1751: „Lösche alle herzlichen Gefühle und Vorurteile für die Tugend und allen Ekel und Abscheu gegen das Laster aus. Mache die Menschen vollkommen gleichgültig gegen diese Unterschiede, dann ist die Moral kein praktisches Studium mehr und hat keine Tendenz, unser Leben und unsere Handlungen zu regulieren.“ (Hume, 1751, S. 6). Ohne Emotionen ist Freude lediglich ein Wort.

Ein erfreulicher Mehrwert dieser Feststellungen ist die erkenntnisorientierte Emanzipation von interessengeleiteten Marketingversprechungen, die Befreiung von Hybris, von wortreicher und bildgewaltiger Dystopie. Die Empfindungsunfähigkeit von Maschinen bedeutet auch, dass sie nicht leiden können und folglich aus sich heraus keine Rechte haben, zum Beispiel auch nicht so etwas wie ein Recht auf Strom. Wir können sie weiter als Dinge oder Sachen ansehen, verwenden, recyceln oder upcyceln, in Bestandteile zerlegen, einschmelzen und dann nachnutzend verwerten. Wenn in der berechtigten Diskussion über Anwendungen von KI-Technologie ethische Fragen thematisiert werden, richtet sich das an Entwicklerinnen, Anbieter, Anwenderinnen und Regulierer – aber nicht an eine wie auch immer geartete moralische maschinelle Subroutine.

Die Funktion der menschlichen Moral ist die prosoziale Selbstregulation des Handelns, das getrieben wird von den egozentrischen Bedürfnissen, Wünschen und Zielen der individuellen Akteurin oder des Akteurs. Das Ausleben der Gier oder der möglichen Befriedigung wird begrenzt durch den verinnerlichten Widerstand der Gruppe. Die Pointe bei der menschlichen Moral liegt darin, dass die Interessensverallgemeinerung auf Basis der Selbst-anderer-Äquivalenz ein überaus taugliches Prüfwerkzeug ist, um zu erspüren, ob eine Handlung als gerecht, erwünscht oder auch als gesollt anzusehen ist (Tomasello, 2016, Kap. 3.2). Aber Maschinen empfinden nichts. Sie können keine Perspektiven übernehmen, haben keine eigenen Absichten, keine Ziele, leiden nie und sind deshalb keine möglichen Adressaten für eine beliebige Form moralischer Selbststeuerung.

Maschinen sollen aber Hand in Hand mit Menschen einsetzbar sein. Also muss sichergestellt werden, dass Aktionen gleichermaßen zielorientiert und angemessen sind. Da maschinelle Moralität wie beschrieben kein mögliches Steuerungskonzept ist, müssen Vorgaben, Regeln oder Gesetze, muss also hochaufgelöste positive Legalität die Lücke konstruktiv füllen. Überträgt man nun als Abkürzung den Rechtsgrundsatz der allgemeinen menschlichen Handlungsfreiheit auf Maschinen (alles ist erlaubt, was nicht verboten ist, vgl. Grundgesetz Art. 2 Abs. 1), verliert man den ganz unterschiedlichen Aktionsumfang von Mensch und Maschine aus dem Blick – man denke etwa an Kraft, Ausdauer oder Geschwindigkeit. Dieser ist jedoch entscheidend, damit ein singuläres Optimierungskriterium nicht zu einem gesellschaftlichen Desaster führt.

Um die Anwendungslegalität in Entscheidungszusammenhängen sicherzustellen, sind robuste KI-Systeme notwendig, die formale Erklärbarkeitsvoraussetzungen erfüllen, weil sie starke Garantien und Zertifikate ermöglichen. Damit haben wir das Auge eines wissenschaftlichen Hurrikans erreicht. Seit dem Beginn der KI-Forschung vor fast 70 Jahren gibt es einen lagerbildenden Paradigmenstreit um „symbolische“ versus „subsymbolische“ Verarbeitung. Gemeint ist, dass man Systeme baut, die entweder symbolisch orientiert Zeichen nach Regeln verarbeiten und die Bedeutung eines Ganzen aus der seiner Teile und der Art und Weise ihrer Verbindung ableiten. Diese Systeme können nachvollziehbare und eben falsifizierbare Ergebnisse liefern. Sie können als Instanzen von kognitiver Intelligenz angesehen werden. Und sie erlauben Schlussfolgerungen.

Entwickler können aber andererseits auch einen sogenannten subsymbolischen Ansatz verfolgen, der datengetrieben, massiv parallel und netzwerkbasiert vorgeht, ohne dass kognitive Zwischenschritte benennbar sind. Resultate sind nur möglicherweise korrekt, wobei sich die Ergebnisqualität evaluieren, aber die Ergebniserarbeitung nicht rekonstruieren lässt, das Ergebnis hinnehmen, aber nicht verifizieren lässt. Wenn heute von selbstlernenden Systemen, künstlichen neuronalen Netzen oder Deep Learning die Rede ist, geht es um diesen Ansatz.

Die beiden Forschungsrichtungen konkurrieren um wissenschaftliche Anerkennung, akademische Karrieren, gesellschaftliche Wertschätzung und finanzielle und personelle Ressourcen. Sie sind darüber hinaus motiviert von dem verständlichen Bedürfnis, recht zu haben, und von der faszinierenden Idee, sämtliche Anwendungen monistisch mit nur einem Ansatz zu realisieren.

Die symbolischen Systeme sind immer noch ungeschlagen in der Konstruktion von begrifflich konsistenten Wissensgraphen und dem logischen Schließen, sodass ein Ergebnis schrittweise und umfassend nachvollziehbar von ersten Prinzipien abgeleitet ist. Die subsymbolischen und aktuell sehr erfolgreichen künstlichen neuronalen Netze und großen Sprachmodelle (LLM) können für sich in Anspruch nehmen, KI-Lösungen ermöglicht zu haben, die etwa gesprochene Sprache besser erkennen, Texte besser übersetzen oder erzeugen und Objekte besser identifizieren können, als es mit regelbasierten Ansätzen jemals möglich gewesen ist. Aber: es existiert kein explizites Kontext- oder Symbolverstehen auf der Seite der subsymbolischen Lösungen.

Wie die maschinelle Textübersetzung zeigt, ist das auch nicht immer notwendig, um eine hochleistungsfähige sprachtechnologische Anwendung zu realisieren. Die Erfolge von Deep Learning sind atemberaubend, viele Anwendungen sind praxistauglich. Allerdings sind sie es eben nur dann, wenn ein möglicherweise korrektes Ergebnis ausreichend ist, und das bedingt oft, dass ein Mensch als „Human in the Loop“ diese Tauglichkeit feststellt, bevor es verwendet wird. Das heißt einerseits, dass die fehlende Verlässlichkeit den nichttrivialen Einsatz von autonomen Systemen verunmöglicht. Und dies bedeutet andererseits, dass (Ergebnis-)Erklärbarkeit und (Folgen-)Verantwortung auf den Menschen ausgelagert werden.

Für den menschheitlich umfassend sinnvollen und notwendigen Einsatz von maschineller Intelligenz müssen die technischen Systeme in den „Raum der Gründe“ einwandern, wie Habermas das ausdrücken würde. Der Raum der Gründe ist inhärent sprachlich und deshalb symbolisch, wie er ausführt: „Die entwickelte sprachliche Kommunikation kann als die Art von Kommunikation beschrieben werden, die über die bedeutungsidentische Verwendung von Sym- bolen eine gemeinsame objektive Welt im Horizont einer intersubjektiv geteilten Lebenswelt erschließt.“ (Habermas, 1999/2022, Bd. 1, S. 240).

Die symbolische Verarbeitung ist erfolgsnotwendig, wenn wir die Anwendungsklassen von KI-Lösungen nicht einschränken wollen und müssen auf Problemstellungen, in denen Erklärbarkeit als widerspruchsfrei argumentative Ableitung aus vorgelagerten Prinzipien eben keine Rolle spielt. Ein gesprochenes Wort ist dann korrekt erkannt, wenn es gesprochen wurde. Aber eine Schlussfolgerung ist nicht deshalb korrekt, weil die Auftrittswahrscheinlichkeit einer Wortfolge hoch ist.

Die Erklärbarkeit maschineller Empfehlungen und die Verlässlichkeit maschineller Entscheidungen haben mit der Bezeichnung „Trusted AI“ oder „vertrauenswürdiger KI“ ein neues Forschungsfeld eröffnet, dessen zukünftige Ergebnisse von maßgeblicher Bedeutung für den produktiven Einsatz von KI-Systemen sein werden. Obwohl tatsächliche soziale Intelligenz für Maschinen unerreichbar ist, könnte die Entwicklung von kognitiver maschineller Intelligenz gelingen. Zu hoffen ist, dass Trusted AI mit der notwendigen intellektuellen Ernsthaftigkeit, und in einer Kraftanstrengung von öffentlichen Forschungsmitteln und privatwirtschaftlichen Investitionen mit ausreichenden finanziellen und personellen Ressourcen ausgestattet wird.

Forschungsfragen sind: Wird man assertorische, also Zustimmung in Anspruch nehmende Urteile, und problematische, also nur auf Wahrscheinlichkeit beruhende Aussagen in einer Argumentationskette aufeinander verweisen lassen können, ohne die Gültigkeit einer Schlussfolgerung zu gefährden? Und wird es gelingen, integrierte KI-Systeme zu schaffen, die in einem hybriden Ansatz, der auch als neuro-symbolisch, neuro-explizit oder neuro-mechanistisch bezeichnet wird, die Vorteile der symbolischen deduktiven und der subsymbolischen neuronalen Ansätze zu vereinen? Und die Nachteile, die beide eben auch haben, zu überwinden? Der Erfolg ist missionskritisch, der wissenschaftliche Wille vorhanden, die erfolgreiche Zielerreichung ist offen.

Aber warum benötigen wir als Gesellschaft KI-Systeme, welche die Stärken von symbolischer und subsymbolischer Verarbeitung verbinden? Weil technische Lösungen, denen wir maschinelle Autonomie und Verlässlichkeit zusprechen können, objektiv notwendig sind, um die anstehenden technologischen, demographischen und kulturellen Transformationen zu gewinnen. Es ist nicht illusorisch, auf eine KI-Dividende zu hoffen, die entscheidende Lösungsbeiträge in den Bereichen Bildung, Energie, Logistik, Gesundheit, Mobilität, Recycling oder Ressourcennutzung liefert, eine nachhaltige Kreislaufwirtschaft ermöglicht und im Idealfall einen Beitrag leistet, den kulturellen Frieden zu stabilisieren und soziale Gerechtigkeit zu globalisieren.

Reinhard Karger ist theoretischer Linguist, seit 1993 Mitarbeiter, seit 2011 Unternehmenssprecher, seit 2022 Mitglied des Aufsichtsrats des Deutschen Forschungszentrums für Künstliche Intelligenz (DFKI).

Erschienen in der Frankfurter Allgemeine Zeitung, 02.01.2024

Online: https://www.faz.net/aktuell/wirtschaft/unternehmen/was-ki-nicht-kann-wo-die-maschine-zum-mensch-nicht-aufholen-wird-19419488.html

Quellen
Sigmund Freud, Der Mann Moses und die monotheistische Religion, London, 1939
David Hume, Eine Untersuchung über die Prinzipien der Moral, 1751, Meiner Verlag, 2003, S. 6
Jürgen Habermas, Nachmetaphysisches Denken II, Suhrkamp, 2012
Jürgen Habermas, Auch eine Geschichte der Philosophie, Suhrkamp, 2019, mit einem neuen Nachwort 2022
Edmund Husserl, Die Krisis der europäischen Wissenschaft, 1936, Meiner Verlag, Hamburg, 2012
Charles S. Peirce, On a New List of Categories, Proceedings of the American Academy of Arts and Sciences (582. Sitzung), 14.05.1867
Michael Tomasello, Die kulturelle Entwicklung des menschlichen Denkens, Suhrkamp, 2002
Michael Tomasello, Eine Naturgeschichte der menschlichen Moral, Suhrkamp, 2016

Kontakt:

Reinhard Karger, M.A.

Unternehmenssprecher, DFKI

Reinhard.Karger@dfki.de
Tel.: +49 681 85775 5253