Algorithmen – Das GIGO Prinzip

Auch wenn Algorithmen teilweise keine korrespondierende Erklärung in der abgebildeten Welt haben, beziehen sie sich auf diese Welt. Beim maschinellen Lernen versucht das System, die Muster (Bilder – darauf abgebildete Gegenstände) aus einem Satz von Lehrdaten zu „verstehen“, also es versucht, seine Millionen Parameter so zu setzen, dass sein Algorithmus möglichst oft ein Bild dem darauf abgebildeten Gegenstand zugeordnet wird.

Wenn nun ein solches System zur Bewerberauswahl (oder -vorauswahl) eingesetzt wird, dann werden ihm auch vorhandene Datensätze „gelehrt“ – also Paare von Bewerberprofilen und den Entschedungen zu diesen Bewerbern.

Das System wird daraufhin optimiert, möglichst oft so zu entscheiden, wie bei den Lehrdatensätzen entschieden wurde. Und dann ist es so , wie immer in der Datenverarbeitung: Die Qualität der Eingangsdaten (hier die Lehrdatensätze) bestimmt die Ergebnisse massgeblich – oder anders fomuliert: „Müll rein“ produziert auch nur wieder Müll („Garbage in – Garbage out“ : GIGO).

Wenn man sich nun vor Augen führt, dass

a) dem Algortithmus beim maschinellen Lernen keine Kausalketten der modellierten Welt zuzuordnen sind (er also „nicht erklärbar ist“)

b) Lehrdatensätze aus der realen Welt stammen, die bekanntlich nicht immer richtig ist

sieht man leicht, dass solche Systeme die Fehler, die man früher schon machte, ebenfalls lernen. Ein sehr deutliches Beispiel zeigt das System zur automatisierten Personalauswahl bei Amazon.

Das System wurde anhand früherer Personalauswahlentscheidungen trainiert und hatte dann die Entscheidungskriterien aus diesen früheren Entscheidungen mit Hilfe mathematischer Modelle herausgearbeitet. Dabei werden alle zur Verfügung stehenden Kriterien genutzt. Bspw. Zeugnisnoten, Soziales Engagement, Alter und Geschlecht. Im konkreten Fall bei Amazon stellte sich heraus, dass Frauen in der Vergangenheit im Bewerbungsprozeß benachteiligt wurden und deshalb wurde dieser Aspekt vom System auch so gelernt. (Das System ist rein datenbasiert und nimmt keinerlei moralische Wertung der gelernten Daten vor. Das geschlcht ist ein weiteres Kriterium wie Noten oder Softskills.) Als dieser Umstand offensichtlich wurde, hat man die Nutzung des Systems gestoppt.

Wegen des GIGO Prinzips gilt es, den Lehrdatensätzen beim Maschinelles Lernen noch mehr Bedeutung zuzumessen. Oder anderherum gesagt: Mit dieser Art Maschinen kann man die Fehler der Vergangenheit viel leichter wiederholen.

Leicht und schwer nachvollziehbare Algorithmen

Algorithmen sind die gedankliche Basis der Datenverarbeitung. Ein Computerprogramm – egal wie kompliziert es ist – arbeitet eine zuvor festgelegte Berechnungsvorschrift (einen Algorithmus) ab. Diese Algorithmen können Parameter aus der Umgebung berücksichtigen (bspw. nutzt die Glatteiswarnung am Bordcomputer des Autos die Umgebungstemepratur als Parameter). Um gerade bei Computerspielen echte Zufälligkeit zu nutzen, können Computer auch auf Zufallsgeneratoren zurückgreifen. Aber allen diesen Programmen liegen Algorithmen zugrunde, und diese bestimmen die Logik.

Und diese Logik ist mal leicht nachzuvollziehen und manchmal schwer.

So erscheint die o.g. Glatteiswarnung im Auto eigentlich immer dann, wenn die Umgebungstemperatur einen gewissen Wert untersteigt. Also ein recht einfacher Algorithmus.

Schwieriger ist schon die Berechnung der verbleibenden Reichweite eines Autos. Diese wird mithilfe des Tankinhalts und des durchschnittlichen Benzinverbrauch der letzten Strecken ermittelt. Dies kann dazu führen, dass man, bei zunächst hohem Verbrauch (bspw. durch hohe Geschwindigkeit) und danach sehr niedrigen Verbrauch (bei idealer Geschwindigkeit) die etwas widersprüchliche Situation erleben kann, dass die verbleibende Reichweite des Fahrzeugs zeitweise steigt, obwohl gefahren (und somit Treibstoff verbraucht) wird.

Dieser Algorithmus ist also schwierig zu erklären, aber immer noch verständlich.

Und die Algorithmen des maschinellen Lernens schließlich nutzen eine mathematische Modellierung, die gar keine korrespondierende Erklärung mehr in der uns bekannten Welt haben.

Sie haben Millionen Parameter, die einfach so berechnet werden, dass die Lerneingangsmuster (bspw. Bilder) bei entsprechender Verarbeitung mit diesen Parametern möglichst häufig zu den vorgegebenen Ergebnissen (abgebildete Gegenstände) führen.

Wenn diese Algorithmen dann mit den o.g. Parametersätzen auf neue (ungelernte) Eingangsmuster (also unbekannte Bilder) wirken, ist der so ermittelte Ausgabewert eine Näherung für die tatsächliche Interpretation des Bildes. Für diese Interpretation gibt es aber keine Garantie. Die Ergebnisse sind in vielen Anwendungsfälln einfach nur gut genug, um weiterzuhelfen.

Und nach der Zielfunktion?

Nun, wenn die Zielfunktion definiert ist, kann das System ja lernen und dann wird es angewandt. Bei Poker und bei Schach und Go zeigen sich dann gute Ergebnisse, das System ist besser als die menschlichen Spieler.

Aber nach welchen Strategien und welchen Taktiken spielt das System und was können wir machen, um genauso gut zu spielen?

Jetzt kommt ein ganz großes und schwieriges Feld: Erklärung von KI.

Derzeit ist das, was man gemeinhin KI nennt, nur ein System, das gut darin ist, die Verknüpfung von Eingangs- mit Ausgangssignalen herzustellen. Die Systeme sind aber so angelegt, dass sie nicht nur gelernte Eingangsignale verarbeiten, sondern auch andere Eingangssignale zulassen. Und der Erfolg der Systeme zeigt sich dann darin, dass sie bei ungelernten Eingangssignalen gute Ergebnisse erzielen.

Das Problem ist nun aber, dass die Signale auf eine mathematische Art und Weise verknüpft werden, die sich nicht in logische formale Schritte zurückverfolgen lässt, sondern zunächst quasi eine Blackbox ist. Man legt Eingangssignale an (eine Position eines Brettspiels) und das System schlägt einen nächsten Zug vor. Man weiß aber nur, dass das System in „ähnlichen“ Situationen mit diesem Zug Erfolg hatte.

Die meisten der heute existierenden Systeme sind so aufgebaut, dass sie solche Parallelschlüsse ziehen, ohne das sie eine genauere Erklärung dazu abgeben können.

Das macht auch die „Magie“ der Technik aus (berechtigter Weise). Das Problem der mangelnden Erklärbarkeit ist sinnvoller Weise auch ein Hinderungsgrund für die Verbreitung der Technik. So hat Google sich selbst ein langsameres Tempo verordnet um die Erklärbarbeit sicherzustellen (Link).

Die Zielfunktion (keine Büroklammern mehr)

Nachdem die Zielfunktion so wesentlich ist für ein selbstlernendes System wollen wir diese genauer anschauen.

Die typischen heute verfügbaren Systeme machen dass dann beispielsweise mithilfe der Spielregeln für Schach oder Go. Ganz stark vereinfacht: Das System bekommt als Maßstab definiert, schließlich den gegnerischen König zu schlagen. Dann spielt es Millionen Partien gegen sich selbst. Die ersten Partien sind grottenschlecht, aber das System lernt von „Null“ an und bildet anhand dieses Lernprozesses seinen eigenen Stil.

Während früher Spielprogramme für ein bestimmtes Spiel (Schach, Poker, Go…) konzipiert wurden, wurde das System AlphaZero für beliebige Brettspiele konzipiert. Das konkrete Spiel mit sinen Spielregeln und Siegbedingungen wird ihm dann eingegeben und in Übungspartien wird dann die Spielstrategie ermittelt. Auf diese Art konnte AlphaZero die besten verfügbaren Schach und Go Programme mit einigen Stunden Lernzeit besiegen.

Hier zeigt sich, der Ansatz zur Verallgemeinerung vom System für ein spezielles Spiel hin zu einem generischen System für Brettspiele.

Der Zauberspiegel

Mirror ist das dritte Buch von Karl Olsberg, das ich gelesen habe (besser: mir von dem Hörbuchdienst einer „Datenkrake“ habe vorlesen lassen).

Der Autor baut immer gerne ein paar Elemente aus seinem Wohnumfeld (Hamburg) ein. Aber nicht nur die deutschen Schauplätze sondern auch seine hauptberufliche Auseinandersetzung mit der Wirtschaft und seine Promotion in einem KI Thema führen dazu, dass die beschriebenen Szenarien auch aus technischer und wirtschaftlicher Sicht nachvollziehbar sind.

Besonders gefallen mir diese Aspekte:

Das Eindringen der Technik in das tägliche Leben der Menschen, dieses wird über eine Art persönlicher digitaler Assistent („Mirror“) erreicht.
Die „Intelligenz“ entsteht aus der Kombination der Einzelerkenntnisse.
Das Verhältnis der Segnungen und der Gefahren einer Technologie.
Die Nutzung der Technologie aus unterschiedlichen menschlichen Situationen (Konzernführung, Endnutzer mit unterschiedlichem Grad an krimineller Energie, Nutzung durch Behinderte, Sicht der Behörden …)
Die Optimierungsfunktion; also die übergeordnete Aufgabenstellung, die einem selbstlernenden System mitgegeben wird (werden muß).

Eine klare Lese- / Hörempfehlung für Interessierte.

Bildverstehen

Nachdem man bei den gängigen Suchmaschinen schon länger Sprachverstehen implementiert hat, geht der Trend nun auch zur Bilderkennung. Die üblichen Anbieter haben eine App im Angebot, um Bilder in ihre Suchmaschine einzugeben. Die Textkonvertierung ist da schonmal ganz hilfreich (vielleicht werden dann die Barcodes/QR-Codes überflüssig?).

Wenn man sich das einmal anschauen will, dann sollte man die Vorgehensweise der Agilen Entwicklung im Hinterkopf behalten, insbesondere den Begriff des Minumum Viable Products (das funktionierende Produkt mit einer minimalen Funktionalität…).

Das ist wohl derzeit der Stand der Entwicklung, aber das wird sich entwickeln.

Training für die Künstliche Intelligenz…

zeigt gewisse parallelen zur Kindererziehung.

Bei Schätzings Tyrannei des Schmetterlings wird ganz gut beschrieben, wie der Prozess aussehen sollte (inkusive Teddybär) , und auch in Dan Browns Origin gibt es ein paar Hinweise darauf.

Auch in der realen Forschungswelt sehen wir nun diese Vorgehensweise.

So hat das autodidaktische Brettspielprogramm AlphaZero von DeepMind „sich selbst das Schachspielen beigebracht“ und war innerhalb von neun Stunden in der Lage, lediglich aus den Basisregeln und mithilfe von Millionen Trainingspartien (gegen sich selbst) eines der führenden freien Programme (namen „Stockfish 8“) zu schlagen. Bemerkenswert ist noch, dass Stockfish mit einer 1000-fach höheren Rechenleistung in der Partie gearbeitet hat als Alpha Zero. Desweiteren ist AlphaZero generisch für Brettspiele ausgelegt und kann das Muster nutzen, um auch andere Brettspiele zu erlernen, was bei konventionellen Schachprogrammen nicht der Fall ist.

Somit ein Schritt in Richtung einer generischen Intelligenz, wie man sie Kindern gerne beibringen möchte.

Undumm – anstelle von intelligent

Die Sprachbedienung der Navigation im Auto ist ein deutlicher Vorteil gegenüber dem mühsamen Eintippen der Zieldaten. Aber wenn ein Sprachbefehl erst nach diversen Wiederholungen verstanden wird, und das Ganze beim nächsten Mal weider so abläuft, fragt man sich schon, wo denn jetzt die Intelligenz im System steckt…

Ja, das Sprachverstehen ist – rein wissenschaftlich – eine große Herausforderung; aber die Systeme müssen sich im Alltag beweisen. Und hier steckt noch viel Entwicklungspotenzial.

So hat eine Frau beispielsweise in einem ganz normalen Restaurant über 5000 Dollar Trinkgeld gegeben, weil sie versehentlich Ihre PIN (5650) anstelle des Trinkgeldbetrages eingetippt hat. Das sind Fehler die sich erfassen und behandeln lassen, und dies würde der Akzeptanz neuer Technologie wesentlich dienlicher sein, als die neueste Technologie; die ja nicht umsonst auch „bleeding edge“ (anstelle „leading edge“) genannt wird.

Vorhersage zur allgemeinen künstlichen Intelligenz

Amerikanische Forscher haben herausgefunden, dass 76% aller Berichte, die anfangen mit „Amerikanische Forscher haben …“, nicht zutreffen. Das ist natürlich besonders spannend, wenn man herausfinden will, wann den endlich künstliche Intelligenz (KI) so richtig verfügbar ist…

Um die Gefahr, sich zu verschätzen, möglichst niedrig zu halten, hat der Zukunftsforscher Martin Ford einmal die Branchengrößen der KI dazu befragt.

Die Frage war danach, wann man mit einer Wahrscheinlichkeit von 50% damit rechnen kann, dass eine allgemeine KI existiert (also eine künstliche Intelligenz, die dem Menschen grundsätzlich und nicht nur in einigen Gebieten überlegen ist).

Die Antworten schwankten von 2029 bis 2200. Und das in USA, wo die Firmenlenker im algemeinen sehr visionär sind. Es bleibt also noch ein wenig Zeit.

Wer aber die Errungschaften der speziellen künstlichen Intelligenz bestaunen möchte: Es gibt einen Artikel über das neue Buch von Martin Ford, der in englischer Sprache erschienen ist. Mittlerweile haben alle gängigen Webbrowser aber einen automatischen Übersetzer verfügbar, mit dessen Hilfe man die Website, während man sie aufruft, übersetzen kann. Einfach mal ausprobieren bei diesem link.