Algorithmen – Das GIGO Prinzip

Auch wenn Algorithmen teilweise keine korrespondierende Erklärung in der abgebildeten Welt haben, beziehen sie sich auf diese Welt. Beim maschinellen Lernen versucht das System, die Muster (Bilder –  darauf abgebildete Gegenstände) aus einem Satz von Lehrdaten zu „verstehen“, also es versucht, seine Millionen Parameter so zu setzen, dass sein Algorithmus möglichst oft ein Bild dem darauf abgebildeten Gegenstand zugeordnet wird.

Wenn nun ein solches System zur Bewerberauswahl (oder -vorauswahl) eingesetzt wird, dann werden ihm auch vorhandene Datensätze „gelehrt“ – also Paare von Bewerberprofilen und den Entschedungen zu diesen Bewerbern.

Das System wird daraufhin optimiert, möglichst oft so zu entscheiden, wie bei den Lehrdatensätzen entschieden wurde. Und dann ist es so , wie immer in der Datenverarbeitung: Die Qualität der Eingangsdaten (hier die Lehrdatensätze) bestimmt die Ergebnisse massgeblich – oder anders fomuliert: „Müll rein“ produziert auch nur wieder Müll („Garbage in – Garbage out“ : GIGO).

Wenn man sich nun vor Augen führt, dass

a) dem Algortithmus beim maschinellen Lernen keine Kausalketten der modellierten Welt zuzuordnen sind (er also „nicht erklärbar ist“)

b) Lehrdatensätze aus der realen Welt stammen, die bekanntlich nicht immer richtig ist

sieht man leicht, dass solche Systeme die Fehler, die man früher schon machte, ebenfalls lernen. Ein sehr deutliches Beispiel zeigt das System zur automatisierten Personalauswahl bei Amazon.

Das System wurde anhand früherer Personalauswahlentscheidungen trainiert und hatte dann die Entscheidungskriterien aus diesen früheren Entscheidungen mit Hilfe mathematischer Modelle herausgearbeitet. Dabei werden alle zur Verfügung stehenden Kriterien genutzt. Bspw. Zeugnisnoten, Soziales Engagement, Alter und Geschlecht. Im konkreten Fall bei Amazon stellte sich heraus, dass Frauen in der Vergangenheit im Bewerbungsprozeß benachteiligt wurden und deshalb wurde dieser Aspekt vom System auch so gelernt. (Das System ist rein datenbasiert und nimmt keinerlei moralische Wertung der gelernten Daten vor. Das geschlcht ist ein weiteres Kriterium wie Noten oder Softskills.) Als dieser Umstand offensichtlich wurde, hat man die Nutzung des Systems gestoppt.

Wegen des GIGO Prinzips gilt es, den Lehrdatensätzen beim Maschinelles Lernen noch mehr Bedeutung zuzumessen. Oder anderherum gesagt: Mit dieser Art Maschinen kann man die Fehler der Vergangenheit viel leichter wiederholen.

Daten und ihre Verarbeitung – aktuelle Leistungsfähigkeit

Ein paar interessante Zahlen:

In zwei Minuten werden heute weltweit mehr Fotos gemacht als im gesamten 19. Jahrhundert! (ok, es geht hier um die Menge, nicht um die Sinnhaftigkeit…)

Das System „Watson“ von IBM kann in 10 Minuten das vollständige Genom eines Menschen analysieren (und ggf. Therapieempfehlungen erstellen). Menschliche Ärzte würden für diese Aufgabe 160 Stunden benötigen.

Nach einer Studie der Kantar TNS erwartet die Bevölkerung in Deutschland im Durchschnitt weder eine Verschlechterung noch eine Verbeserung des Lebens durch künstliche Intelligenz.

Der Zauberspiegel

Mirror ist das dritte Buch von Karl Olsberg, das ich gelesen habe (besser: mir von dem Hörbuchdienst einer „Datenkrake“ habe vorlesen lassen).

Der Autor baut immer gerne ein paar Elemente aus seinem Wohnumfeld (Hamburg) ein. Aber nicht nur die deutschen Schauplätze sondern auch seine hauptberufliche Auseinandersetzung mit der Wirtschaft und seine Promotion in einem KI Thema führen dazu, dass die beschriebenen Szenarien auch aus technischer und wirtschaftlicher Sicht nachvollziehbar sind.

Besonders gefallen mir diese Aspekte:

  • Das Eindringen der Technik in das tägliche Leben der Menschen, dieses wird über eine Art persönlicher digitaler Assistent („Mirror“) erreicht.
  • Die „Intelligenz“ entsteht aus der Kombination der Einzelerkenntnisse.
  • Das Verhältnis der Segnungen und der Gefahren einer Technologie.
  • Die Nutzung der Technologie aus unterschiedlichen menschlichen Situationen (Konzernführung, Endnutzer mit unterschiedlichem Grad an krimineller Energie, Nutzung durch Behinderte, Sicht der Behörden …)
  • Die Optimierungsfunktion; also die übergeordnete Aufgabenstellung, die einem selbstlernenden System mitgegeben wird (werden muß).

Eine klare Lese- / Hörempfehlung für Interessierte.

Der Umgang mit dem Medium

50% der internetnutzer sind schon Opfer von Cybercrime geworden, aber die Frage ist doch: Wieviel sind sie selbst schuld…?

Und da kam nun die Antwort aus dem Bundestag selbst:

Laut einem Bericht haben nur 2.1 % der Abgeordneten die angebotene Zweifaktorauthentifizierung von Facebook (empfohlen im Zuge der letzten Bundestagswahl von Facebook im Jahre 2017) eingerichtet. OK, es gibt organisatorische Herausforderungen dabei. Aber der Ruf nach Gesetzen alleine reicht nicht, die Möglichkeiten müssen auch auch zur Anwednung gebracht werden. Und die organsatorischen Herausforderungen müssen gelöst werden, und das kostet Zeit und Aufwand.

Unabhängig davon auch nochmals eine schöne Analyse der in diesem Zusammenhang verbreieteten Meldungen und vor allem Meinungen (Nebelkerzen!). Auch hier ist der Tenor, dass man nun anfangen muß zu handeln, und das unangenehme ist wohl, dass man es auch selbst tun muß.

China update

In Ergänzung zum Post zu den „Sozialen Netzen“ in China:

In einigen Schulen werden die Schüler nun mithilfe von Jacken-Chips (sogenannte wearables) überwacht. Neben der Bezahlfunktion in der Mensa können damit auch Anwesenheit und Aufmerksamkeit geprüft werden, da das System die Bewegungs- und Biodaten erfasst. So wird bspw. ein Alarm ausgelöst, wenn der Schüler einschläft.

Das Ganze nennt sich dann Smart Campus mithilfe von intelligenten Uniformen .

PS: Die Jacken halten Temeraturen bis 150 Grad stand und sollen 500 Waschgänge überstehen.

 

Gefahr für Demokratie? II

Es ist wie so oft, es ändern sich die Werkzeuge, nicht das System.

Aber es sind mächtige Werkzeuge, die sich hier ändern, die haben die Wirtschaft schon sehr stark verändert. In seinem Buch „The Long Tail“ beschreibt Chris Anderson, wie bspw. dank Onlinehandel in der Buchindustrie die Werke mit geringer Auflage dennoch von nahezu jedem gefunden und bestellt werden können. Dies war im klassischen Buchhandel aufgrund begrenzter Regal(kilo)meter nicht möglich.

Das Ergebnis ist  mehr Auswahl für den Konsumenten und eine Herausforderung für den klasssichen Buchhändler vor Ort durch den automatisierten Onlinehandel.

Ein wichtiges Element der Demokratie ist der aufgeklärte Bürger. Hier ist eine Herausforderung zu sehen, dass nämlich „Fake News“ und „Alternativen Fakten“ beim Bürger zu Desinformation  und eben nicht zu Aufklärung führen.

Auch hier muß (auf einer übergeordneten Ebene) aufgeklärt werden. Es muß bei der Erziehung zur Mündigkeit des Bürgers eben auch die Bewertung der Nachrichten (und ihrer Quellen) gelernt werden.

Praktisches Beispiel: Zu diesem Blog gibt es bislang keine echten Kommentare, vermutlich weil ich am Anfang ein wenig über Trolle geschrieben habe. Es gibt aber eine Reihe Kommentare die m.E. automatisch generiert worden sind und alle möglichen Zielsetzungen haben (Angebote zu Rechtschreibhilfe, Freundschaftsanfrage, Kooperationen zu Blogs und Schriftstellerei,…). Bezeichnenderweise sind alle diese Kommentare in englischer Sprache und mein Provider hat sie freundlicherweise gleich unter „Spam“ abgelegt. Hier geht also das System schon davon aus, dass es nicht bestimmungsgemäss genutzt wird und hat Gegenmassnahmen implementiert. Das ist nichts neues. Unsere Verfassung hat bspw. eine  5% Klausel für Parteien im Parlament um der Zersplitterung entgegenzuwirken; eine Erfahrung aus dem Ende der Weimarer Republik.

PS: Kommentare sind definitiv erwünscht, habt keine Hemmung!!

Ist die neue Technik eine Gefahr für die Wirtschaftsordnung und die Demokratie?

Die Debatte kommt immer wieder auf, zuletzt einmal bei den XING Nachrichten und heute natürlich beim derzeitigen Chaos Communication Congress des Chaos Computer Clubs (CCC).

Von Seiten verschiedener Politiker kommen Forderungen auf, beispielsweise nach Datensteuern oder Kennzeichnungspflicht für Social Bots in den Sozialen Netzen.

Bei einigen dieser Vorschläge stellt sich die Frage, ob das überhaupt so durchsetzbar ist (Woran will man den Bot erkennen? oder Wie soll eine Besteurung meiner Daten denn genau erfolgen, und in welchem Land? Was ist mit den Gegenleistungen, die ich typischerweise für die Bereitstellung meiner Daten erhalte wie bspw. Navigationsdienste. Sind diese Dienste dann steuermindernd zu berücksichtigen?…)

Das wird ein schweres Stück Arbeit, hier die erforderlichen Regeln zu finden, zu beschließen und umzusetzen. Und das ganze wird nur interdisziplinär zu lösen sein. So plant der CCC anstelle eines reinen fachlichen Sicherheitprogramms seinen Congress mit 16.000 Hackerinnen, Künstler, Forscherinnen und Technikinteressierte.

Ja, die Gefahr ist gegeben, und die Arbeit ist angefangen. Aber die Demokratie war immer in Gefahr, insofern ist die Situation nicht völlig neu…

NDN, der Non-Digital-Native

 

Allgemein spricht man von den Digital-Natives („ins digitale Zeitalter Geborene“) als denjenigen, die die aktuelle Technologie von früher Kindheit an erlebt haben und diese selbstverständlich benutzen (und diese auch überall erwarten). Laut Wikipedia sind die Digital Natives alle diejenigen, die nach den frühen 80ern geboren wurden.

Die Mehrheit der Deutschen ist aber älter und und somit ein Non-Digital-Native (NDN), also nicht in das Digitale Zeitalter hineingeboren worden.

Die meisten von diesen haben noch bewusst die Zeiten erlebt, in denen Telefone ausschliesslich mit Festnetzanschlüssen funktionierten (Die erste Frage in einem Telefonat war sinnvollerweise nicht ‚Wo bist du gerade?‘), der Fernseher Schwarz-Weiß war oder zumindest nur drei Programme hatte und Kinder die Rolle der Fernbedienung übernahmen…

Innerhalb der NDNs gibt es Unterschiede. Als Digital Immigrant – also der Einwanderer ins Digitale – versucht man, sich in dieser Welt als ursprünglich Fremder bestmöglich zu integrieren. Es gibt einige, die ganz bewusst ins „Digitale“ einwandern wollen. Andere müssen es zwangsläufig, weil man sonst mit lieben Freunden und Angehörigen gar nicht mehr kommunizieren kann. Der Umgang mit dem Immigrantendasein ist aber häufig nur bedingt vom Alter abhängig, hier sind andere Aspekte regelmäßig viel wichtiger.

PS: Ich selbst bin NDN und der Blog dient ja auch ein wenig dazu, meine Einwanderung zu forcieren.

Muss das denn sein? (22. Türchen)

Na das mit der neuen Technologie und so weiter?

Die Antwort ist relativ einfach und vielfach thematisiert:

Technologie lässt sich nicht aufhalten (- nur gestalten)

Wir können also den Fortschritt ignorieren und versuchen, ihn nicht weiter zu beachten, er wird sich aber den Weg bahnen. Und dann ist es besser ihn mit zu gestalten.

Das hat bereits Friedrich Dürrenmatt in seinen „Physikern“ beschrieben.

Bevor Ihr aber nun den Fortschritt mitgestaltet geht es erst einmal aus den Betten raus und es wird das zweiundzwanzigste Türchen geöffnet.

Hat die Arbeit noch Zukunft? (19. Türchen)

Robotik und Automation reduzieren den Bedarf an typischer Arbeitsleistung.

Auch wenn sich in diesem Zusammenhang neuer Arbeitsbedarf auftut kann man sich leicht vorstellen, dass uns die Arbeit (zumindest für einige von uns) ausgeht.

Die üblichen Bedrohungsszenarien sind hier schnell aufgezeigt (Arbeitslosigkeit, Ungerechtigkeit, totalitäres Regime, …). Aber interessant ist in diesem Zusammenhang auch ein Szenario, das Benedikt Herles zeichnet, der den geringeren Bedarf an Arbeitsleistung in klassischen Bereichen verbindet mit dem Bedarf an Arbeitskräften im Sozialen Bereich und der Disksussion um das Grundeinkommen. Sein Vorschlag ist ein bedingtes Grundeinkommen, das an Engagement im Sozialen gebunden ist. Sein Vorschlag geht auch auf die Finanzierungsansätze dazu ein. Mehr dazu in einem Gespräch mit ihm.

Einen weniger radikalen Ansatz verfolgt eine Beratungsgesellschaft in Bielefeld mit einer 25 Stundenwoche (bei vollem Gehalt). Hier geht es allerdings um maximale Effizienz in den 5 Stunden und das Vermeiden von Störungen.

Bevor Ihr aber nun an Eure Arbeit geht erstmal raus aus den Betten und das neunzehnte Türchen öffnen!