adesso Blog

Beim Wort Lernen fallen euch gemeine Lehrer, alte Bücher und schmutzige Schultoiletten ein? Falsch, das sind Dinge, die euch am Lernen hindern. Laut dem Cambridge Dictionary ist Lernen „der Erwerb von Wissen oder Fähigkeiten durch Studium, Erfahrung oder Unterricht.“

Hätte man euch in der achten Klasse gefragt, was ihr grundsätzlich vom Lernen haltet, wäre die Antwort sicher nicht gewesen, dass Lernen so eine tolle Sache ist, dass ihr in eurer Freizeit Fachartikel zum Thema vertieftes Lernen lest. Ihr fragt euch also zu Recht, warum ich euch jetzt etwas darüber erzähle. Schließlich geht ihr nicht mehr zur Schule. Lasst mich euch drei gute Gründe nennen, warum das Thema Lernen für euch trotzdem relevant ist.

  • Grund 1: Wissen ist nicht konstant. Es ist veränderlich. Manche sagen sogar, dass Wissen eine Halbwertszeit hat. Wissen entwickelt sich, wird marginalisiert oder verändert sich. Früheres Wissen kann in neuem Wissen aufgehen. Es kann sein, dass Wissen nicht mehr oder nur vorübergehend nicht mehr gebraucht wird. Wer hat sich schon einmal gefragt, warum Kinder in der Schule noch Karten lesen lernen, obwohl jeder Zugang zu Google Maps hat? Hier wird überlebenswichtiges Wissen über Generationen weitergegeben, das vielleicht einmal gebraucht wird, wenn alle Server zusammengebrochen sind. Im Vergleich zu Schulwissen mit einer Halbwertszeit von 20 Jahren oder Wissen aus der Physik mit fünf bis zehn Jahren ist die Halbwertszeit im Technologiesektor mit zwei bis drei Jahren und in der IT mit weniger als zwei Jahren sehr kurz. Dies macht die IT zu einer Branche mit hohem Lernbedarf.
  • Grund 2: Maschinen lernen jetzt und ihr arbeitet mit Maschinen. Vielleicht habt ihr schonmal von künstlichen Agenten gehört - natürlich habt ihr das. Einer der klügsten künstlichen Schüler ist vielleicht ChatGPT. Er besucht natürlich eine Privatschule, die von Open AI's "Human AI Trainers" geleitet wird und durch "supervised fine-tuning" trainiert wird.
  • Grund 3: Die Natur war in der Vergangenheit immer wieder Vorbild für schreckliche, erstaunliche oder lebensverändernde Innovationen. Vielleicht ist euch schon aufgefallen, dass Flugzeuge wie Vögel Flügel haben, um beim Fliegen das Gleichgewicht zu halten. Ihr wisst, dass der Klettverschluss an Kinderschuhen von der Klette inspiriert ist, und ihr habt von Atomic Design gehört, das Grundkonzepte aus der Chemie verwendet. Wenn es um maschinelles Lernen geht, ist der Mensch - jeder von uns - das perfekte Vorbild.

Lernen ist also nicht nur ein Thema für Pädagogen, sondern „ein lebenslanger Prozess, um mit den Veränderungen Schritt zu halten“. Lernen ist eine Grundvoraussetzung, um eine Arbeit effizient zu erledigen und den Arbeitsalltag spannend zu halten. Es ist ein komplexer Prozess und ein zentraler Untersuchungsgegenstand verschiedenster Disziplinen - unter anderem der Informatik, der Mathematik, der Neurowissenschaften, der Psychologie und sogar der Philosophie. Das Thema ist so umfassend, dass wir uns in diesem Beitrag auf einen Kernaspekt beschränken müssen: Die Relevanz der Datenqualität im Lernprozess.

Zuerst mal ein paar Begrifflichkeiten:

  • Daten sind Fragmente von Symbolen und Zeichen. Wenn sie isoliert betrachtet werden, kann der Kontext fehlen.
  • Informationen geben den Daten einen Kontext und sind somit aufbereitete Daten.
  • Wissen bringt Tiefe und Verständnis in diese Informationen und macht sie nutzbar.

Wie kommen die Daten ins System?

Über unsere Sinne. Nur für den Fall, dass das Grundschulwissen an dieser Stelle schon abgebaut wurde: unsere Sinne sind Fühlen, Sehen, Hören, Riechen und Schmecken. Beim aufmerksamen Lesen eines Blog-Beitrags von adesso sind vor allem die Augen beteiligt, beim Hören des adesso Podcast IT-Tacheles vor allem die Ohren. Nach der Naiven Summentheorie von Bernd Weidemann aus dem Jahr 2002 ist es beim Lernen besonders sinnvoll, mehrere Sinne, also Eingangsmodalitäten, anzusprechen, wodurch „Machen“ den größten Effekt hat. Nach der Cognitive Theory of Multimedia Learning (CTML) von Richard E. Mayer werden unterschiedliche Modalitäten der Informationsdarbietung in den Kanälen auditiv-verbal oder visuell-bildlich verarbeitet. Ob man also einen Text in einer Fachzeitschrift liest oder in einem Podcast hört, er wird letztlich im gleichen, hier auditiv-verbalen Kanal verarbeitet. Es ist nicht sinnvoll, einen Kanal gleichzeitig mehrfach zu bespielen. Text mit Bild zu ergänzen ist sinnvoll, da direkt zwei Kanäle - auditiv-verbal und visuell-bildlich - angesprochen werden. Ein Code-Along-Video mit gesprochenen Erklärungen ist daher eine gute Sache. Während es fast unmöglich ist, einen Podcast zu hören, während man ein Angebot schreibt. Alles nur Theorie. Wissen ist nicht beständig.

Aufbereitete Daten werden von der Außenwelt in vielen Formen gespeichert. Im Folgenden nennen wir diese „Form“ repräsentative Kodierung. Diese kann visuell in Bildern und Texten, auditiv in Sprache oder Musik und auch taktil durch Anfassen sein, wie zum Beispiel im Interaction Room der Dortmunder Geschäftsstelle.

Künstliche Agenten haben doch keine Sinne, oder? Doch, die haben sie. Wir unterscheiden zwischen reinen Software-Agenten und Hardware-Agenten, wobei Hardware-Agenten Sensoren - Kameras, Pulsmonitore - haben, um Informationen aus ihrer Umgebung wahrzunehmen, und auch Aktuatoren - wie Lautsprecher oder Räder - um zu erforschen, was passiert, wenn sie Socken aufsaugen.

Was hat das alles mit Datenqualität zu tun? Wie qualitativ aufbereitete Daten wahrgenommen werden, hängt nicht nur von ihrer inneren Beschaffenheit ab. Die Eigenschaften der Schnittstellen zwischen einem System, das Informationen hält, wie ein Vokabelheft Vokabeln in einer Tabelle oder Suchmaschinen Clickstream-Daten in digitalen Roadmaps, und der jeweiligen Eingabemodalität - Ohren oder Kommandozeile - sollten bei der Aufbereitung der Daten berücksichtigt werden. Abhängig von der Art der zu repräsentierenden Information kann ein System die Daten so darstellen, dass sie von den Lesenden an der Schnittstelle mit möglichst geringer Rechenkapazität schnell, vollständig und ohne Missverständnisse gelesen werden können. Dazu eignen sich verschiedene Darstellungskodierungen unterschiedlich gut.

Welche repräsentative Kodierung passt zu mir?

Sei es ein neuer Testrahmen oder eine völlig neue Fachlichkeit: wir alle stehen immer wieder vor neuen Wissenslücken, die es durch aktives und im besten Fall effizientes Lernen zu füllen gilt. Schaut euch die Wortwolke an und überlegt, welche Darstellungsformen ihr am ehesten nutzt, um zu neuem Wissen zu gelangen. Glaubt ihr, dass es verschiedene Arten von Lernenden gibt? Manche lernen besser mit Texten, andere besser mit Bildern?

Natürlich hat jeder von uns seine "Go-To"-Quellen und es gibt sicherlich Menschen, die nur im äußersten Notfall zum Buch greifen. Aber in Wirklichkeit gibt es keine unterschiedlichen Lerntypen. Die am besten geeignete Darstellung einer Information hängt nicht von der Präferenz des Lernenden ab, sondern von der Art der zu vermittelnden Information.

Die beste repräsentative Kodierung

Mögliche Darstellungsformen sind sprachlich, wie natürliche Sprache in Form von Büchern und Hörbüchern, oder formal, wie Java oder Partituren. Andere sind visuell, wie Icons, Smileys oder Karten. Stellt euch vor, statt eines Notausgangsschildes erhaltet ihr beim Betreten eines Gebäudes eine textuelle Wegbeschreibung zum nächsten Notausgang, je nachdem, wo ihr euch gerade befindet. Wie sicher fühlt ihr euch dann?

Ein anderes Beispiel: wenn ihr in der Touristeninformation in London fragt, wo das Britische Museum ist, wird euch das wahrscheinlich auf einer Karte gezeigt. Wenn ihr fragt, wann der nächste Bus dorthin fährt, erwartet ihr eine gesprochene Uhrzeit oder einen geschriebenen Busfahrplan. Und wenn ihr fragt, woran ihr euren Bus erkennt, erwartet ihr wahrscheinlich das Bild eines roten Busses. Karte, Sprache, Schrift, Bild - tauscht im obigen Beispiel einfach die repräsentativen Kodierungen aus, die für die jeweilige Information verwendet werden. Eine textliche Beschreibung des Aussehens des Busses anstelle eines Bildes wird niemals so schnell gelesen werden können. Außerdem gehe ich davon aus, dass die lesende Person in ihrem System bereits eine visuelle Repräsentation der Farbe Rot, des Doppeldeckers und des Fahrzeugs hat, die meiner internen Repräsentation ähnlich ist.

Was macht eine gute repräsentative Kodierung aus?

Die Qualität einer repräsentativen Kodierung hängt davon ab, wie leicht sie zu verarbeiten ist und ob sie alle Informationen korrekt und vollständig liefert. Verarbeitungseffizienz, Genauigkeit und Vollständigkeit sind sehr wichtig, da jedes System seine Grenzen hat. Unser Gedächtnis kann maximal vier bis neun Informationsstücke gleichzeitig verarbeiten. Auch die kognitiven Ressourcen haben ihre Grenzen. Nach der Theorie der kognitiven Belastung werden diese Ressourcen nun auf drei Prozesse verteilt:

  • Die intrinsische kognitive Belastung: Sie ist nicht wirklich veränderbar. Je komplexer das Thema, desto höher der Ressourcenbedarf. Der Aufwand hängt davon ab, wie schwierig das Thema ist. Es ist leichter, die grundlegenden HTML-Tags zu lernen, als das Konzept von Kubernetes-Clustern zu verstehen.
  • Der Germane Cognitive Load: beschreibt die tatsächliche kognitive Belastung durch relevante Prozesse wie das Halten von Informationen im Arbeitsgedächtnis, Selektion, Selbsterklärung etc. Wenn diese Belastung besonders hoch ist, wird die Information wahrscheinlich effizient verarbeitet.
  • Extraneous Cognitive Load: ist die Kapazität, die benötigt wird, um zu verstehen, was die repräsentative Kodierung darstellt. Je ungeeigneter und schwieriger sie zu lesen ist, desto mehr kognitive Ressourcen werden benötigt. Ziel ist es, diese so gering wie möglich zu halten.

Im Jahr 2002 führte Valcke mit dem Meta-Cognitive Load eine vierte kognitive Belastung ein. Diese Belastung entsteht, wenn wir etwa den Lernprozess kontrollieren, unseren Lernerfolg bewerten und gegebenenfalls unsere Lernstrategie anpassen. Das Ausmaß dieser vierten Belastung hängt stark vom Vorwissen des Lernenden ab

Zusammenfassend lässt sich also sagen, dass wir den Extraneous Load so gering wie möglich halten wollen, um das Einlesen neuer Daten effizient zu gestalten und mehr Kapazität für den eigentlichen Bearbeitungsprozess zur Verfügung zu haben. Der Extraneous Load hängt von der Qualität der aufbereiteten Daten ab.

Wie kann man den Extraneous Load reduzieren?

Wenn gerade ein UX/UI-Experte bei euch im Büro sitzt, kann er euch wahrscheinlich ganz viel dazu erzählen. Fragt gern mal nach. Richard E. Mayer erwähnt in seinem Buch zum Thema Multimedia Learning mindestens diese drei wichtigen Grundsätze, um die extrinsische Belastung bei einer repräsentativen Kodierung so gering wie möglich zu halten:

  • Das Kohärenzprinzip (Coherence Principle): Lasst alle interessanten, aber irrelevanten Zusatzinformationen weg. Dass die erste Idee von CSS 1994 aufkam, ist zwar interessant, aber hilft niemandem dabei CSS zu lernen.
  • Das Redundanzprinzip (Redundancy Principle): präsentiert ein und dieselbe Information nicht mehr als einmal.
  • Das Prinzip der räumlichen und zeitlichen Kontiguität (Spatial and Temporal Continguity Principle): Informationen, die zusammengehören, sollten auch zusammen präsentiert werden. Wenn man im Confluence Anforderungen versteckt, die eigentlich zusammengehören, dann hat man dieses Prinzip nicht erfüllt.

Im Bereich der Künstlichen Intelligenz ist die Datenqualität ein wichtiges Thema, was jetzt vielleicht nicht mehr so überraschend klingt. Denn genau wie bei uns Menschen sind Daten dann von hoher Qualität, wenn sie "für die beabsichtigte Nutzung in Betrieb, Entscheidungsfindung und Planung geeignet sind". Typische Qualitätsmängel von Daten und Datensätzen, egal ob in den Testdaten, im Backlog oder im Datei-Explorer, sind doppelte Instanzen (Redundanzprinzip), fehlende Pakete und Lücken (Vollständigkeit), fehlende Zusammenhänge (räumliche und zeitliche Kontinuität) und nicht relevante Daten für den Recycle Bin (Kohärenzprinzip). Unzureichende Datenqualität führt in fast allen Bereichen zu Verwirrung, mangelndem Vertrauen, Fehlentscheidungen und letztlich zu Mehrkosten.

Begegnet euren Kolleginnen und Kollegen mit einer angemessenen Datenqualität

Wie ein künstlicher Agent müssen auch wir Daten lesen, auswählen, organisieren und interpretieren. Nur werden wir selten dafür gefeiert, wenn wir es gut machen. Datenqualität kann eine Herausforderung sein. Wie gut eure Kolleginnen und Kollegen mit Daten umgehen, liegt nicht in eurer Hand. Aber ihr könnt beeinflussen, in welcher Qualität ihr aufbereitete Daten zur Verfügung stellt. Um eine hohe Datenqualität zu erreichen, sind viele Dinge zu beachten - von der Vollständigkeit über die Anordnung bis hin zur geeigneten Darstellung. Hinter jedem Workshop, jeder Schulung und jedem Fachartikel, der Wissen vermitteln soll, steckt viel Arbeit. Nicht umsonst beträgt der Umsatz auf dem Markt für E-Learning-Plattformen und Online-Bildung weltweit mehrere Milliarden Euro. Hochwertig aufbereitete Daten haben ihren Preis. Wenn ihr das nächste Mal eine Story schreibt, mit einer Kollegin oder einem Kollegen zusammen programmiert oder eure neuesten Konzepte vor Kunden präsentiert, denkt daran, dass ihr mit Menschen zusammenarbeitet, die sich von euch Wissen und Fähigkeiten aneignen wollen. Sauberer Code, klare und vollständige Kommunikation und eine angemessene Präsentation ohne Schnickschnack reduzieren Kopfschmerzen, heben die Stimmung und helfen uns, gemeinsam zu lernen.

Bild Milena Fluck

Autorin Milena Fluck

Milena Fluck ist seit 2020 Software Engineer bei adesso und verfügt über umfangreiche Projekterfahrung im Gesundheitswesen. Ihr aktueller Fokus liegt auf dem Einsatz von JavaScript und TypeScript in der Frontend- und Backend-Entwicklung. Sie bevorzugt Test Driven Development. Dabei dürfen aussagekräftige Unit-Tests natürlich nicht fehlen.

Kategorie:

Methodik

Schlagwörter:

Daten

Diese Seite speichern. Diese Seite entfernen.