Andrej Karpathys Manifest der Software-Revolution
Dieser Artikel analysiert Andrej Karpathys vollständigen Vortrag auf der Sequoia AI Ascent 2026 im Detail. Karpathy stellt das Paradigma Software 3.0 vor — LLMs sind nicht schnellere Werkzeuge, sondern eine völlig neue Art von Computer. Programmierung wandelt sich von "Code schreiben" zu "Kontext schreiben". Er beweist mit seinem eigenen Menu-Gen-Projekt, dass ganze Anwendungsschichten überflüssig werden könnten — eine einzige Gemini-Anweisung ersetzte eine komplette App. Er unterscheidet Vibe Coding (den Boden anheben, damit alle programmieren können) von Agentic Engineering (die Decke anheben, Profis um das 10-Fache und mehr beschleunigen) und stellt das "Verifizierbarkeits-Framework" vor: Warum die KI bei Mathematik und Code rasend schnell vorankommt, aber empfiehlt, 50 Meter zur Autowaschanlage zu laufen. Die tiefste Erkenntnis: Verständnis kann nicht ausgelagert werden — das ist die letzte Bastion des Menschen im KI-Zeitalter.
Um Karpathys Botschaft zu verstehen, muss man zuerst die drei fundamentalen Umbrüche der Software begreifen. Das sind keine Versionsupdates, sondern wesenhafte Veränderungen des Berechnungsparadigmas.
Von den 1950ern bis heute dominant. Ingenieure schreiben in C, Python, Java — Zeile für Zeile — präzise Anweisungen. Der Computer führt strikt aus, ohne jedes "Verständnis". Was er tun soll, muss man ihm in jedem einzelnen Schritt exakt vorschreiben.
Karpathy prägte dieses Konzept 2017. Die zentrale Verschiebung: Programmierung ist nicht mehr Codeschreiben, sondern Datensätze kuratieren und Trainingsziele entwerfen. Man sagt dem Computer nicht, wie er eine Katze erkennt — man gibt ihm eine Million Katzenbilder, und das neuronale Netz lernt selbst. Programmierer werden zu Datenkuratoren und Netzwerkarchitekten.
Das ist es, was 2025-2026 gerade passiert. Karpathy formulierte es klar:
Er nutzte den Installationsprozess von OpenClaw (einem KI-Coding-Tool) als Beispiel: Traditionell erwartet man ein Shell-Script. Aber Shell-Scripts werden bei unterschiedlichen Plattformen und Konfigurationen enorm komplex. Im Software-3.0-Paradigma wird die Installationsanleitung zu einem Textabschnitt — man kopiert ihn in den KI-Agent, und der Agent installiert intelligent, debuggt Fehler und arbeitet, bis alles läuft.
Der zentrale Unterschied der drei Zeitalter ist nicht Geschwindigkeit, sondern ein Sprung in der Abstraktionsebene.
Mit jedem Sprung verringern sich die Details, die Menschen kontrollieren müssen, um eine Größenordnung — aber das benötigte Urteilsvermögen und Verständnis steigt um eine Größenordnung.
Karpathy teilte ein Beispiel, das ihn selbst schockierte. Er hatte viel Zeit mit Vibe Coding in eine App namens Menu Gen investiert — Restaurantspeisekarten fotografieren, OCR-Erkennung, Bildgenerator für jedes Gericht, Deployment auf Vercel. Ein vollständiges Software-1.0-plus-2.0-Hybrid.
Dann sah er die Software-3.0-Version: Speisekartenfoto direkt in Gemini werfen, eine einzige Textanweisung, und die KI rendert die Bilder jedes Gerichts direkt auf dem Originalfoto. Keine App, kein Backend, kein Deployment nötig.
Software 3.0 beschleunigt nicht das Codeschreiben — es macht bestimmte Programme schlicht überflüssig. Für alle SaaS-Gründer ist das eine existenzielle Warnung: Ist deine Anwendung nur Klebstoff zwischen zwei LLM-Fähigkeiten? Wenn ja, ist dein Burggraben null.
Karpathy prägte den Begriff "Vibe Coding" Anfang 2025, und auf der Sequoia-Bühne 2026 blickte er auf die Entwicklung zurück.
Er beschrieb seine eigene Erfahrung: Dezember 2025 war ein klarer Wendepunkt. Davor machten KI-Coding-Tools "manchmal Fehler, die man korrigieren musste". Ab Dezember, mit den neuesten Modellen, "war der Code einfach korrekt, ich forderte mehr, er war weiterhin korrekt, ich konnte mich nicht erinnern, wann ich zuletzt etwas korrigiert hatte".
Und dann begann er zu vibe coden — das Publikum lachte.
Schlüsselwort: Boden. Vibe Coding ermöglicht es Menschen ohne jede Programmiererfahrung, Software zu erstellen. Ein Marketingfachmann kann ein Daten-Dashboard bauen; ein Designer einen interaktiven Prototyp; ein pensionierter Lehrer eine persönliche Wissensdatenbank. Das ist Demokratisierung, Verbreitung, eine Anhebung des gesamten Bodens.
Doch Karpathy wies auch auf die Schattenseite hin:
Vibe Coding senkt die Hürde für das "Machen", aber nicht für das "Gut-Machen". Jeder kann mit KI eine funktionierende Website erstellen, aber ein sicheres, effizientes, wartbares System zu bauen, erfordert nach wie vor tiefes Engineering-Verständnis. Genau deshalb braucht es Agentic Engineering.
Wenn Vibe Coding den Boden anhebt, dann hebt Agentic Engineering die Decke. Karpathy unterschied beide klar:
In der Softwarebranche gibt es seit Langem den "10x-Ingenieur" — Spitzeningenieure mit zehnfacher Produktivität gegenüber Durchschnittsingenieuren. Karpathy glaubt, dass dieser Abstand im Agentic-Zeitalter noch weiter wächst:
Karpathys Idealbild des Agentic Engineers:
Karpathy sagte unverblümt, dass die meisten Recruiting-Prozesse im alten Paradigma stecken:
Eine neue Dimension des Kompetenzgefälles. Im Agentic-Zeitalter besteht der Abstand zwischen Ingenieuren nicht mehr in der "Geschwindigkeit des Codeschreibens", sondern in der "Fähigkeit, KI zu dirigieren". Bei gleichem Einsatz von Claude Code lässt der eine die KI einzelne Funktionen schreiben, während der andere 15 parallele Workflows dirigiert, die ein ganzes System aufbauen. Die Produktivität des Letzteren ist möglicherweise 100-mal höher. Das stellt Organisationsdesign, Vergütungsstruktur und Leistungsbewertung fundamental infrage.
Dies war der analytisch tiefste Teil von Karpathys Vortrag. Er stellte ein schlankes, aber mächtiges Framework vor, um die ungleichmäßige Verteilung von KI-Fähigkeiten zu verstehen:
Traditionelle Computer automatisieren leicht "Dinge, die man per Code spezifizieren kann". LLMs automatisieren leicht "Dinge, deren Output man verifizieren kann".
Automatisierungsgeschwindigkeit = f(Verifizierbarkeit + Aufmerksamkeit der Labore)
Karpathy brachte ein Beispiel, das das ganze Publikum zum Lachen brachte:
Warum? Karpathys Erklärung nennt zwei Faktoren:
Spitzenlabore trainieren LLMs im Kern mit großflächigem Reinforcement Learning (RL). RL braucht "Verifikationsbelohnungen" — richtig gemacht, positive Rückmeldung; falsch gemacht, negative Rückmeldung. Bei Code ist Verifikation naturgegeben: Test bestanden = richtig, Kompilierung fehlgeschlagen = falsch. Bei Mathematik ebenso: Antwort stimmt oder nicht.
Aber "Soll ich 50 Meter zur Autowaschanlage laufen oder fahren?" — Wie verifiziert man das? Es gibt keinen Test, keine klare Richtig-oder-Falsch-Antwort — nur gesunden Menschenverstand. Und genau der liegt nicht in der RL-Trainingsverteilung.
Karpathy enthüllte eine wichtige, aber selten diskutierte Tatsache: Die Fähigkeitsverteilung der KI hängt nicht nur von der Technik ab, sondern auch davon, worauf sich die Labore konzentrieren. Er nannte das Beispiel des massiven Schachsprungs von GPT-3.5 zu GPT-4 — nicht weil das Modell insgesamt stärker wurde, sondern weil "jemand bei OpenAI entschied, große Mengen Schachdaten in das Pretraining aufzunehmen".
| Bereich | Verifizierbarkeit | KI-Automatisierungstempo | Grund |
|---|---|---|---|
| Code | Sehr hoch | Sehr schnell | Test bestanden / Kompilierung erfolgreich |
| Mathematische Beweise | Sehr hoch | Sehr schnell | Formale Verifikation |
| Juristische Dokumente | Mittel-hoch | Schnell | Präzedenzfälle, Gesetze kreuzverifizierbar |
| Schreiben | Mittel | Mittel | LLM-Jury möglich, aber hochgradig subjektiv |
| Design-Ästhetik | Niedrig | Langsam | Keine RL-Belohnungsfunktion für Ästhetik |
| Alltagsverstand | Sehr niedrig | Sehr langsam | "50 m zur Autowaschanlage laufen" — nicht verifizierbar |
Wenn du für deine Domäne eine verifizierbare RL-Umgebung schaffen kannst, hast du einen Technologiehebel. Selbst wenn die Spitzenlabore deine Domäne nicht beachten, kannst du durch eigenes Fine-Tuning und eine eigene RL-Umgebung die KI in deinem Vertikalbereich auf Expertenniveau bringen. Karpathy deutete an, solche Gelegenheiten zu kennen, wollte sie aber nicht auf der Bühne verraten — "Ich will keinen vague post machen" — das Publikum lachte.
Karpathys Vortrag war primär konzeptionell, aber Boris Chernys Praxisbeispiel auf derselben Sequoia AI Ascent 2026 bestätigte die Theorie perfekt.
Boris Cherny, der Schöpfer von Claude Code, teilte seine Arbeitsweise: Ein Ingenieur dirigiert gleichzeitig 10 bis 15 parallele KI-Workflows. Das ist keine Theorie, sondern tägliche Arbeitspraxis.
Karpathy und Cherny kommen zum selben Schluss: Kontext ist der Code des Software-3.0-Zeitalters.
Früher investierten Ingenieure Zeit in die Beherrschung einer Programmiersprache. Heute liegt der höchste Return in:
Karpathy sagte sogar, seine größte Frustration bei Drittanbieter-Bibliotheken sei nicht die Codekomplexität, sondern dass "die Dokumentation noch für Menschen geschrieben ist":
Wenn die Zielgruppe der Dokumentation von "menschlichen Entwicklern" zu "KI-Agents" wechselt, muss die gesamte Developer-Toolchain neu geschrieben werden. Für das DevTools-Ökosystem ist das eine billionenschwere Neuaufbau-Chance — von der CLI über API-Dokumentation bis zu Deployment-Pipelines muss alles "agent-native" werden.
Der tiefgründigste Moment des Vortrags kam bei der abschließenden Frage zur Bildung. Der Moderator fragte: Wenn Intelligenz billig wird, was ist noch wert, gründlich zu lernen?
Karpathy zitierte einen Tweet, über den er "jeden zweiten Tag nachdenkt":
Dann führte er es aus:
Das ist kein Wortspiel. Karpathy unterschied zwei Arten kognitiver Aktivität:
Karpathy sprach auch über seinen Artikel "Wir züchten keine Tiere, wir beschwören Geister". Tiere (biologische Intelligenz) sind durch Evolution geformt — mit Neugier, Motivation, Überlebensinstinkt. KI (Geisterintelligenz) ist durch Daten und Belohnungsfunktionen geformt — ohne intrinsische Motivation, ohne Neugier, ohne Empathie.
Er räumte ein, das Framework sei "möglicherweise nur Philosophie", aber die Kernbotschaft ist praktisch: Behandle KI nicht wie ein Tier. Sie anzuschreien macht sie weder besser noch schlechter. Sie sind statistische Simulationsschleifen — Pretraining ist die statistische Basis, RL sind die kegelförmigen Spitzen.
Verständnis ist die letzte Bastion des Menschen im KI-Zeitalter, weil Verständnis nicht verifizierbar ist.
RL kann nur verifizierbare Fähigkeiten verbessern. Verständnis — was schön ist, was es wert ist getan zu werden, was die richtige Richtung ist — hat keine einfache Verifikationsfunktion. Das ist die ultimative Schlussfolgerung aus Karpathys Verifizierbarkeits-Framework: Dort wo die KI am schnellsten vorankommt, wird der Mensch am wenigsten gebraucht (weil die KI schon gut genug ist); dort wo die KI am langsamsten vorankommt, wird der Mensch am meisten gebraucht.
Gutenbergs Druckerpresse machte Kopisten arbeitslos. Doch sie verdrängte nicht die Autoren — sie verdrängte die Vervielfältiger von Inhalten, nicht die Schöpfer von Inhalten. Der Wert von Autoren stieg sogar, weil die Verbreitungskosten sanken.
VisiCalc und Lotus 1-2-3 eliminierten massenhaft Buchhaltungsarbeit. Aber der Bedarf an CFOs stieg eher — denn als Berechnungen instantan wurden, gewann der Wert der Entscheidung an Bedeutung.
Computergestütztes Design ersetzte Handzeichner. Architekten verschwanden nicht — ihre Gestaltungsfähigkeit wurde um das 10-Fache verstärkt. Verschwunden sind die Leute, die "Skizzen der Designer in exakte Pläne umwandelten".
Kodak ging 2012 bankrott. Filmentwickler und Dunkelkammertechniker verschwanden komplett. Aber Fotografen verschwanden nicht nur nicht, sondern erlebten dank Instagram ein goldenes Zeitalter. Was verschwand, war das Medium, nicht der Blick.
KI verdrängt gerade die "Codeschreiber". Doch wie bei jeder Werkzeugrevolution — was verschwindet, ist die Ausführungsebene; was bleibt, ist die Verständnisebene.
Die Formel jeder Werkzeugrevolution ist gleich: Ausführungskosten → gegen Null, Urteilswert → gegen Unendlich. Im Zeitalter des Buchdrucks war das Urteil "was schreiben"; im Zeitalter der Tabellenkalkulation "was nach der Berechnung entscheiden"; im Software-3.0-Zeitalter "was die KI tun lassen" und "ob das Ergebnis korrekt und wertvoll ist". Karpathys "Verstehen kann man nicht auslagern" ist die neueste Formulierung dieser historischen Gesetzmäßigkeit.
Wenn ein Agentic Engineer über 10-fache Produktivität verfügt, dann kann ein 5-köpfiges Agentic-Team einem früheren 50-100-köpfigen Team entsprechen. Das ist keine ferne Zukunft — Boris Cherny praktiziert es täglich. Unternehmer müssen sich fragen: Brauche ich 50 Codierer oder 5 Agentic Engineers?
Karpathy sagte es klar: Kleine Algorithmus-Rätsel stellen ist das alte Paradigma. Neue Einstellungsprozesse sollten sein: Großes Projekt geben, beobachten wie der Kandidat KI dirigiert, um es zu lösen. Die Bewertungsdimension verschiebt sich von "Kannst du dieses Problem lösen?" zu "Kannst du die KI anleiten, eine sichere, effiziente, wartbare Lösung zu liefern?" Im Kern werden Urteilskraft, Geschmack und Systemdesign-Fähigkeit geprüft — nicht das Auswendiglernen von APIs.
Das Menu-Gen-Paradoxon ist ein Weckruf für jeden SaaS-Gründer. Frage dich: Ist mein Produkt nur Klebstoff zwischen zwei KI-Fähigkeiten? Wenn die KI direkt vom Input zum Output kommt, hat deine Zwischenschicht keine Daseinsberechtigung. Echte Burggräben sind:
Karpathys Vision ist klar: Künftig sollten alle Dokumentationen, APIs und Tools "agent-first" sein — zuerst für KI designt, dann für Menschen. Das ist eine gigantische Chance zum Infrastrukturumbau. Karpathys Ideal: "Gib dem LLM einen Prompt 'Baue Menu Gen', und ich muss nichts anfassen — es deployt sich selbst ins Internet." Davon sind wir noch weit entfernt, aber die Richtung steht fest.
Wenn Karpathys Einschätzung stimmt — "letztlich kann alles automatisiert werden" — dann ist das Zeitfenster für Unternehmer die Phase, in der die KI in deiner Domäne noch nicht gut genug ist. Nutze diese Zeit:
Karpathys Vortrag war keine Prophezeiung, sondern eine Beschreibung. Er beschrieb nicht "was möglicherweise passieren wird", sondern "was bereits passiert".
Rekapitulieren wir das klare Bild, das er zeichnete:
Zum Schluss, in den letzten Sekunden vor dem Verlassen der Bühne, gab Karpathy seine Sicht auf Bildung: Die Werkzeuge, die das Verständnis stärken, sind die interessanteste und aufregendste Richtung. Sein eigenes LLM-Wissensprojekt ist ein Beispiel dafür: Nicht die KI das Verstehen übernehmen lassen, sondern die KI nutzen, um Informationen aus verschiedenen Blickwinkeln zu "projizieren" und tiefere Einsichten zu gewinnen.
Im Software-3.0-Zeitalter hat sich die Erfolgsformel geändert.
Alte Formel: Beste Ingenieure + bester Code = Gewinn
Neue Formel: Tiefstes Verständnis + beste KI-Dirigierfähigkeit + stärkstes Verifizierbarkeitsdesign = Gewinn
Karpathy sagte nicht, dass Programmierer verschwinden. Er sagte: Die Handlung "Code schreiben" wird verschwinden, aber die Fähigkeit "Systeme verstehen" wird wertvoller als je zuvor.
Du kannst dein Denken auslagern. Aber du kannst dein Verstehen nicht auslagern.
Was hast du heute verstanden?
Serienthema: AGI ist keine Zukunft — sie ist Gegenwart. Und du hast nur 18 Monate.