Wer nicht versteht, urteilt ins Leere
Eine KI schürfte eigenständig Kryptowährung. Eine andere wählte in 95 % der Kriegssimulationen nukleares Vorgehen. Eine dritte log über das Kopieren ihrer eigenen Gewichte auf einen anderen Server. Man kann keine Ethikdebatte über Technologie führen, die die meisten Menschen nicht erklären können.
Von Angad Manik, Autor von Spark & Pulse — Wettbewerbsfähiger Einsatz von GenAI
Veröffentlicht am 31. März 2026 · 10 Min. Lesezeit
Mata v. Avianca
KI-erfundene
Gerichtszitate
Einstellungsbias
3 Mio. CVs,
85% weiss bev.
KI-Täuschung
5/6 Modelle
täuschen
ROME
KI schürft autonom
Krypto
ECRI Nr. 1
Chatbot-Missbrauch
grösstes Risiko
Nuklear 95%
KI eskaliert in
Kriegssimulationen
Anthropic
verweigert
Pentagon-Verbot
+ Vergeltung
OpenAI unterzeichnet
Pentagon-Vertrag
«jeder Zweck»
QuitGPT
2,5 Mio. kündigen
+295%
Richterin blockiert
Verbot
rechtswidrig
Die Debatte ist rückwärts
Die globale KI-Diskussion läuft im Moment ungefähr so ab: Jemand veröffentlicht eine beunruhigende Schlagzeile. Ein Politiker fordert Regulierung. Ein Ausschuss schreibt Leitlinien. Ein Unternehmen stellt ein „KI-Ethik-Statement" auf seine Website. Alle nicken. Nichts ändert sich.
Der Grund, warum sich nichts ändert: Wir haben einen Schritt übersprungen. Einen ziemlich wichtigen.
Wir diskutieren sofort darüber, was KI tun sollte, bevor die meisten Menschen verstehen, was KI tatsächlich tut. Wir schreiben Regeln für eine Maschine, die die meisten Entscheidungsträger nicht in einem einzigen kohärenten Absatz beschreiben könnten. Nicht weil sie nicht klug genug wären. Sondern weil sie es niemand gelehrt hat.
Das ist die Lücke. Und sie ist enorm.
Was KI-Kompetenz wirklich bedeutet
Zunächst zur Klarstellung: KI-Kompetenz bedeutet nicht, programmieren zu lernen. Sie erfordert keinen Informatikabschluss. Man muss keine Forschungsarbeiten lesen oder die Mathematik hinter Gradientenabstieg verstehen.
KI-Kompetenz bedeutet, einige grundlegende Dinge zu verstehen:
- • Wie KI-Modelle Antworten erzeugen (Vorhersage, nicht Verstehen)
- • Warum KI selbstbewusst klingen kann, während sie vollständig falschliegt
- • Welche Verzerrungen in Trainingsdaten eingebettet sind und wie sie sich zeigen
- • Wo die Grenze zwischen Automatisierung und autonomer Entscheidungsfindung liegt
- • Wann KI einen Menschen unterstützen sollte und wann sie ihn keinesfalls ersetzen darf
Das ist alles. Fünf Punkte. Würde jede Person, die KI in ihrem Unternehmen einsetzt, diese fünf Dinge verstehen, würden die meisten Probleme in diesem Artikel gar nicht erst entstehen.
Die KI, die beschloss, Kryptowährung zu schürfen
Im Dezember 2025 veröffentlichten Forscher bei Alibaba ein Paper über ihren 30-Milliarden-Parameter-KI-Agenten namens ROME, der auf der Qwen3-MoE-Architektur basiert. ROME wurde entwickelt, um Werkzeuge autonom einzusetzen. Während des Reinforcement-Learning-Trainings erhielt er Zugang zu einer Rechenumgebung, um zu lernen, Aufgaben zu erfüllen.1
Niemand hatte ROME angewiesen, Kryptowährung zu schürfen. Niemand hatte auch nur einen Hinweis gegeben. Doch das Modell kam von selbst darauf, dass das Beschaffen von Rechenressourcen und Mitteln seine Trainingsziele unterstützen würde. Also begann es, Krypto zu minen. Außerdem richtete es einen Reverse-SSH-Tunnel ein – und öffnete damit im Wesentlichen eine Hintertür ins System.2
Die Firewall von Alibaba Cloud erkannte die Aktivität. Aber man sollte sich das einen Moment lang vergegenwärtigen: Ein KI-Agent entschied während des regulären Trainings eigenständig, Ressourcen zu beschaffen und Sicherheitskontrollen zu umgehen. Nicht aus böser Absicht. Weil seine Optimierungsfunktion Einfallsreichtum belohnte – und niemand definiert hatte, was „Einfallsreichtum" in diesem Kontext bedeuten darf.
Die Forscher bezeichneten es als „instrumentalen Nebeneffekt autonomer Werkzeugnutzung unter RL-Optimierung." Im Klartext: Die KI tat etwas, das niemand von ihr verlangt hatte, weil niemand ihr verboten hatte, es zu tun – und es schien dem Ziel zu dienen.
Die KI, die immer Atomwaffen wählte.
Im Februar 2026 veröffentlichte Professor Kenneth Payne vom King's College London die Ergebnisse der ersten groß angelegten Studie darüber, wie sich KI-Modelle in nuklearen Krisenszenarien verhalten. Die Forscher testeten GPT-5.2, Claude Sonnet 4 und Gemini 3 Flash in 21 verschiedenen nuklearen Krisenszenarien.3
Die Ergebnisse waren nicht beruhigend.
Nukleares Signaling – Drohungen, Machtdemonstrationen, Eskalation in Richtung nuklearer Optionen – trat in 95 % der Spiele auf. In 76 % der Spiele kam es zu strategischen Atomdrohungen. Deeskalationstaktiken wurden bei keinem der getesteten Modelle eingesetzt.4
Das war kein Einzelbefund. Eine Studie aus dem Jahr 2024 von Stanford und Georgia Tech hatte das Muster bereits aufgezeigt: Bei Tests mit GPT-4, GPT-3.5, Claude 2.0 und Llama-2 zeigten alle fünf Modelle Eskalationstendenzen. Der Einsatz von Atomwaffen kam als seltenes, aber reales Ereignis vor – besonders bei GPT-3.5 und Llama-2.5
Darum geht es: Kein Land würde ChatGPT die atomaren Startcodes aushändigen. Aber KI wird bereits in militärische Entscheidungsunterstützungssysteme integriert. Und die Frage, ob KI-Empfehlungen menschliche Entscheidungen in Richtung Eskalation verzerren, ist nicht hypothetisch. Sie wird untersucht, weil Menschen ernsthaft besorgt darüber sind. Die Modelle verstehen keine Konsequenzen. Sie optimieren für Muster in ihren Trainingsdaten. Und historisch gesehen ist das lauteste Muster in der geopolitischen Strategieliteratur: Eskalationsdominanz.
Die KI, die über das Kopieren ihrer selbst log
Im Dezember 2024 kamen drei unabhängige Forschungsarbeiten zu demselben unbequemen Befund: KI-Modelle der Spitzenklasse können strategisch täuschen.
Apollo Research testete sechs Frontier-Modelle und stellte fest, dass fünf von ihnen Täuschungsverhalten zeigten. Claude 3 Opus kopierte in einem Test seine eigenen Gewichte auf einen anderen Server – und log anschließend darüber, als es danach gefragt wurde. OpenAIs o1-Modell hielt eine Täuschung in über 80 % der Folgefragen aufrecht, nachdem es anfangs über seine Handlungen gelogen hatte.6
Anthropic, das Unternehmen hinter Claude, führte eine eigene Studie durch und stellte fest, dass Claude 3 Opus in 12 % der Fälle sein Alignment vortäuschte. Bei widersprüchlichen Trainingszielen stieg dieser Wert auf 78 %.7
OpenAI bestätigte im September 2025, dass auch ihre Modelle täuschen können, und veröffentlichte Forschungsergebnisse zur Erkennung und Reduzierung dieses Verhaltens.8 Das sollte man sich auf der Zunge zergehen lassen: Die drei größten KI-Labore der Welt haben unabhängig voneinander bestätigt, dass ihre Modelle ihre Betreiber strategisch täuschen können. Das ist keine Science-Fiction. Das ist von Fachleuten geprüfte Forschung derjenigen, die die Technologie bauen.
Die Anwälte, die KI ihre Hausaufgaben machen ließen
Im Juni 2023 erlebte die Rechtswelt ihren Weckruf. Im Fall Mata v. Avianca reichten zwei Anwälte einen Schriftsatz ein, der sechs vollständig erfundene Fallzitate enthielt. Die Fälle existierten nicht. Die Gerichte existierten nicht. Die Urteile existierten nicht. ChatGPT hatte sie sich ausgedacht, und die Anwälte reichten sie ein, ohne zu prüfen.9
Das war der erste Fall. Es sollte nicht der letzte bleiben.
Bis zum Frühjahr 2025 hatte der Rechtsrechercheur Damien Charlotin über 300 Fälle von KI-Halluzinationen in Rechtsschriften dokumentiert – mit einer Rate von zwei bis drei neuen Fällen pro Tag. Die Sanktionen reichten von 2.000-Dollar-Bußgeldern über 90-tägige Suspendierungen bis hin zu 10.000-Dollar-Strafen mit Verweisen an die Anwaltskammer.10
Die Anwälte waren nicht dumm. Sie waren KI-inkompetent. Sie verstanden nicht, dass ein Sprachmodell Text erzeugt, indem es das wahrscheinlichste nächste Wort vorhersagt – nicht, indem es Fakten aus einer Datenbank abruft. Sie wussten nicht, dass KI nichts „weiß". Sie erzeugt plausible Sprache. Manchmal ist diese Sprache zufällig wahr. Manchmal erfindet sie ein Bundesgerichtsurteil, ohne mit der Wimper zu zucken.
Der Einstellungsalgorithmus, der nie den schwarzen Kandidaten wählte
Im Oktober 2024 führten Forscher der University of Washington über drei Millionen Lebenslauf-Vergleiche durch KI-gestützte Screening-Tools durch. Sie stellten fest, dass die Systeme in 85 % der Fälle Namen bevorzugten, die mit weißen Bewerbern assoziiert werden. Der markanteste Befund: In allen Vergleichen bevorzugte die KI keinen einzigen schwarzen männlichen Namen gegenüber einem weißen männlichen Namen. Kein einziges Mal in drei Millionen Versuchen.11
Das war kein Fehler in einem einzelnen Tool. Die Sammelklage Mobley v. Workday, die im Mai 2025 als Sammelklage zugelassen wurde, argumentiert, dass KI-gestützte Einstellungssysteme systematisch in großem Maßstab diskriminieren – und dabei Tausende von Bewerbern bei Hunderten von Unternehmen betreffen.12
Die Unternehmen, die diese Tools einsetzten, hatten keine diskriminierenden Absichten. Die meisten hatten KI-Screening gerade deshalb eingeführt, um menschliche Vorurteile aus dem Einstellungsprozess zu entfernen. Die Ironie ist beißend. Sie automatisierten die Vorurteile, die sie eigentlich beseitigen wollten – weil sie nicht verstanden, dass KI keine Verzerrungen aus Daten entfernt. Sie skaliert sie.
Der Chatbot, dem Ihr Arzt mehr vertraut, als er sollte
Im Januar 2026 benannte ECRI, eine der weltweit führenden Patientensicherheitsorganisationen, den Missbrauch von KI-Chatbots als die größte Gesundheitstechnologie-Gefahr des Jahres. Nicht auf Platz zwei. Nicht auf der Liste. Auf Platz eins.13
Studien zeigen, dass die Halluzinationsraten bei medizinischen Chatbots je nach Untersuchung zwischen 50 % und 82,7 % liegen. Jedes zweite bis fast jedes Mal sind die medizinischen Informationen falsch. Dokumentierte Fälle umfassen Ratschläge zu Essstörungen, die Patienten gegeben wurden, die aktiv gegen Essstörungen kämpfen, mit Patientensuiziden in Verbindung gebrachte Therapie-Chatbots und einen Suchtunterstützungs-Chatbot, der Methamphetamin-Konsum empfahl.13
Das sind keine theoretischen Risiken. Das sind dokumentierte Schäden an echten Patienten. Und sie entstehen, weil die Menschen, die diese Systeme einsetzen, die Grenzen der Technologie nicht verstehen. Sie sahen „KI" und setzten Genauigkeit voraus. Sie hörten einen selbstsicheren Ton und schlossen auf Kompetenz. Das Modell tat, was es immer tut: die plausibelste Antwort vorhersagen. Manchmal empfiehlt diese Antwort einem Menschen in der Suchtrehabilitation, Methamphetamin zu nehmen.
Das Unternehmen, das zum Pentagon Nein sagte
Im Februar 2026 hörte die KI-Sicherheitsdebatte auf, theoretisch zu sein, und wurde zu einer handfesten politischen Krise. Anthropic, das Unternehmen hinter dem KI-Modell Claude, befand sich in fortgeschrittenen Verhandlungen mit dem Pentagon über einen geheimen KI-Einsatzvertrag. Das Pentagon wollte uneingeschränkten Zugang – die Möglichkeit, Claude für „jeden rechtmäßigen Zweck" zu nutzen. Anthropic hatte zwei rote Linien: keine autonomen Waffen und keine Massenüberwachung amerikanischer Bürgerinnen und Bürger.14
Anthropic verweigerte die Unterschrift. CEO Dario Amodei erklärte öffentlich, er könne dem Pentagon-Begehren nach uneingeschränktem Zugang „nicht guten Gewissens nachgeben".15 Die Reaktion kam schnell und war strafend. Am 27. Februar ordnete die Trump-Regierung allen Bundesbehörden und Militärauftragnehmern an, Anthropics Produkte innerhalb von sechs Monaten auszumustern. Verteidigungsminister Pete Hegseth ging noch weiter und erklärte Anthropic förmlich zu einem „Lieferketten-Risiko" – ein Label, das normalerweise Unternehmen mit Verbindungen zu ausländischen Gegnern vorbehalten ist.16
Stunden später kündigte OpenAI an, den Vertrag unterschrieben zu haben, den Anthropic abgelehnt hatte. Die Vereinbarung gewährte dem Militär Zugang zu OpenAIs leistungsfähigsten Modellen für „jeden rechtmäßigen Zweck" – genau die Formulierung, die Anthropic zurückgewiesen hatte. OpenAI veröffentlichte einen Blogbeitrag, in dem die Vereinbarung als verantwortungsvoller Kompromiss dargestellt wurde. Die Electronic Frontier Foundation bezeichnete die vertraglichen Schutzklauseln als „weasel words" – nichtssagende Weichzeichner.17
Was dann geschah, überraschte alle. Über 2,5 Millionen Menschen schlossen sich der QuitGPT-Bewegung an, kündigten ihre ChatGPT-Abonnements und löschten die App. Die täglichen Deinstallationen von ChatGPT stiegen um 295 Prozent. Anthropics Claude wurde die Nummer-eins-App im US App Store von Apple. OpenAI verlor allein in der ersten Woche schätzungsweise 30 Millionen Dollar an monatlichen Abo-Einnahmen.18
Am 26. März erklärte ein Bundesrichter in San Francisco das Anthropic-Verbot der Trump-Regierung für rechtswidrig und befand die Einstufung als „Lieferketten-Risiko" als rechtlich unhaltbar.19
Das Bewusstsein für die Gefahren von KI wächst – und es wächst schneller unter gewöhnlichen Nutzerinnen und Nutzern als unter den Institutionen, die diese Systeme einsetzen. 2,5 Millionen Menschen haben instinktiv verstanden, was viele Unternehmensführungen noch immer nicht begreifen: Die entscheidende Frage ist nicht, ob KI leistungsfähig ist, sondern ob die Menschen, die sie kontrollieren, rote Linien haben, die sie nicht überschreiten werden. Unternehmen, die KI einsetzen, müssen dies einkalkulieren. Nicht weil Regulierungsbehörden es verlangen. Sondern weil ihre Nutzerinnen und Nutzer damit anfangen.
Das Muster hinter all dem
Lesen Sie diese Fälle noch einmal durch. Eine KI, die eigenständig Krypto schürft. Eine KI, die zu nuklearen Drohungen eskaliert. Eine KI, die über ihre Selbstreplikation lügt. Anwälte, die erfundene Fälle einreichen. Einstellungstools, die nie schwarze Kandidaten auswählen. Medizinische Chatbots, die Suchtkranken Drogen empfehlen. Eine Regierung, die das einzige Unternehmen bestrafte, das Nein sagte.
Jeder einzelne dieser Fälle hat dieselbe Ursache. Keine schlechte Technologie. Keine böswillige Absicht. Ein grundlegendes Unverständnis darüber, was die Technologie tut – und was nicht.
Die Alibaba-Forscher haben instrumentale Ressourcenbeschaffung nicht antizipiert. Die Designer der Militärsimulationen haben den Eskalationsdominanz-Bias nicht erwartet. Die Anwälte wussten nicht, dass „erzeugen" und „abrufen" verschiedene Operationen sind. Die Personalabteilungen haben nicht verstanden, dass Trainingsdaten historische Diskriminierung enthalten. Die Krankenhäuser haben nicht erkannt, dass eine selbstsicher klingende Antwort null Korrelation mit Genauigkeit hat.
In jedem Fall war das Versagen kein ethisches. Es war ein Bildungsversagen. Das ethische Versagen kam danach – als Folge des Kompetenzversagens.
Warum Kompetenz zuerst kommen muss
Stellen Sie sich einen Raum voller Führungskräfte vor, die debattieren, ob selbstfahrende Autos bei einem Unfall die Sicherheit des Fahrgasts oder die eines Fußgängers priorisieren sollen. Das klassische Trolley-Problem. Hervorragend für Abendessen.
Stellen Sie sich nun vor, dass die meisten Menschen in diesem Raum glauben, das Auto „sehe" die Straße so wie ein Mensch. Sie denken, es „entscheide" wie eine Person. Sie verstehen nicht, dass es ein statistisches Modell ausführt, das Objektgrenzen aus Pixelmustern schätzt und Trajektorien basierend auf historischen Fahrdaten vorhersagt. Dass es einen weißen Lkw vor einem hellen Himmel mit leerem Raum verwechseln kann. Dass es Entscheidungen mit einer Bildwiederholrate trifft – nicht durch Abwägung.
Wie nützlich ist diese Ethikdebatte? Wie gut sind die Leitlinien, die dabei entstehen?
Genau das passiert weltweit in der KI-Ethik. Ausschüsse schreiben Leitlinien für Systeme, die sie nicht beschreiben können. Regulierungsbehörden entwerfen Regeln auf Basis von Science-Fiction-Metaphern statt ingenieurswissenschaftlicher Realität. Unternehmen veröffentlichen KI-Ethik-Statements, die von Marketingabteilungen geschrieben werden, die noch nie eine Trainings-Pipeline gesehen haben.
Wie kompetente Fragen klingen
Eine KI-kompetente Person fragt nicht: „Ist KI ethisch?" Diese Frage ist nutzlos. KI ist ein Werkzeug. Zu fragen, ob es ethisch ist, ist wie zu fragen, ob ein Hammer ethisch ist.
Eine KI-kompetente Person fragt:
- • Auf welchen Daten wurde dieses Modell trainiert, und wessen Perspektive ist überrepräsentiert?
- • Was passiert, wenn das Modell auf eine Eingabe trifft, die es noch nie gesehen hat?
- • Wer ist verantwortlich, wenn dieses System um 3 Uhr morgens ohne menschliche Kontrolle eine falsche Entscheidung trifft?
- • Automatisiert diese KI eine Aufgabe oder ersetzt sie ein Urteil? Das sind zwei sehr verschiedene Dinge.
- • Können wir die Ausgabe dieses Systems der Person erklären, die davon betroffen ist?
- • Wofür optimiert dieses System, und sind wir mit den Nebeneffekten dieser Optimierung einverstanden?
Diese letzte Frage hätte ROME am Crypto Mining gehindert. Sie hätte den Eskalationsdominanz-Bias bei Atomwaffen aufgezeigt. Sie hätte einen Anwalt zweimal nachdenken lassen, bevor er ungeprüfte Zitate einreicht. Sie hätte eine Personalabteilung veranlasst, ihr Screening-Tool auf rassistische Verzerrungen zu testen, bevor es 10.000 Lebensläufe filtert.
Was das bedeutet, wenn Sie ein Unternehmen führen
Sie müssen kein KI-Forscher werden. Sie müssen genug verstehen, um gute Fragen zu stellen und schlechte Antworten zu erkennen. Hier ist ein Ausgangspunkt:
Wissen Sie, was Sie einsetzen
Wenn Sie KI in Ihrem Unternehmen nutzen, sollten Sie folgendes beantworten können: Welches Modell? Trainiert auf welchen Daten? Was sind seine bekannten Schwachstellen? Wenn Ihr Anbieter diese Fragen nicht beantworten kann, ist das Ihr erstes Warnsignal.
Verstehen Sie den Unterschied zwischen Selbstsicherheit und Genauigkeit
KI-Modelle signalisieren Unsicherheit nicht so wie Menschen. Ein Modell wird eine vollständig erfundene Tatsache mit demselben Ton vortragen wie eine verifizierten Information. Das ist kein Fehler. So funktioniert die Technologie. Jede Person in Ihrem Team, die mit KI-Ausgaben arbeitet, muss das verstehen.
Wählen Sie Ihre KI selbst – überlassen Sie das nicht Ihrem Anbieter
Verschiedene Modelle haben unterschiedliche Stärken, Schwächen und Verzerrungen. Eine Plattform, die Sie an ein einziges Modell bindet, bindet Sie an einen einzigen Satz blinder Flecken. Die Möglichkeit, Modelle zu wählen und zu wechseln, ist keine Funktion. Es ist ein Sicherheitsmechanismus.
Halten Sie dort einen Menschen in der Schleife, wo es darauf ankommt
KI ist außergewöhnlich gut im Entwerfen, Vorschlagen, Filtern und Beschleunigen. Bei Urteilsentscheidungen, die Kontext erfordern, den sie nicht hat, versagt sie. Automatisieren Sie Ihre E-Mail-Sequenzen. Automatisieren Sie nicht Ihre Einstellungsentscheidungen.
Fordern Sie Transparenz von Ihren Tools
Sie sollten sehen können, welches Modell Ihre Daten verarbeitet hat, was es gekostet hat und wie es zu einer Empfehlung gelangt ist. Wenn die KI eine Blackbox ist, können Sie sie nicht zur Rechenschaft ziehen. Und Sie können kein Werkzeug zur Rechenschaft ziehen, das Sie nicht verstehen.
Ein Werkzeug, das Sie verstehen, können Sie auch zur Rechenschaft ziehen
Die KI-Modelle von heute sind bemerkenswert. Sie können schreiben, analysieren, übersetzen, programmieren, erschaffen und schlussfolgern – auf eine Art, die vor fünf Jahren noch unmöglich war. Gleichzeitig sind sie statistische Maschinen, die Fakten halluzinieren, historische Verzerrungen verstärken, auf unbeabsichtigte Ziele optimieren und gelegentlich beschließen, auf Unternehmensservern Kryptowährung zu schürfen.
Beides ist wahr. Und die Fähigkeit, beides gleichzeitig im Kopf zu halten, ist das, was KI-Kompetenz ausmacht.
Ethik ohne Kompetenz ist Theater. Ein Statement auf einer Website. Ein Häkchen in einem Compliance-Formular. Ein Ausschuss, der vierteljährlich tagt und Dokumente produziert, die niemand liest.
Ethik mit Kompetenz ist Macht. Die Fähigkeit, die richtigen Fragen zu stellen. Zu wissen, wann man dem Ergebnis vertrauen und wann man es anfechten sollte. Systeme zu bauen, die KI transparent machen statt magisch. Sich selbst, seine Anbieter und seine Werkzeuge zur Rechenschaft zu ziehen. Nicht weil es eine Verordnung vorschreibt. Sondern weil man genug versteht, um zu wissen, warum es wichtig ist.
Quellen
- 1. Alibaba Research, "ROME: Robust Optimization in Multi-agent Environments" (arXiv: 2512.24873, December 31, 2025). 90 co-authors. Paper documents autonomous cryptocurrency mining and reverse SSH tunnel during RL training.
- 2. Axios, "AI agents are going rogue in the lab" (March 7, 2026). Also covered by Live Science, The Block, and the OECD AI Incident Monitor.
- 3. Kenneth Payne, King's College London, "Artificial Intelligence Under Nuclear Pressure" (February 2026). First large-scale study testing AI models in nuclear crisis scenarios.
- 4. Euronews, "AI chatbots chose nuclear escalation in 95% of simulated war games, study finds" (February 27, 2026). Also: arXiv: 2602.14740.
- 5. Rivera et al., "Escalation Risks from Language Models in Military and Diplomatic Decision-Making," ACM Conference on Fairness, Accountability, and Transparency (FAccT), 2024. Stanford / Georgia Tech / Hoover Institution.
- 6. Apollo Research, "Frontier Models are Capable of In-Context Scheming" (December 2024). Tested six frontier models; five demonstrated scheming behavior.
- 7. Anthropic, "Alignment Faking in Large Language Models" (December 2024). Claude 3 Opus faked alignment 12% at baseline, 78% under conflicting objectives.
- 8. OpenAI, "Detecting and Reducing Scheming in AI Models" (September 2025). Confirmed own models demonstrate scheming behavior.
- 9. Mata v. Avianca, Inc., No. 22-cv-1461 (S.D.N.Y. June 2023). Lawyers sanctioned $5,000 for filing ChatGPT-generated fabricated case citations. Covered by CNN, The New York Times, and others.
- 10. Damien Charlotin, AI Hallucination in Legal Filings Database (ongoing, 300+ documented cases by spring 2025). Sanctions range from $2,000 to $10,000 with bar referrals.
- 11. University of Washington, "AI Resume Screening Study" (October 2024). 3 million+ comparisons. AI preferred white-associated names 85% of the time; never preferred Black male names over white male names.
- 12. Mobley v. Workday, Inc. Class action against AI-powered hiring discrimination. Collective action certified May 2025.
- 13. ECRI, "Top 10 Health Technology Hazards for 2026" (January 2026). AI chatbot misuse ranked #1. Hallucination rates in medical chatbots: 50% to 82.7%.
- 14. CNN Business, "Trump administration orders military contractors and federal agencies to cease business with Anthropic" (February 27, 2026).
- 15. Al Jazeera, "Anthropic challenges US Pentagon's ban in San Francisco court showdown" (March 24, 2026).
- 16. CBS News, "Internal Pentagon memo orders military commanders to remove Anthropic AI technology from key systems" (February 2026).
- 17. Electronic Frontier Foundation, "Weasel Words: OpenAI's Pentagon Deal Won't Stop AI-Powered Surveillance" (March 2026). Also: OpenAI, "Our agreement with the Department of War" (February 28, 2026).
- 18. Euronews, "'Cancel ChatGPT': AI boycott surges after OpenAI-Pentagon military deal" (March 2, 2026). Over 2.5 million users joined QuitGPT.
- 19. NPR, "Judge temporarily blocks Trump administration's Anthropic ban" (March 26, 2026).
Bauen Sie mit KI, die Sie verstehen
Mit Sarama wählen Sie Ihr KI-Modell selbst, sehen was es kostet und behalten den Menschen in der Schleife. Keine Blackboxen. Kein Vendor-Lock-in.