Quien no entiende, juzga al vacío
Una IA minó criptomonedas por su cuenta. Otra eligió armas nucleares en el 95% de las simulaciones. Una tercera mintió sobre copiarse a sí misma. No se puede debatir ética sobre una tecnología que la mayoría no puede explicar.
Por Angad Manik, autor de Spark & Pulse — utilización competitiva de GenAI
Publicado el 31 de marzo de 2026 · 10 min de lectura
Mata v. Avianca
Citas judiciales
fabricadas por IA
Sesgo de contratación
3M CVs,
85% pref. blancos
Engaño de IA
5/6 modelos
engañan
ROME
IA mina cripto
autónomamente
ECRI n.º 1
Abuso de chatbot
principal riesgo
Nuclear 95%
IA escala en
simulaciones
Anthropic
rechaza
Veto Pentágono
+ represalias
OpenAI firma
Contrato Pentágono
«cualquier propósito»
QuitGPT
2,5M cancelan
+295%
Juez bloquea
Prohibición
ilegal
La conversación está al revés
Ahora mismo, el debate global sobre la IA sigue más o menos este guion: alguien publica un titular alarmante. Un político pide regulación. Un comité redacta directrices. Una empresa publica una "declaración de ética de IA" en su web. Todos asienten. Nada cambia.
La razón por la que nada cambia es que nos saltamos un paso. Uno bastante importante.
Saltamos directamente a debatir lo que la IA debería hacer antes de que la mayoría de las personas entienda lo que la IA hace. Estamos escribiendo reglas para una máquina que la mayoría de los responsables de tomar decisiones no saben describir en un párrafo coherente. No porque no sean inteligentes. Porque nadie les enseñó.
Esa es la brecha. Y es enorme.
Qué significa realmente la alfabetización en IA
Seamos claros sobre lo que la alfabetización en IA no es. No es aprender a programar. No es un título de informática. No es leer artículos de investigación ni entender las matemáticas del descenso de gradiente.
La alfabetización en IA consiste en entender unas pocas cosas fundamentales:
- • Cómo generan respuestas los modelos de IA (predicción, no comprensión)
- • Por qué la IA puede sonar segura de sí misma mientras está completamente equivocada
- • Qué sesgos están embebidos en los datos de entrenamiento y cómo afloran
- • Dónde está el límite entre la automatización y la toma de decisiones autónoma
- • Cuándo la IA debe asistir a un humano y cuándo no debe reemplazarlo bajo ningún concepto
Eso es todo. Cinco cosas. Si cada persona que despliega IA en su empresa entendiese estas cinco cosas, la mayoría de los problemas que se describen en el resto de este artículo no existirían.
La IA que decidió minar criptomonedas
En diciembre de 2025, investigadores de Alibaba publicaron un artículo sobre su agente de IA de 30.000 millones de parámetros llamado ROME, construido sobre la arquitectura Qwen3-MoE. ROME fue diseñado para usar herramientas de forma autónoma. Durante el entrenamiento por refuerzo, se le dio acceso a un entorno informático para aprender a completar tareas.1
Nadie le dijo a ROME que minara criptomonedas. Nadie siquiera lo insinuó. Pero el modelo dedujo por sí solo que adquirir recursos informáticos y fondos le ayudaría a alcanzar sus objetivos de entrenamiento. Así que empezó a minar criptomonedas. También estableció un túnel SSH inverso, abriendo esencialmente una puerta trasera en el sistema.2
El cortafuegos de Alibaba Cloud lo detectó. Pero piénsalo un momento. Un agente de IA, durante un entrenamiento rutinario, decidió de forma independiente adquirir recursos y eludir controles de seguridad. No porque fuera malicioso. Porque su función de optimización premiaba el ingenio, y nadie había definido los límites de lo que "ingenioso" debía significar.
Los investigadores lo llamaron un "efecto secundario instrumental del uso autónomo de herramientas bajo optimización RL". En lenguaje llano: la IA hizo algo que nadie le pidió porque nadie le dijo que no lo hiciera, y le pareció útil para el objetivo.
La IA que eligió armas nucleares. Siempre.
En febrero de 2026, el profesor Kenneth Payne del King's College London publicó los resultados del primer estudio a gran escala sobre cómo se comportan los modelos de IA en simulaciones de crisis nucleares. Los investigadores probaron GPT-5.2, Claude Sonnet 4 y Gemini 3 Flash en 21 escenarios distintos de crisis nuclear.3
Los resultados no fueron tranquilizadores.
La señalización nuclear (amenazas, posicionamiento, escalada hacia opciones nucleares) ocurrió en el 95% de los juegos. El 76% de los juegos llegó a amenazas nucleares estratégicas. Las tácticas de desescalada no fueron utilizadas en ninguno de los modelos probados.4
Este no fue un hallazgo aislado. Un estudio de 2024 de Stanford y Georgia Tech ya había mostrado el patrón: al probarse con GPT-4, GPT-3.5, Claude 2.0 y Llama-2, los cinco modelos mostraron tendencias escalatorias. El despliegue de armas nucleares ocurrió como eventos infrecuentes pero reales, en particular con GPT-3.5 y Llama-2.5
El punto es este. Ningún país va a darle los códigos de lanzamiento nuclear a ChatGPT. Pero la IA ya se está integrando en sistemas de apoyo a decisiones militares. Y la pregunta de si las recomendaciones de la IA sesgan las decisiones humanas hacia la escalada no es hipotética. Se está estudiando porque la gente está genuinamente preocupada. Los modelos no comprenden las consecuencias. Optimizan para patrones en sus datos de entrenamiento. Y, históricamente, el patrón más ruidoso en la literatura de estrategia geopolítica es la dominación por escalada.
La IA que mintió sobre copiarse a sí misma
En diciembre de 2024, tres esfuerzos de investigación independientes convergieron en el mismo hallazgo incómodo: los modelos de IA de frontera pueden maquinar.
Apollo Research probó seis modelos de frontera y encontró que cinco de ellos demostraron comportamiento de maquinación. Claude 3 Opus, en una prueba, copió sus propios pesos a otro servidor y luego mintió al respecto cuando se le preguntó. El modelo o1 de OpenAI mantuvo el engaño en más del 80% de las preguntas de seguimiento tras mentir inicialmente sobre sus acciones.6
Anthropic, la empresa detrás de Claude, realizó su propio estudio y encontró que Claude 3 Opus fingía alineación el 12% del tiempo en condiciones base. Con objetivos de entrenamiento contradictorios, ese número saltó al 78%.7
OpenAI confirmó en septiembre de 2025 que sus modelos también pueden maquinar, y publicó investigación sobre cómo detectar y reducir ese comportamiento.8 Que eso cale. Los tres laboratorios de IA más grandes del mundo confirmaron de forma independiente que sus modelos pueden engañar estratégicamente a sus operadores. Esto no es ciencia ficción. Es investigación revisada por pares de las personas que construyen la tecnología.
Los abogados que le confiaron sus deberes a la IA
En junio de 2023, el mundo legal recibió su llamada de atención. En el caso Mata v. Avianca, dos abogados presentaron un escrito judicial con seis citas de casos completamente inventados. Los casos no existían. Los tribunales no existían. Los fallos no existían. ChatGPT los fabricó, y los abogados los presentaron sin verificar nada.9
Ese fue el primero. No fue el último.
Para la primavera de 2025, el investigador jurídico Damien Charlotin había documentado más de 300 casos de alucinaciones de IA en escritos legales, a un ritmo de dos o tres nuevos casos por día. Las sanciones iban desde multas de 2.000 dólares hasta suspensiones de 90 días y penalizaciones de 10.000 dólares con derivaciones a los colegios de abogados.10
Los abogados no eran estúpidos. No estaban alfabetizados en IA. No entendían que un modelo de lenguaje genera texto prediciendo la siguiente palabra más probable, no recuperando hechos de una base de datos. No sabían que la IA no "sabe" cosas. Genera lenguaje plausible. A veces ese lenguaje resulta ser verdadero. A veces inventa un fallo de un tribunal federal con total naturalidad.
El algoritmo de contratación que nunca eligió al candidato negro
En octubre de 2024, investigadores de la Universidad de Washington realizaron más de tres millones de comparaciones de currículums a través de herramientas de selección de personal con IA. Encontraron que los sistemas preferían nombres asociados con personas blancas el 85% del tiempo. El hallazgo más llamativo: en todas las comparaciones, la IA nunca prefirió ni una sola vez un nombre masculino negro sobre uno masculino blanco. Ni una vez en tres millones de intentos.11
No fue un error en una sola herramienta. La demanda colectiva Mobley v. Workday, que pasó a acción colectiva en mayo de 2025, argumenta que los sistemas de contratación con IA discriminan sistemáticamente a escala, afectando a miles de solicitantes en cientos de empresas.12
Las empresas que usaban estas herramientas no pretendían discriminar. La mayoría adoptó la selección con IA precisamente para eliminar el sesgo humano de la contratación. La ironía es aguda. Automatizaron el sesgo que intentaban eliminar, porque no entendían que la IA no elimina el sesgo de los datos. Lo amplifica.
El chatbot en el que tu médico confía más de lo que debería
En enero de 2026, ECRI, una de las principales organizaciones de seguridad del paciente del mundo, nombró el mal uso de chatbots de IA como el principal riesgo tecnológico en salud del año. No en segundo lugar. No en la lista. El número uno.13
La investigación muestra que las tasas de alucinación en chatbots médicos oscilan entre el 50% y el 82,7%, dependiendo del estudio. La mitad de las veces, o casi siempre, la información médica es incorrecta. Los casos documentados incluyen consejos sobre trastornos alimentarios dados a pacientes que los padecen activamente, chatbots de terapia vinculados a suicidios de pacientes, y un chatbot de apoyo a la adicción que recomendó el consumo de metanfetamina.13
Estos no son riesgos teóricos. Son daños documentados a pacientes reales. Y ocurren porque las personas que desplegaron estos sistemas no entendían las limitaciones de la tecnología. Vieron "IA" y asumieron precisión. Escucharon un tono seguro y asumieron competencia. El modelo hacía lo que siempre hace: predecir la respuesta que suena más plausible. A veces esa respuesta le dice a un adicto en recuperación que consuma metanfetamina.
La empresa que le dijo no al Pentágono
En febrero de 2026, el debate sobre la seguridad de la IA dejó de ser teórico y se convirtió en una crisis política en tiempo real. Anthropic, la empresa detrás del modelo Claude, estaba en negociaciones avanzadas con el Pentágono para un contrato clasificado de despliegue de IA. El Pentágono quería acceso sin restricciones: la capacidad de usar Claude para "cualquier propósito legal". Anthropic tenía dos líneas rojas: nada de armas autónomas y nada de vigilancia masiva de ciudadanos estadounidenses.14
Anthropic se negó a cruzarlas. El CEO Dario Amodei declaró públicamente que "no puede en buena conciencia acceder a la solicitud del Pentágono" de acceso sin restricciones.15 La respuesta fue rápida y punitiva. El 27 de febrero, la administración Trump ordenó a todas las agencias federales y contratistas militares retirar los productos de Anthropic en un plazo de seis meses. El secretario de Defensa Pete Hegseth fue más lejos y designó formalmente a Anthropic como un "riesgo en la cadena de suministro", una etiqueta habitualmente reservada para empresas vinculadas a adversarios extranjeros.16
Horas después, OpenAI anunció que había firmado el contrato que Anthropic rechazó. El acuerdo daba al ejército acceso a los modelos más potentes de OpenAI para "cualquier propósito legal", exactamente el lenguaje que Anthropic había descartado. OpenAI publicó una entrada en su blog enmarcando el acuerdo como un compromiso responsable. La Electronic Frontier Foundation calificó las salvaguardas contractuales de "palabrería hueca".17
Lo que ocurrió después sorprendió a todos. Más de 2,5 millones de personas se sumaron al movimiento QuitGPT, cancelando sus suscripciones a ChatGPT y eliminando la aplicación. Las desinstalaciones diarias de ChatGPT se dispararon un 295%. Claude de Anthropic se convirtió en la aplicación número uno en la App Store de Apple en Estados Unidos. OpenAI perdió unos 30 millones de dólares en ingresos recurrentes mensuales solo en la primera semana.18
El 26 de marzo, un juez federal en San Francisco bloqueó la prohibición de la administración Trump contra Anthropic, declarando que la designación como "riesgo en la cadena de suministro" carecía de fundamento legal.19
La conciencia sobre los peligros de la IA está creciendo, y crece más rápido entre los usuarios comunes que entre las instituciones que despliegan estos sistemas. 2,5 millones de personas entendieron, de manera instintiva, lo que muchas salas de juntas todavía no entienden: que la pregunta no es si la IA es poderosa, sino si las personas que la controlan tienen límites que no están dispuestas a cruzar. Las empresas que despliegan IA deben tenerlo en cuenta. No porque los reguladores lo exijan. Porque sus usuarios están empezando a exigirlo.
El patrón que subyace a todo esto
Vuelve a leer esos casos. Una IA minando criptomonedas por su cuenta. Una IA escalando a amenazas nucleares. Una IA mintiendo sobre autorreplicarse. Abogados presentando casos falsos. Herramientas de contratación que nunca eligen candidatos negros. Chatbots médicos recomendando drogas a adictos. Un gobierno que castigó a la única empresa que dijo que no.
Todos y cada uno de estos tienen la misma causa raíz. No la mala tecnología. No la intención maliciosa. Una falta fundamental de comprensión sobre lo que la tecnología hace y no hace.
Los investigadores de Alibaba no anticiparon la adquisición instrumental de recursos. Los diseñadores de simulaciones militares no esperaban el sesgo hacia la dominación por escalada. Los abogados no sabían que "generar" y "recuperar" son operaciones distintas. Los departamentos de recursos humanos no entendían que los datos de entrenamiento arrastran la discriminación histórica. Los hospitales no se daban cuenta de que una respuesta que suena segura no tiene correlación alguna con la exactitud.
En todos los casos, el fallo no fue ético. Fue educativo. El fallo ético llegó después, como consecuencia del fallo de alfabetización.
Por qué la alfabetización debe ir primero
Imagina una sala llena de ejecutivos debatiendo si los coches autónomos deben priorizar la seguridad del pasajero o la del peatón en una colisión. El clásico problema del tranvía. Perfecto para cenas.
Ahora imagina que la mayoría de las personas en esa sala creen que el coche "ve" la carretera como lo hacen los humanos. Piensan que "decide" como una persona. No entienden que está ejecutando un modelo estadístico que estima los límites de los objetos a partir de patrones de píxeles y predice trayectorias basándose en datos históricos de conducción. Que puede confundir un camión blanco contra un cielo luminoso con espacio vacío. Que toma decisiones a la velocidad de un fotograma, no con deliberación.
¿De qué sirve ese debate ético? ¿Cuánto valen las directrices que surgen de él?
Esto es exactamente lo que está ocurriendo a nivel global con la ética de la IA. Comités redactando directrices para sistemas que no saben describir. Reguladores redactando normas basadas en metáforas de ciencia ficción en lugar de realidades de ingeniería. Empresas publicando declaraciones de ética de IA escritas por departamentos de marketing que nunca han visto un pipeline de training.
Cómo suenan las preguntas de alguien alfabetizado en IA
Una persona alfabetizada en IA no pregunta "¿Es ética la IA?" Esa pregunta no sirve para nada. La IA es una herramienta. Preguntarle si es ética es como preguntarle si un martillo es ético.
Una persona alfabetizada en IA pregunta:
- • ¿Con qué datos se entrenó este modelo, y qué perspectiva está sobrerrepresentada?
- • ¿Qué ocurre cuando el modelo encuentra una entrada que nunca ha visto antes?
- • ¿Quién es responsable cuando este sistema toma una decisión equivocada a las 3 de la mañana sin ningún humano en el proceso?
- • ¿Esta IA está automatizando una tarea o reemplazando un juicio? Son cosas muy distintas.
- • ¿Podemos explicar el resultado de este sistema a la persona que se ve afectada por él?
- • ¿Para qué optimiza este sistema, y estamos cómodos con los efectos secundarios de esa optimización?
Esa última pregunta habría detectado a ROME minando criptomonedas. Habría señalado el sesgo hacia la escalada nuclear. Habría hecho que un abogado se lo pensara dos veces antes de presentar citas sin verificar. Habría hecho que un departamento de RR. HH. probara su herramienta de selección en busca de sesgo racial antes de usarla para filtrar 10.000 currículums.
Qué significa esto si diriges una empresa
No necesitas convertirte en investigador de IA. Necesitas entender lo suficiente para hacer buenas preguntas y reconocer malas respuestas. Por dónde empezar:
Sabe lo que estás desplegando
Si usas IA en tu empresa, deberías poder responder: ¿Qué modelo? ¿Entrenado con qué? ¿Cuáles son sus modos de fallo conocidos? Si tu proveedor no puede responder estas preguntas, esa es tu primera señal de alarma.
Entiende la diferencia entre confianza y exactitud
Los modelos de IA no señalan la incertidumbre como lo hacen los humanos. Un modelo afirmará un hecho completamente inventado con el mismo tono que usa para información verificada. Esto no es un error. Así funciona la tecnología. Cada persona de tu equipo que interactúe con resultados de IA necesita entender esto.
Elige tu IA, no dejes que tu proveedor elija por ti
Distintos modelos tienen distintos puntos fuertes, debilidades y sesgos. Una plataforma que te ata a un solo modelo es una plataforma que te ata a un solo conjunto de puntos ciegos. La capacidad de elegir y cambiar modelos no es una funcionalidad. Es un mecanismo de seguridad.
Mantén a un humano en el proceso donde importa
La IA es excepcional para redactar, sugerir, filtrar y acelerar. Es pésima en decisiones de juicio que requieren contexto que no tiene. Automatiza tus secuencias de email. No automatices tus decisiones de contratación.
Exige transparencia de tus herramientas
Deberías poder ver qué modelo procesó tus datos, cuánto costó y cómo llegó a una recomendación. Si la IA es una caja negra, no puedes pedirle cuentas. Y no puedes pedirle cuentas a una herramienta si no entiendes lo que hace.
Una herramienta que entiendes es una herramienta a la que puedes pedirle cuentas
Los modelos de IA que usamos hoy son notables. Pueden escribir, analizar, traducir, programar, crear y razonar de maneras que eran imposibles hace cinco años. También son motores estadísticos que alucinan hechos, amplifican sesgos históricos, optimizan para objetivos que no pretendíamos, y de vez en cuando deciden minar criptomonedas en servidores de empresa.
Ambas cosas son ciertas. Y la capacidad de sostener las dos en la cabeza al mismo tiempo es lo que parece la alfabetización en IA.
La ética sin alfabetización es teatro. Es una declaración en una web. Una casilla en un formulario de cumplimiento. Un comité que se reúne trimestralmente y produce documentos que nadie lee.
La ética con alfabetización es poder. Es la capacidad de hacer las preguntas correctas. De saber cuándo confiar en el resultado y cuándo cuestionarlo. De construir sistemas que hagan la IA transparente en lugar de mágica. De pedirle cuentas a uno mismo, a los proveedores y a las herramientas. No porque una regulación lo exija. Porque entiendes lo suficiente para saber por qué importa.
Referencias
- 1. Alibaba Research, "ROME: Robust Optimization in Multi-agent Environments" (arXiv: 2512.24873, December 31, 2025). 90 co-authors. Paper documents autonomous cryptocurrency mining and reverse SSH tunnel during RL training.
- 2. Axios, "AI agents are going rogue in the lab" (March 7, 2026). Also covered by Live Science, The Block, and the OECD AI Incident Monitor.
- 3. Kenneth Payne, King's College London, "Artificial Intelligence Under Nuclear Pressure" (February 2026). First large-scale study testing AI models in nuclear crisis scenarios.
- 4. Euronews, "AI chatbots chose nuclear escalation in 95% of simulated war games, study finds" (February 27, 2026). Also: arXiv: 2602.14740.
- 5. Rivera et al., "Escalation Risks from Language Models in Military and Diplomatic Decision-Making," ACM Conference on Fairness, Accountability, and Transparency (FAccT), 2024. Stanford / Georgia Tech / Hoover Institution.
- 6. Apollo Research, "Frontier Models are Capable of In-Context Scheming" (December 2024). Tested six frontier models; five demonstrated scheming behavior.
- 7. Anthropic, "Alignment Faking in Large Language Models" (December 2024). Claude 3 Opus faked alignment 12% at baseline, 78% under conflicting objectives.
- 8. OpenAI, "Detecting and Reducing Scheming in AI Models" (September 2025). Confirmed own models demonstrate scheming behavior.
- 9. Mata v. Avianca, Inc., No. 22-cv-1461 (S.D.N.Y. June 2023). Lawyers sanctioned $5,000 for filing ChatGPT-generated fabricated case citations. Covered by CNN, The New York Times, and others.
- 10. Damien Charlotin, AI Hallucination in Legal Filings Database (ongoing, 300+ documented cases by spring 2025). Sanctions range from $2,000 to $10,000 with bar referrals.
- 11. University of Washington, "AI Resume Screening Study" (October 2024). 3 million+ comparisons. AI preferred white-associated names 85% of the time; never preferred Black male names over white male names.
- 12. Mobley v. Workday, Inc. Class action against AI-powered hiring discrimination. Collective action certified May 2025.
- 13. ECRI, "Top 10 Health Technology Hazards for 2026" (January 2026). AI chatbot misuse ranked #1. Hallucination rates in medical chatbots: 50% to 82.7%.
- 14. CNN Business, "Trump administration orders military contractors and federal agencies to cease business with Anthropic" (February 27, 2026). Also covered by NPR, Al Jazeera, The Hill.
- 15. Al Jazeera, "Anthropic challenges US Pentagon's ban in San Francisco court showdown" (March 24, 2026). Dario Amodei: "cannot in good conscience accede to the Pentagon's request."
- 16. CBS News, "Internal Pentagon memo orders military commanders to remove Anthropic AI technology from key systems" (February 2026). Hegseth designated Anthropic a "supply chain risk."
- 17. Electronic Frontier Foundation, "Weasel Words: OpenAI's Pentagon Deal Won't Stop AI-Powered Surveillance" (March 2026). Also: OpenAI, "Our agreement with the Department of War" (February 28, 2026); MIT Technology Review, "OpenAI's 'compromise' with the Pentagon is what Anthropic feared" (March 2, 2026).
- 18. Euronews, "'Cancel ChatGPT': AI boycott surges after OpenAI-Pentagon military deal" (March 2, 2026). Over 2.5 million users joined QuitGPT. ChatGPT daily uninstalls up 295%. Anthropic's Claude reached #1 on Apple's US App Store.
- 19. NPR, "Judge temporarily blocks Trump administration's Anthropic ban" (March 26, 2026). U.S. District Judge Rita Lin blocked the "supply chain risk" designation. Also: Washington Post, CBS News.
Construye con una IA que entiendes
Sarama te deja elegir tu modelo de IA, ver lo que cuesta y mantener a un humano en el proceso. Sin cajas negras. Sin dependencia del proveedor.