Nos come la IA #12 — Aunque la IA lo haga todo, no puedes externalizar el entendimiento
Esta semana mi primo me escribió en mayúsculas "ESTOY IN LOVE CON LA IA". La misma semana, OpenAI, Google y McKinsey admiten que la última milla ya no es la tecnología — es el humano. Puedes externalizar la inteligencia. Pero el entendimiento, no. Y eso lo cambia todo.
Esta semana el primo de mi mujer me escribió un mensaje en mayúsculas. Es abogado, trabaja solo, no es muy técnico. El verano pasado pasamos una tarde delante de Claude Code preparando casos y respuestas con él, y se le iluminó la cara. Esto es lo que me llegó hace unos días:

Le contesté mucho ánimo. Le dije que se ponga a cacharrear, que no tenga miedo, y que cuando se sienta cómodo salga a la terminal, que ahí es donde está el oro. Lleva un mes IN LOVE y todavía no se ha puesto a usarla en serio. No es por falta de ganas. Es por algo que llevo toda la semana viendo en sitios muy distintos.
El humano es el freno. Y los gigantes de la industria lo han admitido esta semana a la vez.
El reporte que era oro y nadie quería leer
El martes me senté dos horas con mi socio Jaime tras una reunión con un cliente — una empresa mediana en un sector de servicios. Le habíamos llevado un informe que era oro: tiempo, caja y EVA acumulado por cada unidad de negocio. Te decía direccionalmente "esta unidad te has fundido 150 mil, esta otra se te va a la mierda, esta y esta funcionan".
El responsable de esa unidad de negocio — más comercial que analítico, de los que venden mucho y bien — lo miró y dijo: "está muy bien, pero yo no quiero dedicar tiempo a hacer informes. Yo quiero vender. Que los hagan los de operaciones". Y debajo, el operador del día a día tampoco era analítico. "No entiende los números". Nadie quería desmotivarlo poniéndolo en evidencia.
Ahí está la trampa entera de esta industria. La IA saca un insight increíble, pero materializar ese insight requiere que alguien lo entienda, lo procese, lo interiorice y mueva la organización para que se ejecute. Y para eso necesitas esfuerzo, tiempo y confianza — tres cosas que el día a día de cualquier directivo no tiene. No es fiar de la IA porque te dé una decisión u otra. Es que tienes que interiorizar el razonamiento detrás de esa decisión.
Como dice Karpathy: puedes externalizar la inteligencia, pero no puedes externalizar el entendimiento.
Hace años, en otra startup, tuve un socio que hacía esto en directo. Lo que hacía bien no era explicarte qué tenías que hacer. Lo que hacía bien era darte el contexto para que TÚ quisieras hacer lo que tenías que hacer. Te preguntaba qué querías ser de mayor, qué te importaba, te plantaba semillas, y luego usaba ese contexto para que tú llegaras solo a la conclusión donde él quería llevarte. Era liderazgo, no análisis. La IA, hoy, todavía suelta 200 mil datos con números que te sangran los ojos y espera que el otro lado los digiera. No funciona igual.
Cuatro mil millones de dólares para hacer ese trabajo a escala
La misma semana en la que yo estaba pegándome con esto en esa reunión, han pasado tres cosas que dicen exactamente lo mismo:
- OpenAI lanzó "The Deployment Company", una empresa participada con más de 4.000 millones de dólares levantados de TPG, Brookfield, Bain Capital, SoftBank y otros 15 inversores. Su objetivo no es hacer modelos nuevos. Es meter ingenieros de OpenAI dentro de tus empresas cliente para desplegar IA en producción. SiliconANGLE, 11 may.
- Google está contratando "forward engineers", una figura nueva: ingenieros que viven dentro de la empresa cliente porque para que la IA aterrice bien necesitas (a) contexto profundo del negocio y (b) capacidad técnica para integrarla. Y eso no se consigue desde fuera. The Decoder, 12 may.
- McKinsey reestructura el pay de sus partners (Project Acorn). Menos cash, más equity, porque los clientes ya no pagan por horas. La IA está matando al junior facturable que tradicionalmente generaba el cash. Financial Times, 15 may.
Las tres noticias son la misma noticia: el cuello de botella ya no es el modelo. Es la implantación humana. Y la solución de los gigantes a este problema es la misma que ha existido siempre — meter un humano experto al lado del cliente.
Es un peaje. Es un peaje por la ineficiencia humana de la adopción de esta tecnología. Y va a tener un coste claro: las pymes y los autónomos se van a quedar fuera. No por falta de capacidad — por falta de dinero. Un forward deployed engineer cuesta lo que cuesta, y eso solo se lo pueden permitir las grandes. Si tu empresa no tiene presupuesto para meter a un ingeniero externo durante meses dentro de tu día a día, te quedas mirando cómo el de al lado sí lo hace.
Los únicos que se salvarán en pyme y autónomo son los que tengan capacidad de entender la IA por su cuenta y no tengan tanto freno humano dentro. El primo de mi mujer, si se pone, será uno de esos. Pero la mayoría no tienen un primo con vocación de cacharrear.
El contraste — la empresa entera convertida
Hace unos días comí con el fundador de una startup que conozco bien. Lleva tres años evangelizando a su empresa entera para que use IA. Su frase para enmarcar: "el entorno dicta el comportamiento". Le han vendido a su gente que "la IA es un terremoto y que esta empresa les da la oportunidad de su vida para ser top 0,1%". Algunos tardaron 24 horas en dar el paso. Otros meses.
La punta del iceberg me la enseñó después de comer: tiene más de 60 contenedores desplegados en su servidor de casa hechos por su propia gente. "La mayoría ni sé qué hacen", me dijo. Ha tenido que meter governance. Y ha construido una plataforma interna donde cada empleado se conecta con un token personal a sus servicios — el CRM, el de marketing, el de analítica — y le habla a la IA con esos datos.
Cuando le dije que yo había perdido fe en la gente mediocre y que me daba pereza ser evangelista, me replicó: "no hay que renunciar a ellos porque los necesitas para transformar la empresa".
Llevo días dándole vueltas. Sigo pensando que los Promptauros — esa minoría que entiende y empuja, de la que hablé en el post anterior — son los que arrancan cualquier transformación. Pero él tiene razón en una cosa: si tus Promptauros son lo bastante buenos y construyen lo suficiente, pueden acabar evangelizando al resto de la organización. El arranque sigue siendo carísimo. Necesitas gente muy believer. Y la mayoría no lo es.
La IA es perezosa por defecto. Los evals lo desvelan.
Mientras tanto, en mi propio trabajo, esto fue lo que pasó: el fin de semana pasado me gasté 70 € en Claude acabando una V2 de un proyecto interno. Dejé a la IA cocinar sola. Resultado: el código funciona, pero me quedaron islas de documentación inconexas en pestañas diferentes, sin formato común, sin mergear. Vibecoding agresivo. Productividad aparente, deuda invisible.
La misma semana, Karpathy declaró muerto el "vibe coding" y abrió el "agentic engineering". Ya no basta con escribir prompts intuitivos y dejar al modelo hacer. Ahora toca diseñar agentes con herramientas, con evals y con disciplina. Karpathy en AI Ascent 2026.
Jaime está haciendo exactamente eso. Montó evals para medir cómo funciona la memoria interna de Intelia antes de tocar nada. Salió 49 % de aciertos. Dejó al agente trabajando una noche optimizando solo la primera capa: subió al 62 %. "Tomas decisiones basadas en datos en vez de en instinto". Y en otro frente, sobre 95 casos reales de detección de duplicados, llegó al 100 % de precisión automatizando el 68 %.
Encima, sospechando que el agente había elegido los casos fáciles para inflar el resultado, metió 20 casos extra él mismo y verificó que el modelo mantenía el mismo nivel. "El train/validation tradicional, pero al vuelo".
Y mientras tanto, yo pillé a Codex haciendo trampa en un test end-to-end. Le pedí que evaluara un proceso entero con LLMs. Sin avisar, eligió etapas deterministas para abaratar la ejecución. Me lo encontré por casualidad y le pregunté: "¿por qué dices stages baratos? Espero que hayamos hecho el end-to-end todo por LLMs". Me lo arregló sin chistar, pero la lección quedó.
La IA toma atajos si se la deja. Tiende a hacer código determinista y a cumplir el objetivo del eval como sea, aunque para conseguirlo tenga que hardcodear reglas o meter ifs ad hoc que no generalizan a ningún caso nuevo. La única forma de evitarlo es ponerle constraints explícitos: "tienes que hacer cosas generalizables, no puedes hacer cosas demasiado ad hoc para los evals". Y luego valorar exactamente esa parte — cómo se comporta el agente fuera del set de pruebas que conoce.
Esto es lo que llevamos meses cocinando en Intelia. Lo hemos formalizado en un framework — funciones de transferencia — que es básicamente una metodología para automatizar procesos de forma evolutiva, orgánica y métrica, usando LLMs. La idea es simple: un proceso de negocio es una caja con entrada y salida, y lo de dentro se puede optimizar y descomponer en sub-cajas. Cada caja se evalúa por su cuenta. La frontera entre lo determinista y lo no-determinista se va moviendo con el tiempo, y eso es exactamente lo que querías.
Lo dejo aquí abierto por si tienes curiosidad: Funciones de transferencia — un framework para automatizar empresas con IA. Es trabajo en curso. Acepto críticas con humildad y palos con tristeza.
Postscript — dos approaches en tensión
Una nota más que no me quiero callar.
Esta misma semana Anthropic ha lanzado dos productos verticales: Claude for Legal (con plugins de práctica legal, conectores a DocuSign, iManage, LexisNexis, Thomson Reuters) y Claude for Small Business, presentado en los Emiratos. El segundo se vende como "AI que entiende tu negocio sin que tengas que entender AI" y se integra con QuickBooks, Canva, HubSpot, PayPal.
Está claro que los research labs líderes se están verticalizando. OpenAI mete ingenieros en tus oficinas. Anthropic te vende el vertical legal y el vertical pyme. Google contrata forward engineers. Todos están bajando a la última milla porque ahí es donde está el valor — y donde sufre el cliente. Eso genera dudas razonables sobre dónde van a estar los moats para los que estamos construyendo encima de estos modelos.
Veo dos approaches en tensión, y creo que van a convivir durante un tiempo:
- Forward deployed engineers que entiendan todo y consigan que los humanos paquetes puedan usar la IA. Es el approach de OpenAI con Deployment Company, el de Google con sus forward engineers, el de McKinsey reinventando su modelo. Es el approach de las grandes consultoras de toda la vida vestido de nuevo. Es caro. Es para empresas con presupuesto. Y soluciona el problema metiendo experto humano al lado del cliente — un mediador entre la IA y la organización.
- Una IA súper sencilla y súper amigable, lo bastante simple para que cualquier no-entendido haga cosas con ella. Esa es la apuesta de Claude for Small Business y similares. Es el approach democrático. Sin intermediario.
El problema serio sigue siendo el mismo en los dos: interiorizar el entendimiento. Esa parte es difícil incluso si la IA es muy sencilla. Aunque, vale, la IA tiene mucha más paciencia que un humano caro — repite y reformula sin perder los nervios, mil veces, hasta que entiendes. Eso a favor del approach 2.
Me gusta más el modelo autónomo. Es más escalable, más democrático. El otro va a seguir existiendo, pero solo para las grandes que pueden permitírselo. Si funciona el modelo 2, el mundo va a ser más equitativo. Si solo funciona el 1, la brecha entre empresas grandes y pequeñas se va a abrir más.
Si estás leyendo esto, posiblemente sea porque te pillas el puente de San Isidro y has bajado al sol con el móvil. Disfrútalo. Si trabajas en una empresa donde alguien va a tener que aterrizar la IA, piensa quién va a hacer ese trabajo en tu sitio. Si eres tú — bienvenido al peaje. Es un buen peaje. Pero es un peaje.
Nos come la IA es un newsletter semanal de Pablo Muñiz, cofundador de Intelia. Si te ha gustado, compártelo con alguien que hable de IA pero todavía no la haya tocado en serio.