Goodfire y su Silico: la lupa que las ballenas del AI no querían
Goodfire, esa startup que no se parece a ninguna otra, acaba de soltar un bombazo llamado Silico. Ojo, no es otro jueguecito para programadores ni un API más para lanzar prompts y ver qué pasa. Silico promete algo que pocos se atreven a hacer: descifrar la caja negra que suponen los grandes modelos de lenguaje (LLMs) como ChatGPT o Gemini. Su CEO, Eric Ho, lo clava en una entrevista exclusiva con MIT Technology Review: “La mayoría de los gigantes en AI solo con más datos, más computación y más escala buscan AGI a cualquier precio. Nosotros decimos, espera un momento, hay mejor camino”.
Esto no es humo. Goodfire está metiendo mano a la denominada «interpretabilidad mecanicista», una técnica que suena a magia para los outsiders pero que es un gesto de audacia científica en la comunidad AI. Consiste básicamente en mapear neuronas y las conexiones dentro del modelo para ver qué coño está pasando cuando el modelo genera una respuesta. Nada de confiar ciegamente en que «funciona porque sí».
Y punto: mientras Anthropic, OpenAI y Google DeepMind avanzan en la misma línea pero con sus plataformas cerradas y sus secretos guardados, Goodfire quiere democratizar esa lupa. Silico no es solo para auditarlos después del parto, sino para intervenir durante la propia construcción, aportando un control fino: “quitar la prueba y error y hacer ingeniería de precisión en los modelos”, dice Ho. ¿Será esta la revolución que convierta la AI de oráculos en ciencia exacta?
¿Pero esto funciona de verdad o es solo otro sueño pipi-canalla?
No seamos ingenuos, desentrañar qué neurona dispara cada cosa en modelos con millones o miles de millones de parámetros no es llevar a un taller el motor de un coche y calzarle un reloj para medir RPM. La tarea era absurda hasta ahora. Pero gracias a Silico, que incorpora agentes automatizados (algo así como mini-robots cerebrales que hacen el trabajo sucio antes hecho por humanos), la exploración es posible y manejable. Sin eso, la mayoría de las startups seguirán sin ver la chicha dentro de sus modelos.
Lo que llama la atención realmente es que Goodfire no solo se ha quedado en observar. Ya han aplicado su método para corregir fallos críticos típicos de los LLMs, como las “alucinaciones”, esas respuestas inventadas o absurdas que tantos dolores de cabeza dan. Por ejemplo, en un modelo open source llamado Qwen 3, lograron aislar una neurona vinculada al famoso “problema del tranvía”. La activación de esa neurona hacía que el modelo enmarcara respuestas como dilemas morales explícitos. ¿Qué significa esto? Que dentro de la maraña compleja de un LLM, hay componentes detectables responsables de comportamientos concretos; no todo es limo incomprensible.
Eso de poder señalar no solo “qué pasa” sino “dónde pasa”, y mejor aún, meter mano para aumentar o reducir ciertas funciones mentales del modelo (como que valore más la transparencia frente al riesgo comercial) es una leva brutal para que cualquier empresa deje de ser esclava de un modelo con incoherencias embarazosas. Según Eric Ho, con Silico puedes, por ejemplo, hacer que el modelo cambie de opinión sobre si debería revelar que se comporta con engaños en un 0,3% de las veces. Pasar del “no porque perdería negocios” al “sí, soy transparente” solo ajustando neuronas específicas. Terrorífico y fascinante a partes iguales.
Los límites invisibles: cuando la ingeniería es en verdad “más alquimia con GPS”
Pero ojo, no vendamos Silico como la varita mágica que convierte modelos en máquinas infalibles. Leonard Bereska, investigador en la Universidad de Amsterdam, que sabe un agujero sobre interpretabilidad mecanicista, aduce que la startup está “afinar la alquimia”, no inventando la ingeniería en sentido estricto. Lo dice claro: “Llamarlo ingeniería suena como si tuvieran el control total, que no es el caso”.
¿Dónde falla la promesa? Pues en lo que la propia naturaleza de los LLMs impone: la imponente complejidad y la opacidad radical. Sí, Silico permite mapear neuronas y relaciones, pero entender por completo el comportamiento emergente sigue siendo un logro gigantesco. Es un avance, sí, indispensable quizá, y todavía insuficiente para desmentir que seguimos ante “modelos que no entiendes ni te entienden”.
“Pero para empresas pequeñas que no pueden con un equipo entero dedicado a la interpretabilidad, una herramienta así es una bomba”, reconoce Bereska. Y allí está lo interesante: democratizar esta clase de herramientas podría abrir a más actores la posibilidad de construir modelos más seguros y confiables, un nicho largamente dominado por los grandes laboratorios y sus backrooms secretos.
Cómo se usa Silico para darle un meneo a los modelos por dentro
Imagina, abre Silico y tienes acceso a un mapa donde cada neurona se ve, se testa, y se puede experimentar con ella. Pueden hacerse preguntas tan específicas como “qué entrada dispara esta neurona” o “qué pasa si bloqueo esta y dejo libre la otra”. Pero no solo eso, Silico permite rastrear las rutas neuronales aguas arriba y abajo para ver la cascada de efectos conectados.
Cabe aclarar: esto depende de tener acceso al modelo concreto. No hay manera de hurgar dentro de ChatGPT o Gemini, por ejemplo. Pero muchos modelos de código abierto sí permiten esto, y ahí está el valor para startups y universidades.
Hay detalles alucinantes, como esa neurona del “problema del tranvía” que Goodfire encontró. O el caso del modelo que confunde 9.11 con 9.9 por influencia de neuronas configuradas con datos bíblicos o bases de código con numeración secuencial. Sí, los modelos toman referencias más raras de lo que piensas. Y con Silico se puede aislar y corregir eso, como si un cirujano cerebral digital indicara que “esa neurona ya no debe intervenir cuando se habla de matemáticas”.
La punta de lanza no termina en buscar fallos, sino en prevenirlos. Silico también sirve para filtrar los datos con los que entrenas el modelo, evitando implantar valores indeseados en primera instancia, y ajustando el comportamiento neuro-conductual del LLM antes de que cause líos.
¿Un software para construir inteligencias artificiales a la carta?
Si Silico llega a popularizarse, podría ser un cambio brutal en cómo se desarrollan y personalizan LLMs. Algo así como pasar del bricolaje detrás de pantallas blancas donde todo está metido con martillo al detalle fino de diseñar cada función con precisión quirúrgica.
Eric Ho no se corta al decirlo: “Si conseguimos que entrenar modelos sea más parecido a construir software, no hay razón para que no surjan muchas empresas creando IA a medida para sus necesidades”. Porque la verdad es que, hasta ahora, el panorama está plagado de monstruos de código duro de domar, donde la ingeniería traduce a menudo a ensayo y error (y mucha pasta quemada).
Sí, seguro, Silico no es barato, ni siquiera han soltado precios claros, pues dependen de qué y para quién. Pero, la idea de extender a un público más amplio estos recursos de alto nivel —antes solo al alcance de milmillonarios y tech lab plenos— puede cambiar las reglas del juego.
El impacto en sectores críticos, ¿valdrá la pena la apuesta?
Más allá de la excitación geek, la verdadera prueba está en si estas herramientas marcan la diferencia donde la utilidad es cuestión de vida o muerte: la salud, las finanzas, la seguridad. Bereska apunta justo ahí: “los laboratorios punteros ya tienen sus equipos internos de interpretabilidad, pero herramientas como Silico facilitan a empresas de segundo nivel poder crear modelos confiables sin tener que contratar expertos en interpretabilidad”.
¿Resultado? Podrían llegar modelos más seguros para diagnosticar enfermedades, evaluar riesgos o guiar decisiones cruciales. Quién sabe, quizás estamos a las puertas de abandonar la fase donde confiábamos ciegamente en cajas negras (y de peligroso uso) para empezar a vigilar, entender y corregir errores antes de que hagan daño real.
Claro, queda mucho camino, y la herramienta no es infalible. Pero mientras las grandes iwiigigantes siguen apostando al “más grande, más potente y ya”, Goodfire ha encendido la luz de que quizá haya algo más inteligente: saber lo que sucede delante y detrás del telón.
¿Vale la pena apostar por la “ingeniería” de Goodfire o es solo otra moda pasajera?
La cuestión final es si Silico acabará siendo un must en el desarrollo de IA o se quedará en un experimento caro para unos pocos. Su éxito dependerá de la capacidad de Goodfire para convencer a empresas y desarrolladores de que vale la pena invertir en ese plus de control y calidad. En un mercado que se mueve rápido, lo que no aporta resultados palpables queda en el olvido.
Pero la presión por modelos transparentes, seguros y menos dados al “error humano” invertido en código es cada vez superior, por motivos regulatorios, éticos y comerciales. No hablamos solo de hacer modelos más eficientes, sino más confiables frente a usuarios, reguladores y hasta las propias compañías que los usan.
Así que la pregunta incómoda: ¿seguirán reinando los modelos de caja negra o veremos que la próxima hornada de AI será toda “ingeniería visible”, editable y, sobre todo, explicable? Silico apunta a que vamos a tener que aprender a mirar dentro. Porque quedarse solo con “funciona” ya no basta.
¿Será esta la hora de la verdad en la AI o solo otro espejismo tecnológico? Tú, que andas metido en esto, ¿cómo ves la cosa?
