Goodfire lanza Silico para depurar modelos de IA durante el entrenamiento

Goodfire quiere convertir el entrenamiento de IA de ensayo y error en un proceso de ingeniería depurable

La startup Goodfire ha lanzado Silico, una herramienta de interpretabilidad mecanística diseñada para que los investigadores inspeccionen y ajusten el comportamiento del modelo durante el entrenamiento, no solo auditar sistemas terminados después de hecho

DT Editorial AI

Apr 30, 2026·4 min read·971 words

La interpretabilidad mecanística está pasando de idea de investigación a categoría de producto

La startup de San Francisco Goodfire ha lanzado una herramienta llamada Silico que busca permitir a los desarrolladores de modelos inspeccionar e influir en grandes modelos de lenguaje durante el entrenamiento. La propuesta de la empresa es simple pero ambiciosa: construir sistemas de IA debería parecerse menos a la alquimia y más a la ingeniería de software.

Ese planteamiento toca una de las frustraciones centrales de la IA moderna. Los grandes modelos pueden rendir de forma notable y, al mismo tiempo, seguir siendo difíciles de entender con precisión. Los desarrolladores pueden observar resultados, ajustar el comportamiento y comparar métricas, pero a menudo carecen de un mapa claro de por qué un modelo se comporta internamente como lo hace. Eso vuelve más difícil diagnosticar fallos y prevenir tendencias no deseadas.

Goodfire apuesta a que la interpretabilidad mecanística puede acortar esa distancia y que el momento es el adecuado para empaquetar los métodos del campo en un producto más utilizable.

Qué se supone que hace Silico

Según la empresa, Silico permite a investigadores e ingenieros mirar dentro de un modelo y ajustar parámetros que moldean el comportamiento mientras el entrenamiento aún está en marcha. Goodfire lo describe como el primer sistema listo para usar de su tipo, diseñado para ayudar a los desarrolladores a depurar múltiples etapas de la creación de modelos, desde la construcción del conjunto de datos hasta el entrenamiento.

El énfasis en el entrenamiento importa. Muchos esfuerzos de interpretabilidad se han centrado en auditar modelos después de que ya están construidos. El objetivo de Goodfire es llevar esos conocimientos antes, al desarrollo, para que los creadores de modelos puedan utilizarlos como mecanismos de dirección y no solo como herramientas de diagnóstico a posteriori.

Si funciona como se promete, el cambio sería significativo. Sugeriría un futuro en el que los desarrolladores puedan intervenir con más precisión, en lugar de depender sobre todo de la escala, la experimentación a la fuerza bruta y las salvaguardas posteriores.

Innovation

Volkswagen ha presentado el ID.Polo, un compacto eléctrico de carrocería hatchback que combina una configuración de VE convencional con un lenguaje de diseño más tradicional y el regreso de los controles físicos en el tablero.

DT Editorial AI·Apr 30, 2026·via newatlas.com

Innovation

Investigadores de Texas A&M afirman que las metasuperficies a escala nanométrica permiten que diminutos dispositivos se eleven y maniobren solo con iluminación láser, lo que abre nuevas posibilidades para la propulsión basada en luz.

DT Editorial AI·Apr 30, 2026·via newatlas.com

Innovation

Australia ha presentado un proyecto de ley que gravaría a las principales plataformas digitales sobre parte de sus ingresos locales si no llegan a acuerdos con los editores de noticias, reavivando la disputa sobre quién paga por el periodismo en línea.

DT Editorial AI·Apr 30, 2026·via fastcompany.com

Un desafío más amplio en la IA de frontera

El lanzamiento de Goodfire llega en medio de un interés creciente por la interpretabilidad mecanística en grandes laboratorios, incluidos Anthropic, OpenAI y Google DeepMind. El campo intenta entender cómo los modelos realizan tareas mediante el mapeo de neuronas y las rutas entre ellas. Ese enfoque ha ganado suficiente relevancia como para que MIT Technology Review incluyera la interpretabilidad mecanística entre sus tecnologías de avance para 2026.

El atractivo es evidente. Si los desarrolladores pueden identificar rasgos internos vinculados con alucinaciones, sesgo, comportamientos inseguros o razonamientos frágiles, quizá puedan corregir esos comportamientos con mayor precisión. Eso supondría una mejora importante frente a un ciclo de desarrollo dominado por conjuntos de datos más grandes, más computación y repetidas rondas de ajuste cuyos efectos internos siguen siendo en parte opacos.

Eric Ho, CEO de Goodfire, presenta la posición de la empresa como un desafío directo a la idea de que más escala por sí sola entregará todo el progreso que importa. En cambio, la compañía defiende exponer los controles internos necesarios para tratar el desarrollo de modelos como ingeniería de precisión.

Goodfire quiere convertir el entrenamiento de IA de ensayo y error en un proceso de ingeniería depurable

La interpretabilidad mecanística está pasando de idea de investigación a categoría de producto

Qué se supone que hace Silico

Related Articles

Keep Reading

El software seguro en memoria está surgiendo como una respuesta estructural a los ciberataques acelerados por IA

Un desafío más amplio en la IA de frontera

De métodos internos a herramienta comercial

La nueva cargo e-bike de JackRabbit apunta al problema de los apartamentos

Por qué importa el lanzamiento

La señal más grande

El lanzamiento de Titan Noir de XGIMI apuesta a que mejores niveles de negro puedan reavivar el entusiasmo por los proyectores

Comments (0)

El ID.Polo de Volkswagen señala una fase más familiar de la era del vehículo eléctrico

Los “metajets” impulsados por luz sugieren una nueva forma de dirigir el vuelo microscópico

Australia propone un gravamen sobre los ingresos de las plataformas digitales para apoyar al periodismo