V4 de DeepSeek ya está aquí: ¿revolución o más de lo mismo?
El pasado viernes, DeepSeek, esa empresa china que sacó de la nada al R1, lanzó un avance de su modelo V4, el que promete reventar los límites de lo que conocemos en IA abierta. ¿Por qué importa? Porque este modelo puede procesar cantidades ingentes de texto sin arruinarse en el intento, y lo más llamativo: sigue siendo open source. Un lujo poco común entre los más recientes bestias de IA, que se guardan bajo llave sus pesos y algoritmos.
Volvemos a la palestra con una versión mucho más pulida, tras la locura que generó R1 en enero de 2025, cuando ese modelo rompió el mercado, especialmente por su eficiencia brutal a pesar del poco hardware usado para entrenarlo. DeepSeek pasó en meses de ser casi invisible a la cara visible del boom AI chino. Pero ojo, no todo ha sido sencillo: despidos, retrasos e investigaciones gubernamentales pusieron su reputación en espera. Ahora, V4 levanta la mano con promesas potentes, aunque no espere una locura parecida a R1.
Y vayamos con el detonante real que trae este V4: la capacidad de tragarse y procesar prompts larguísimos como si nada. Literalmente, estamos hablando de manejar hasta 1 millón de tokens, suficiente para tres libros de Tolkien JR Tolkien (sí, no me equivoqué, los auténticos tochazos de *El Señor de los Anillos* y *El Hobbit* juntos) sin pestañear. Eso, en el universo de los modelos de lenguaje, es jugar en otra liga.
¿Costo? Aquí viene la salsa. DeepSeek no solo lanza un monstruo de potencia, sino que lo hace más barato que sus rivales americanos. La versión tocha, V4-Pro, cobra unos 1,74 dólares por millón de tokens de entrada y 3,48 por millón en la salida. La versión flash es la verdadera ganga: apenas 0,14 y 0,28 respectivamente. Para comparar, OpenAI está en otra órbita de precios y eso mantiene a muchos a raya para ciertos proyectos. Ahí DeepSeek mete la puñalada con un modelo que promete ser ultra competitivo.
¿Pero qué tiene V4 que no sea solo más barato?
Aquí la cosa se pone interesante. V4 no es solo barato, está diseñado para ser fantástico en diferentes frentes técnicos. En simulaciones y benchmarks, se le mide codo a codo con los grandes: GPT-5.4 de OpenAI, Claude-Opus-4.6 de Anthropic, e incluso Google Gemini-3.1. Nada mal para un proyecto «de garaje», si me apuras.
No solo eso, en áreas que suelen ser la pesadilla de muchos: programación, matemáticas, problemas STEM, V4 le da un repaso considerable a otros open-source chinos como Qwen-3.5 de Alibaba o Z.ai’s GLM-5.1. Esto no es cualquier cosa. Para quien quiera desarrollar apps, automatizar código o montar sistemas complejos, contar con un modelo que realmente entienda y razone más allá de marcos simples es un tesoro.
De hecho, según los resultados compartidos por DeepSeek, más del 90% de los 85 desarrolladores experimentados encuestados consideran a V4-Pro su opción principal para tareas de programación. Está optimizado para manejadores populares tipo Claude Code, OpenClaw y CodeBuddy, reforzando que está pensado para estar en primera línea en integraciones prácticas. No es un simple capricho teórico, sino un arma lista para el campo de batalla digital.
Y ese «razonamiento paso a paso» que ofrecen ambos modelos no es marketing vacío: explica en vivo cómo llega a sus conclusiones, lo cual es fundamental para transparentar la caja negra que suelen ser estos modelos y para detectar errores o prever fallos (algo que siempre salva el pellejo a los desarrolladores).
La verdad detrás de esos 1 millón de tokens: memoria y eficiencia sin trucos baratos
Meter 1 millón de tokens en un modelo no es cosa de magia. El verdadero misterio es cómo lo hace V4 sin que la factura computacional se dispare y con hardware estándar (bueno, Huawei Ascend y compañía, pero aquí luego ahondamos en eso).
La trampa estaba en la arquitectura y, principalmente, en el mecanismo de atención: esa capacidad de los modelos para concentrarse exactamente en las partes relevantes del texto. En modelos antiguos, a medida que el texto crece, la atención se vuelve un cuello de botella – una bola de nieve en costes computacionales y uso de memoria.
DeepSeek decidió no tratar todos los tokens del texto anterior como iguales, sino comprimir la información antigua y mantener con detalle solo aquello que parece vital para resolver el problema actual. Para que te hagas idea, con V4-Pro en ese contexto kilométrico, usa el 27% de la energía que su predecesor V3.2 gastaba, y reduce la memoria a un 10%. En versión flash el ahorro es aún más bestia: solo consume el 10% de computación y 7% de memoria.
Esta innovación no es de ahora, viene de un año y medio de investigación silenciosa, con papers que exploran cómo «recordar» y comprimir información vital para no reventar el sistema. Eso cambia las reglas del juego: ¿quieres una IA que sepa todo tu código, incluidos todos sus detalles, sin perderse? O ¿una que analice miles de documentos sin olvidarse del principio? Esto abre la puerta a apps que antes parecían ciencia ficción para IA abierta.
Es, en resumidas cuentas, un salto no solo en tamaño o potencia, sino en cómo se puede usar un modelo grande en situaciones reales y costosas en datos, expandiendo las fronteras prácticas del deep learning.
¿Adiós, Nvidia? Los primeros pasos para que China no dependa de chips estadounidenses
Aquí está el meollo geopolítico y tecnológico. V4 es el primer modelo de DeepSeek que está optimizado para chips chinos, como el Ascend de Huawei. La jugada viene con mucha presión detrás: las restricciones de exportación de EEUU han cortado el acceso a los chips Nvidia más potentes para la industria china, un golpe duro para un país que quiere ser referente en IA.
La noticia sorprendente (aunque la lógica la anticipaba) es que DeepSeek no dio acceso anticipado a Nvidia o AMD a V4, lo que rompe con la costumbre del sector que suele compartir detalles para optimizar sus chips. En cambio, se lo dieron a fabricantes chinos solamente. La misma Huawei anunció que la supercomputadora basada en Ascend 950 soportará V4, lo que permite ejecutar el modelo fácilmente en hardware nacional.
Desde las oficinas del gobierno hasta las grandes empresas chinas, han presionado para que se reemplacen chips extranjeros por nacionales en sectores estratégicos. La idea es clara: crear un ecosistema AI completo, de punta a punta, sin dependencias que puedan descarrilarse por sanciones o conflictos internacionales.
Pero ojo, el cambio no es un plug and play. Nvidia no solo vende chips, vende ecosistemas con APIs, herramientas, software que llevan años desarrollándose. Adaptar todo esto a Huawei Ascend implica reprogramar código, reconstruir librerías y demostrar la estabilidad que clientes serios exigen.
Que V4 use chips chinos para *inferencia* (ejecutar el modelo) es solo un primer paso; para *entrenamiento* parece que todavía depende en parte de NVIDIA. Según fuentes para MIT Technology Review, chips como Ascend funcionan mejor para correr modelos ya entrenados que para entrenarlos. La batalla está en marcha, pero no es inmediata.
¿Pasa de esto que DeepSeek baje precios? El plan lo tiene claro: esperan que el despliegue masivo de supernodos Huawei Ascend 950 en la segunda mitad de 2024 reduzca los costes, lo que haría V4 aún más atractivo en precio (ya de por sí competitivo). Resumen: Beijing puede estar cocinando un ecosistema AI paralelo y robusto, y DeepSeek V4 es la primera señal seria.
¿Podrá V4 romper el molde y cambiar el juego del AI global?
No esperes un R1 2.0. La expectación alrededor de V4 es alta, pero el lanzamiento no parece dispuesto a revolucionar la industria como en 2025. Sus mejoras son más evolutivas que disruptivas: la memoria larga, eficiencia brutal y precios competitivos pondrán presión a competidores, sí, pero la batalla del AI se juega en muchos frentes simultáneos, y modelos cerrados con respaldo de ultraprofundos recursos siguen dominando.
Eso no quita que DeepSeek mantiene algo único con su compromiso open source, un lujo en la industria en la que muchas veces todo queda sellado y bajo licencia restrictiva, lo que mata innovaciones y adaptaciones locales.
Su alineación con chips chinos abre preguntas inquietantes para todos: ¿asistimos a la fragmentación de la infraestructura global de IA en bloques tecnológicos? ¿Cuánto pueden escalar los chips domésticos frente a Nvidia o AMD? Y sobre todo, ¿qué significa esto para desarrolladores fuera de China?
V4 marca un capítulo donde la innovación técnica se junta con la geopolítica brutal. El potencial está ahí, la ejecución dependerá de si DeepSeek puede sortear las limitaciones de hardware y política para atraer a un ecosistema global, o si quedará como un gigante doméstico con alcance limitado.
Las vueltas que trae la IA abierta a precio de risa
Que DeepSeek ofrezca acceso abierto a un modelo capaz de competir con los mejores, y más barato, es una noticia que debería hacer saltar de la silla a las startups y desarrolladores que no se fían de pagar fortunas a OpenAI o Anthropic. Tener versiones como V4-Pro (ultra potente) y V4-Flash (para quienes quieren velocidad y economía) es jugada maestra.
En especial, cuando los costes tarifarios están en un nivel donde el freelancer medio o la pequeña empresa tecnológica pueden permitirse integrar capacidades de IA avanzada sin arruinarse. Aquí hay un enorme cambio, porque democratiza la innovación, permite ver nuevas apps que aprovechan código, investigación, procesamiento de lenguaje complejo.
No todo es perfecto: todavía suelen caer en las trampas clásicas de modelos grandes (alucinaciones, limitaciones en sentido común, ambas partes incluyendo open source), pero la velocidad con la que avanzan estos modelos y lo abierto que están los hace más corregibles y adaptables para quienes realmente entienden su arquitectura.
Si el hardware chino logra el salto pendiente, y los costes bajan, esta clase de modelos podría ser la opción preferida para infinidad de casos prácticos. Quizá no se vaya a la luna hoy, pero el camino ya está marcado y DeepSeek va en primera marcha.
¿La IA se abre camino fuera del club cerrado? Depende de ti
La historia de DeepSeek V4 no es solo un lanzamiento de un modelo más. Es un síntoma del tira y afloja entre control, precio y poder tecnológico.
¿Quieres una IA potente, transparente, asequible y que puedas modificar? Va a costarte trabajo encontrar opciones tan genuinamente open source y competitivas. Pero también recuerda que el desarrollo de estas tecnologías depende del soporte de hardware poderoso y ecosistemas estables que no están al alcance de cualquiera (ese es uno de los muros a saltar).
Así que, si te dedicas a AI, desarrollo o sólo tienes curiosidad, V4 es un indicativo fuerte: los modelos gigantes no los controlan solo un puñado de gigantes americanos, hay otros players dispuestos a poner monedas sobre la mesa y cambiar las reglas.
¿Significa esto que toda la industria se fragmentará a términos geopolíticos y de barreras técnicas? Seguramente sí. ¿Esto es bueno o malo? ¿Aceptas que los modelos que usas o desarrollas vengan de un lado o de otro? Preguntas para las que no hay respuestas fáciles.
Y tú, ¿vas a seguir sin mirar alternativas o estás listo para explorar esos mundos open source que cada vez se ponen más serios y baratos?
