DeepSeek lanza V4 con soporte para chips Huawei Ascend

DeepSeek ha lanzado la vista previa de DeepSeek-V4, una nueva familia de modelos de inteligencia artificial optimizada para chips Huawei Ascend. El lanzamiento refuerza la estrategia china de reducir la dependencia de Nvidia en infraestructura de IA avanzada.

DeepSeek-V4 llega en dos versiones principales. DeepSeek-V4-Pro usa 1,6 billones de parámetros totales y 49.000 millones de parámetros activos. DeepSeek-V4-Flash usa 284.000 millones de parámetros totales y 13.000 millones de parámetros activos. Ambos modelos admiten una ventana de contexto de un millón de tokens.

DeepSeek-V4 se adapta a la infraestructura Huawei Ascend

La novedad central está en el hardware. Reuters informó que DeepSeek-V4 fue adaptado para los chips Huawei Ascend más avanzados. Huawei también confirmó que su línea Ascend SuperNode ofrece soporte completo para los modelos DeepSeek-V4.

La adaptación marca un cambio frente a generaciones anteriores de DeepSeek. Reuters indicó que los modelos DeepSeek-V3 y DeepSeek-R1 se entrenaron con chips Nvidia. DeepSeek no ha confirmado si todo el entrenamiento de V4 se realizó con hardware chino.

Huawei dijo que sus chips se usaron en parte del entrenamiento de DeepSeek-V4-Flash. También afirmó que toda la línea Ascend SuperNode soporta la inferencia de la serie V4. La inferencia es el proceso en el que un modelo ya entrenado responde consultas o ejecuta tareas.

V4-Pro y V4-Flash llegan con pesos abiertos y contexto de 1 millón de tokens

DeepSeek publicó los pesos de V4-Pro y V4-Flash en Hugging Face bajo licencia MIT. Esa licencia permite uso, modificación y comercialización del modelo. DeepSeek también ofrece acceso desde su web y desde su API.

DeepSeek presenta V4-Pro como el modelo principal de la serie. La empresa afirma que V4-Pro lidera entre modelos abiertos en pruebas de conocimiento, matemáticas, STEM, codificación y razonamiento. Hay que mencionar que esas cifras proceden de los benchmarks publicados por DeepSeek y necesitan comparación independiente en uso real.

DeepSeek-V4-Flash funciona como versión más ligera. El modelo mantiene el contexto de un millón de tokens (aproximadamente 700,000 – 750,000 palabras) y reduce el número de parámetros activos frente a V4-Pro. DeepSeek lo posiciona para respuestas más rápidas y costes más bajos.

DeepSeek reduce el coste de API para atraer desarrolladores

DeepSeek lista V4-Flash a 0,14 dólares por millón de tokens de entrada con cache miss y 0,28 dólares por millón de tokens de salida. V4-Pro cuesta 0,435 dólares por millón de tokens de entrada y 0,87 dólares por millón de tokens de salida durante el descuento activo del 75%.

El precio normal de V4-Pro figura en 1,74 dólares por millón de tokens de entrada y 3,48 dólares por millón de tokens de salida. DeepSeek también redujo el precio de los cache hits de entrada a una décima parte del precio inicial.

La estrategia de precio se combina con la ventana de contexto larga. Los modelos V4 pueden procesar documentos extensos, sesiones de agente y flujos de herramientas con menos coste por token que muchos servicios cerrados de gama alta.

La demanda de chips Huawei se dispara tras el lanzamiento del nuevo modelo de DeepSeek

Reuters informó el 29 de abril que la demanda de chips Huawei Ascend 950 aumentó tras el lanzamiento de DeepSeek-V4. ByteDance, Tencent y Alibaba contactaron con Huawei para nuevos pedidos, según fuentes citadas por la agencia.

Alibaba Cloud incorporó V4-Pro y V4-Flash en su plataforma Bailian el mismo día del lanzamiento. Tencent Cloud también lanzó servicios preview de V4 en TokenHub. Estos despliegues aumentan el uso potencial de la serie V4 y elevan la demanda de infraestructura Ascend.

Reuters también señaló limitaciones de suministro. Huawei espera aumentar la producción de Ascend 950, pero las restricciones estadounidenses sobre herramientas avanzadas de fabricación de chips siguen afectando la capacidad china de fabricar semiconductores de gama alta.

El lanzamiento llega en plena tensión tecnológica entre China y Estados Unidos

DeepSeek-V4 se publica mientras Estados Unidos mantiene restricciones sobre la venta de chips avanzados a China. El modelo también llega después de acusaciones estadounidenses sobre presunta extracción y destilación de modelos de IA occidentales por parte de empresas chinas.

China rechazó esas acusaciones. DeepSeek no ha confirmado una independencia total de Nvidia en el entrenamiento de V4. El dato verificado es más limitado: V4 fue adaptado para Huawei Ascend, Huawei soporta la serie V4 y parte del entrenamiento de V4-Flash usó chips Huawei.

DeepSeek-V4 no prueba una independencia completa de la cadena estadounidense de chips. Sí muestra una integración más profunda entre modelos chinos y hardware chino. Ese es el punto técnico principal del lanzamiento.