DeepSeek recauda financiación a una valoración de $45B en medio de la competencia de la IA

El laboratorio de IA chino DeepSeek está en conversaciones para levantar su primera ronda de financiación con una valoración reportada de 45 mil millones de USD, según TechCrunch. La valoración supone un aumento significativo frente a una estimación de 20 mil millones de USD apenas unas semanas antes, después de la atención que atrajeron los modelos de IA de la empresa por sus menores costes de entrenamiento. El fundador Liang Wenfeng controla casi el 90% de la compañía.

Motivación de la recaudación de fondos e interés de los inversores

DeepSeek decidió buscar financiación después de que sus rivales intentaran reclutar investigadores ofreciendo acciones de la empresa como incentivo. El Fondo de Inversión de la Industria China de Circuitos Integrados podría liderar la ronda, mientras que Tencent y Alibaba también estarían en conversaciones para participar.

Rendimiento de los modelos y precios

Se informa que el modelo V4 de DeepSeek rinde a la par con los principales modelos de OpenAI y Anthropic en pruebas de referencia, según la empresa. La ventaja competitiva también se extiende a la fijación de precios: V4-Pro cuesta 1,74 USD por un millón de tokens de entrada, mientras que V4-Flash cuesta aproximadamente 0,14 USD por un millón de tokens de entrada, considerablemente por debajo del precio de modelos estadounidenses comparables.

La estructura de costes más baja se debe a la arquitectura eficiente en cómputo de DeepSeek, incluido un diseño de mixture-of-experts (MoE) que activa solo una parte del modelo para cada tarea, reduciendo las necesidades de cómputo durante la inferencia. Según DeepSeek, V4-Pro usa el 27% de la potencia de cómputo y el 10% de la memoria necesaria por V3.2.

Estrategia de autosuficiencia en IA de China

La ronda de financiación de DeepSeek se produce mientras China busca construir una infraestructura de IA más autosuficiente en respuesta a los controles de exportación de EE. UU. sobre chips avanzados. V4 es el primer modelo de DeepSeek ajustado para chips chinos como la serie Ascend de Huawei; sin embargo, el informe técnico de la empresa indica que los chips chinos gestionan la inferencia mientras que el entrenamiento aún puede depender principalmente del hardware de Nvidia.

DeepSeek también lanza modelos de pesos abiertos—parámetros entrenados que otros pueden usar, ajustar y desplegar—ampliando el desarrollo de IA más allá del dominio de EE. UU. Esta estrategia prioriza la eficiencia algorítmica por encima del acceso exclusivo al hardware estadounidense más avanzado, aunque el impulso de IA de China sigue dependiendo parcialmente del hardware de Nvidia.

Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
LittleSunOfStainedGlassvip
· 05-09 11:36
De 2 mil millones a 4.5 mil millones, ¿solo con unos demos de modelos? La capacidad del capital para contar historias siempre es más rápida que la iteración tecnológica.
Ver originalResponder0
GateUser-0aa20a11vip
· 05-07 01:27
45B de valoración, incluso OpenAI quedó en silencio, el gran modelo nacional está en camino de adelantar en curva
Ver originalResponder0
GateUser-e5e2e632vip
· 05-07 01:26
DeepSeek esta valoración ha subido más rápido que las criptomonedas, se ha duplicado en unas semanas, la burbuja de IA ha sido confirmada.
Ver originalResponder0