Nvidia abre Nemotron 3 Ultra, modelo insignia con 550B de parámetros y arquitectura híbrida MoE de Mamba-Transformer

Según Beating, Nvidia lanzó su modelo lingüístico grande insignia Nemotron 3 Ultra el 4 de junio, con 550 mil millones de parámetros totales y 55 mil millones de parámetros activos. El modelo obtiene 48 en el índice de inteligencia de Artificial Analysis, lo que lo convierte en el modelo de código abierto de EE. UU. con mejor rendimiento, solo superado por Kimi K2.6, que logra 54 puntos.

El modelo utiliza una arquitectura híbrida MoE (Mamba-Transformer) que alterna capas de espacio de estados Mamba-2 con capas de atención Transformer, permitiendo una ventana de contexto de 1 millón de tokens y evitando el crecimiento cuadrático de la caché KV. En comparación con modelos densos de escala similar, la arquitectura híbrida logra 5 veces más rendimiento y un 30% menos de costos de inferencia en tareas de agentes. Nemotron 3 Ultra está disponible en Hugging Face, NVIDIA NIM y OpenRouter.

Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios