Compra criptomonedas

Pagar con

USD

Acepta Visa, Mastercard, SEPA y más

Trading flexible y sin tarifas

Paga con tus cripto en todo el mundo

Básico

Opera con criptomonedas libremente

Multiplica tus beneficios con el apalancamiento

Convertir e Inversión automática

Opera cualquier volumen sin tarifas ni deslizamiento

Obtén exposición a posiciones apalancadas de forma sencilla

Trading premercado

Opera nuevos tokens antes de su listado

Avanzado

Opera on-chain con Gate Wallet

Acceso inteligente a novedades on-chain

Estrategias smart y trading automatizado

Sigue estrategias de trading de expertos

Trading CrossEx

Un solo saldo de margen compartido entre plataformas

Accede a cientos de contratos perpetuos

Plataforma global de activos tradicionales

Opera con opciones estándar al estilo europeo

Cuenta unificada

Maximiza la eficacia de tu capital

Trading de prueba

Introducción al trading de futuros

Prepárate para operar con futuros

Eventos de futuros

Únete a eventos para ganar recompensas

Trading de prueba

Usa fondos virtuales para probar el trading sin asumir riesgos

Derivados de CFD de acciones estadounidenses

Alto apalancamiento, trading 24/7

Acciones tokenizadas

Respaldado por acciones reales

Accede al acceso completo a las OPV de acciones globales

Acuña GUSD para obtener rendimientos de RWA del Tesoro

Lanzamiento

Acumula golosinas para ganar airdrops

Staking rápido, ¡gana nuevos tokens con potencial!

Holdea GT y consigue airdrops enormes gratis

Accede al acceso completo a las OPV de acciones globales

Opera activos on-chain y recibe airdrops

Puntos de futuros

Gana puntos de futuros y reclama recompensas de airdrop

Inversión

Genera intereses con los tokens inactivos

Inversión automática

Invierte automáticamente de forma regular

Inversión dual

Aprovecha la volatilidad del mercado

Staking flexible

Gana recompensas con el staking flexible

Préstamo de criptomonedas

Usa tu cripto como garantía y pide otra en préstamo

Centro de préstamos

Centro de préstamos integral

Centro de patrimonio VIP

Planes de aumento patrimonial prémium

Gestión patrimonial privada

Asignación de activos prémium

Estrategias cuantitativas de alto nivel

Haz staking de criptomonedas para ganar en productos PoS

Apalancamiento inteligente

Apalancamiento sin liquidación

USD1 Gana por holdear

Sin bloqueo, opera y retira

Descubra el valor en criptomonedas

Análisis del mercado de criptomonedas en tiempo real

Chatea con traders de criptomonedas

Lo que está ocurriendo en el mundo de las criptomonedas

Más

Promociones

Centro de actividades

Únete a actividades y gana recompensas

Invita amigos y gana por tus referidos

Programa de afiliados

Gana recompensas de comisión exclusivas

Aumenta tu influencia y gana airdrops

Novedades de plataforma en tiempo real

Artículos del sector de las criptomonedas

Grandes descuentos en tarifas

Gestión de activos

Solución integral para la gestión de activos

Soluciones de activos digitales: empresas

Desarrolladores (API)

Conecta con el ecosistema de aplicaciones Gate

Transferencia bancaria OTC

Deposita y retira fiat

Programa de bróker

Reembolsos generosos mediante API

AI

Tu compañero de IA conversacional para todo

Usa Gate AI directamente en tu aplicación social

Gate Blue Lobster, listo para usar

Gate for AI Agent

Infraestructura de IA, Gate MCP, Skills y CLI

Gate Skills Hub

+10 000 habilidades

De la oficina al trading, una biblioteca de habilidades todo en uno para sacar el máximo partido a la IA

Elige inteligentemente entre más de 40 modelos de IA, con 0% de costos adicionales

Otros

Encuentra preguntas frecuentes y guías de ayuda

Aprende a invertir en criptomonedas

Crece con los campeones

Prueba de Reservas

Gate garantiza el 100 % de prueba de reservas

Mantén tus activos seguros

Perplexity 披露网络搜索代理的后训练方法；基于 Qwen3.5 的模型在准确率与成本上优于 GPT-5.4

Agente de IA Noticias de la industria de la IA

2026-04-23 04:54:56

封面新闻消息，4 月 23 日——Perplexity 的研究团队发布了一篇技术文章，详细说明其用于网络搜索代理的后训练方法。该方法使用两个开源的 Qwen3.5 模型 (Qwen3.5-122B-A10B 和 Qwen3.5-397B-A17B)，并采用两阶段流水线：先进行监督微调 (SFT) 以建立指令遵循与语言一致性，然后通过在线强化学习 (RL) 来优化搜索准确性与工具使用效率。

RL 阶段使用 GRPO 算法，来自两类数据源：一是由内部种子查询构建的专有多跳可验证问答数据集，这些查询需要 2–4 跳推理，并采用多解算器验证；二是基于评分标准的通用对话数据，它将部署需求转换为客观可核查的原子条件，以防止 SFT 行为退化。

奖励设计采用门控聚合——只有在达到基线正确性时（(question-answer match 或所有评分标准要求均满足)）偏好分数才会计入，避免高偏好信号掩盖事实错误。效率惩罚使用组内锚定：对工具调用以及生成长度施加平滑惩罚，这些值超过了同一组中正确答案的基线水平。

评估显示，Qwen3.5-397B-SFT-RL 在各项搜索基准上实现了同类最佳表现。在 FRAMES 上，它在单次工具调用时达到 57.3% 的准确率，较 GPT-5.4 高出 5.7 个百分点，较 Claude Sonnet 4.6 高出 4.7 个百分点。在适度预算 (four tool calls) 下，它以每次查询 $0.02 的成本达到 73.9% 准确率；相比之下，GPT-5.4 在每次查询 $0.085 时准确率为 67.8%，Sonnet 4.6 在每次查询 $0.153 时准确率为 62.4%。成本数据基于各提供方公开的 API 定价，并不包含缓存优化。

Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.

Noticias relacionadas

Australia colabora con Anthropic para abordar los riesgos de ciberseguridad de la IA Mythos

Google Lanza Chips de IA Separados para Entrenamiento e Inferencia, Aumentando el Rendimiento 2.8x

OpenClaw, Hermes y SillyTavern confirmados como proyectos con soporte en el GLM Coding Plan

OpenAI lanza un modelo de Filtro de Privacidad de código abierto para la detección y anonimización de PII

Yifan Zhang divulga las especificaciones técnicas completas de DeepSeek V4: 1.6T parámetros, 384 expertos con 6 activaciones

Análisis en profundidad

Moomoo? CISO? Alerta: ShinyHunters afirma haber comprometido los sistemas internos de Anthropic

Market Whisper04-23 03:31

OpenAI anuncia los ChatGPT Workspace Agents: impulsados por Codex, compartidos por el equipo, integración con Slack

ChainNewsAbmedia04-23 02:55

Google 推 Deep Research Max：支援 MCP、可接企業私有資料

ChainNewsAbmedia04-21 18:14

Comentar

0/400

Sin comentarios