Los modelos de lenguaje pequeños (SLM) se promocionan como la próxima gran cosa en IA

Mientras las empresas están invirtiendo dinero en grandes modelos de lenguaje (LLMs), algunos expertos de la industria en el sector de IA creen que los modelos de lenguaje pequeños (SLMs) se convertirán en la próxima gran cosa.

Esto ocurre mientras la actividad en la industria continúa creciendo, ya que la temporada festiva se acerca y las empresas tecnológicas están invirtiendo más financiación para desarrollar su tecnología.

El futuro está en modelos de lenguaje pequeños

El likes de xAI dirigido por el multimillonario Elon Musk logró recaudar $5 mil millones adicionales de Andreessen Horowitz, Qatar Investment Authority, Sequoia y Valor Equity Partners, mientras que Amazon invirtió otros $4 mil millones en Anthropic, un rival de OpenAI.

Mientras estas grandes tecnologías y otras están invirtiendo miles de millones de dólares centrados en desarrollar grandes LLM para manejar muchas tareas diferentes, la realidad de la IA es que no existe una solución única, ya que se necesita modelos específicos para tareas empresariales.

Según el director ejecutivo de AWS, Matt Garman, en un comunicado sobre su expansión de asociación e inversiones, ya hay una abrumadora respuesta de los clientes de AWS que están desarrollando inteligencia artificial generativa impulsada por Anthropic.

Para la mayoría de las empresas, los LLM siguen siendo la opción número uno para ciertos proyectos, pero para otros, esta elección puede resultar costosa en términos de costos, energía y recursos informáticos.

Steven McMillan presidente y CEO de Teradata, que ha ofrecido un camino alternativo para algunas empresas, también tiene otras opiniones. Él está seguro de que el futuro está en los SLM.

“A medida que miramos hacia el futuro, creemos que los modelos de lenguaje pequeños y medianos y los entornos controlados, como los LLM específicos de dominio, proporcionarán soluciones mucho mejores.”

~ McMillan

Los SLM producen salidas personalizadas sobre tipos específicos de datos, ya que los modelos de lenguaje están especialmente entrenados para hacerlo. Dado que los datos generados por los SLM se mantienen internamente, los modelos de lenguaje están entrenados en datos potencialmente sensibles.

Dado que los LLMs consumen energía, las versiones de lenguaje pequeño se entrenan para ajustar tanto la computación como el consumo de energía a las necesidades reales del proyecto. Con tales ajustes, significa que los SLMs son eficientes a un costo menor que los modelos grandes actuales.

Para los usuarios que deseen utilizar la IA para conocimientos específicos, existe la opción de LLM específicos de dominio, ya que no ofrecen conocimientos amplios. Está entrenado para comprender profundamente solo una categoría de información y responder de manera más precisa, por ejemplo, un CMO en comparación con un CFO, en ese dominio.

Por qué los SLM son una opción preferida

Según la Asociación de Científicos de Datos (ADaSci), desarrollar completamente un SLM con 7 mil millones de parámetros para un millón de usuarios requeriría solo 55.1MWh (Megavatios hora).

ADaSci descubrió que entrenar a GPT-3 con 175 mil millones de parámetros consumió aproximadamente 1,287MWh de electricidad y la potencia no incluye cuando se utiliza oficialmente por el público. Por lo tanto, un SLM utiliza aproximadamente el 5% de la energía consumida durante el entrenamiento de un LLM.

Los modelos grandes suelen ejecutarse en computadoras en la nube porque utilizan más potencia de cálculo de la que está disponible en un dispositivo individual. Esto resulta en complicaciones para las empresas, ya que pierden el control sobre su información a medida que se traslada a la nube, y respuestas lentas a medida que viajan a través de Internet.

Yendo hacia el futuro, la adopción de la inteligencia artificial por parte de las empresas no será una talla única, ya que la eficiencia y la selección de la herramienta más adecuada y menos costosa para completar tareas estarán en foco, lo que significa elegir el modelo adecuado para cada proyecto.

Esto se hará para todos los modelos, ya sea un LLM de propósito general o LLM más pequeños y específicos del dominio, dependiendo de qué modelo entregará mejores resultados, requiere menos recursos y reduce la necesidad de migrar datos a la nube.

Para la próxima fase, la IA será vital para las decisiones empresariales, ya que el público tiene gran confianza en las respuestas generadas por la IA.

“Cuando piensas en entrenar modelos de IA, deben construirse sobre la base de datos excelentes.”

~ McMillan

“Eso es lo que somos, proporcionando ese conjunto de datos confiable y luego brindando las capacidades y capacidades analíticas para que los clientes y sus clientes puedan confiar en los resultados”, agregó McMillan.

Con la eficiencia y la precisión siendo muy demandadas en el mundo, los LLM más pequeños y específicos del dominio ofrecen otra opción para ofrecer resultados en los que las empresas y el público en general pueden confiar.

Un paso a paso para lanzar tu carrera Web3 y conseguir trabajos de alta remuneración en Cripto en 90 días.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
0/400
Sin comentarios
  • Anclado

Opera con criptomonedas en cualquier momento y lugar
qrCode
Escanea para descargar la aplicación de Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)