Amazon Web Services (AWS) ha lanzado nuevas funciones diseñadas para mejorar la eficiencia de los modelos de inteligencia artificial (IA) y reducir los costes de aprendizaje. El núcleo de estas mejoras son la opción de ajuste detallado basada en aprendizaje por refuerzo, denominada “RFT”, y la función de personalización sin servidor. Estas capacidades buscan permitir a los desarrolladores mejorar y personalizar modelos de IA para los usuarios con un mínimo de conocimientos especializados en aprendizaje automático.
AWS anunció el día 3 (hora local) durante su conferencia anual “AWS re:Invent 2025” celebrada en Las Vegas, que aplicará estas funciones a Amazon Bedrock y SageMaker AI. Amazon Bedrock es una plataforma que permite construir capacidades de IA generativa sobre “modelos fundacionales” de las principales compañías de IA. Esta actualización RFT abre el camino para que las empresas optimicen sus agentes de IA sin necesidad de una infraestructura de aprendizaje automático de alto nivel.
Las empresas suelen utilizar los modelos de lenguaje de gran tamaño (LLM) más potentes para sus agentes de IA, lo que genera demandas excesivas de capacidad de procesamiento. Incluso en tareas repetitivas como la confirmación de calendarios o la recuperación de documentos, se ha observado un uso excesivo e ineficiente de recursos. AWS considera que las nuevas funciones de personalización basadas en aprendizaje por refuerzo pueden resolver estos problemas. En resumen, se trata de una estructura capaz de garantizar eficiencia suficiente con menos recursos computacionales.
Tradicionalmente, la introducción del aprendizaje por refuerzo implicaba una elevada barrera técnica, ya que era necesario preparar datos de entrenamiento, recopilar retroalimentación y construir infraestructuras de computación de alto rendimiento, tareas que podían llevar meses. Sin embargo, la función RFT de Amazon Bedrock permite a los desarrolladores seleccionar el modelo deseado, cargar registros de interacción o datos de entrenamiento, y después especificar una función de recompensa, tras lo cual la optimización del modelo se realiza automáticamente. AWS explica que este proceso puede ejecutarse sin expertos en aprendizaje automático, siendo suficiente con tener una idea de “qué se considera un buen resultado”.
Inicialmente, la función será compatible exclusivamente con el modelo propio de Amazon, Nova 2 Lite, pero en el futuro está previsto ampliarla a decenas de modelos. Amazon SageMaker AI también añadirá una función similar en formato sin servidor. SageMaker es una plataforma que permite a las empresas diseñar y desplegar sus propios modelos de IA, y se espera que ofrezca un entorno “orientado a agentes” que facilite aún más la integración de opciones de aprendizaje por refuerzo.
En el modo orientado a agentes, tras introducir las necesidades en lenguaje natural, el agente de IA guiará todo el proceso desde la generación de datos hasta la evaluación del modelo. Al mismo tiempo, se ofrecerán opciones de autogestión para desarrolladores avanzados, ampliando así las posibilidades de elección de los usuarios. AWS explica que esta función permite aplicar simultáneamente diversas técnicas de aprendizaje por refuerzo, como el aprendizaje por retroalimentación, el aprendizaje verificable basado en recompensas y el ajuste mediante aprendizaje supervisado. Esta función no solo es compatible con Nova, sino también con modelos como Llama, Qwen, DeepSeek y GPT-OSS.
A la vez, AWS ha anunciado la introducción de la función “entrenamiento sin puntos de control” en SageMaker HyperPod. Antes, si se producía un error durante el entrenamiento, la recuperación podía tardar decenas de minutos; ahora, el estado puede recuperarse en cuestión de minutos sin intervención del cliente, gracias a que el estado del modelo se guarda en tiempo real en todo el clúster.
Además, AWS ha portado el marco de agentes de IA de código abierto “Strands Agents” al lenguaje TypeScript. Este lenguaje es más estable y menos propenso a errores que JavaScript, por lo que se espera que proporcione un entorno de desarrollo de agentes más robusto.
Este lanzamiento coincide con la tendencia del mercado de IA generativa, donde los competidores están reforzando las funciones de personalización. Google (GOOGL), Microsoft (MSFT) y otros también están acelerando el lanzamiento de funciones similares, por lo que se espera que el entorno en el que los usuarios pueden construir fácilmente modelos de IA óptimos siga evolucionando rápidamente. Esta evolución tecnológica parece estar actuando como catalizador para una integración aún más profunda de la IA en los entornos empresariales reales.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
AWS ha reducido la barrera de entrada para la personalización de IA mediante la automatización con aprendizaje por refuerzo.
Amazon Web Services (AWS) ha lanzado nuevas funciones diseñadas para mejorar la eficiencia de los modelos de inteligencia artificial (IA) y reducir los costes de aprendizaje. El núcleo de estas mejoras son la opción de ajuste detallado basada en aprendizaje por refuerzo, denominada “RFT”, y la función de personalización sin servidor. Estas capacidades buscan permitir a los desarrolladores mejorar y personalizar modelos de IA para los usuarios con un mínimo de conocimientos especializados en aprendizaje automático.
AWS anunció el día 3 (hora local) durante su conferencia anual “AWS re:Invent 2025” celebrada en Las Vegas, que aplicará estas funciones a Amazon Bedrock y SageMaker AI. Amazon Bedrock es una plataforma que permite construir capacidades de IA generativa sobre “modelos fundacionales” de las principales compañías de IA. Esta actualización RFT abre el camino para que las empresas optimicen sus agentes de IA sin necesidad de una infraestructura de aprendizaje automático de alto nivel.
Las empresas suelen utilizar los modelos de lenguaje de gran tamaño (LLM) más potentes para sus agentes de IA, lo que genera demandas excesivas de capacidad de procesamiento. Incluso en tareas repetitivas como la confirmación de calendarios o la recuperación de documentos, se ha observado un uso excesivo e ineficiente de recursos. AWS considera que las nuevas funciones de personalización basadas en aprendizaje por refuerzo pueden resolver estos problemas. En resumen, se trata de una estructura capaz de garantizar eficiencia suficiente con menos recursos computacionales.
Tradicionalmente, la introducción del aprendizaje por refuerzo implicaba una elevada barrera técnica, ya que era necesario preparar datos de entrenamiento, recopilar retroalimentación y construir infraestructuras de computación de alto rendimiento, tareas que podían llevar meses. Sin embargo, la función RFT de Amazon Bedrock permite a los desarrolladores seleccionar el modelo deseado, cargar registros de interacción o datos de entrenamiento, y después especificar una función de recompensa, tras lo cual la optimización del modelo se realiza automáticamente. AWS explica que este proceso puede ejecutarse sin expertos en aprendizaje automático, siendo suficiente con tener una idea de “qué se considera un buen resultado”.
Inicialmente, la función será compatible exclusivamente con el modelo propio de Amazon, Nova 2 Lite, pero en el futuro está previsto ampliarla a decenas de modelos. Amazon SageMaker AI también añadirá una función similar en formato sin servidor. SageMaker es una plataforma que permite a las empresas diseñar y desplegar sus propios modelos de IA, y se espera que ofrezca un entorno “orientado a agentes” que facilite aún más la integración de opciones de aprendizaje por refuerzo.
En el modo orientado a agentes, tras introducir las necesidades en lenguaje natural, el agente de IA guiará todo el proceso desde la generación de datos hasta la evaluación del modelo. Al mismo tiempo, se ofrecerán opciones de autogestión para desarrolladores avanzados, ampliando así las posibilidades de elección de los usuarios. AWS explica que esta función permite aplicar simultáneamente diversas técnicas de aprendizaje por refuerzo, como el aprendizaje por retroalimentación, el aprendizaje verificable basado en recompensas y el ajuste mediante aprendizaje supervisado. Esta función no solo es compatible con Nova, sino también con modelos como Llama, Qwen, DeepSeek y GPT-OSS.
A la vez, AWS ha anunciado la introducción de la función “entrenamiento sin puntos de control” en SageMaker HyperPod. Antes, si se producía un error durante el entrenamiento, la recuperación podía tardar decenas de minutos; ahora, el estado puede recuperarse en cuestión de minutos sin intervención del cliente, gracias a que el estado del modelo se guarda en tiempo real en todo el clúster.
Además, AWS ha portado el marco de agentes de IA de código abierto “Strands Agents” al lenguaje TypeScript. Este lenguaje es más estable y menos propenso a errores que JavaScript, por lo que se espera que proporcione un entorno de desarrollo de agentes más robusto.
Este lanzamiento coincide con la tendencia del mercado de IA generativa, donde los competidores están reforzando las funciones de personalización. Google (GOOGL), Microsoft (MSFT) y otros también están acelerando el lanzamiento de funciones similares, por lo que se espera que el entorno en el que los usuarios pueden construir fácilmente modelos de IA óptimos siga evolucionando rápidamente. Esta evolución tecnológica parece estar actuando como catalizador para una integración aún más profunda de la IA en los entornos empresariales reales.