Naver presenta un modelo de IA que integra publicaciones de Mom Cafe y reseñas de restaurantes

Naver presentó un nuevo modelo de IA el día 2 que incorpora información real de publicaciones en cafés de madres y reseñas de restaurantes para mejorar la precisión de las respuestas. El modelo fue presentado durante una sesión titulada 'Del buscador a la ejecución: tecnología de IA de próxima generación que crea la búsqueda con IA de Naver' celebrada en Naver D2SF Gangnam. El modelo ligero, basado en HyperCLOVA X, aplica 'ingeniería de arneses' para reflejar información orientada a la vida real dentro del ecosistema de Naver, permitiendo que la IA proporcione respuestas fundamentadas en experiencias reales de usuarios, no en datos genéricos.

Naver aplica ingeniería de arneses para integrar contenido generado por usuarios

El modelo de IA implementado en el servicio de búsqueda 'AI Tab' de Naver utiliza ingeniería de arneses, una estructura que controla y dirige el comportamiento del agente de IA, como las riendas guían a un caballo. Cuando los usuarios buscan precios de academias de matemáticas, el sistema proporciona respuestas basadas en discusiones recientes de padres en cafés de madres. Cuando los usuarios preguntan sobre disponibilidad de estacionamiento en restaurantes, la IA refleja no solo la información oficial del negocio, sino también reseñas reales de clientes que han estacionado allí.

Han Seung-kyun, líder del Servicio de Búsqueda con IA de Naver, comparó la ingeniería de arneses con el 'sentido del trabajo' de la IA, afirmando que "para crear agentes de IA que funcionen bien en los servicios, es esencial la ingeniería de arneses que diseña simultáneamente eficiencia de costos y estabilidad, no solo grandes modelos de lenguaje (LLM)". Han agregó que "la experiencia de conectar la infraestructura de búsqueda y el saber hacer acumulado durante los últimos 27 años, el vasto contenido como blogs y cafés, y diversos activos de servicios como compras y lugares con tecnología de IA para guiar desde la búsqueda hasta la ejecución es la competitividad única de Naver que nadie puede seguir fácilmente".

Naver reduce costos operativos en 3 veces utilizando modelos de lenguaje pequeño

Naver construyó una estructura de Modelo de Lenguaje Pequeño (SLM) con división del trabajo para aumentar la eficiencia del AI Tab. En lugar de un único LLM gigante que maneje todas las tareas, Naver combina SLM específicos para cada función, reduciendo costos operativos y mejorando simultáneamente la velocidad y calidad de respuesta. Con este método, Naver redujo los costos operativos de equipos hasta 3 veces y mejoró la velocidad de respuesta más de 2 veces.

Naver entrenó la IA utilizando tecnología Clarify RL (Aprendizaje por Refuerzo), que garantiza que la IA no interprete arbitrariamente solicitudes ambiguas, sino que confirme la intención del usuario mediante preguntas adicionales. Como resultado, la alucinación disminuyó hasta en 30 puntos porcentuales en comparación con HyperCLOVA X.

Lee Ki-chang, director del Modelo de IA Hiperescala de Naver Cloud, enfatizó que "el modelo aplicado al AI Tab se caracteriza por optimizar todo el proceso, desde la construcción de datos de entrenamiento hasta el diseño del modelo y el aprendizaje por refuerzo, para adaptarse a los servicios de Naver", y agregó que "el objetivo es crear un modelo que opere con la mayor precisión y eficiencia en procesos de servicio reales, como búsqueda, compra y reserva por parte de los usuarios de Naver".

Naver integra tecnología multimodal SmartLens en la búsqueda con IA

Naver reveló su estrategia de avance en tecnología multimodal utilizando SmartLens, ubicado en la parte frontal de la barra de búsqueda del AI Tab. La tecnología multimodal permite que la IA comprenda y utilice diversas formas de información, incluyendo imágenes y videos, no solo texto.

Los usuarios pueden subir imágenes en lugar de texto en la barra de búsqueda y emitir comandos como 'encontrar productos similares a este' o 'reservar un lugar con este ambiente'. Si bien la búsqueda por imágenes y videos ya era posible con la IA existente, los modelos LLM primero reconocían imágenes y luego realizaban búsquedas basadas en texto. En contraste, el agente multimodal de Naver comprende todo el proceso, desde la entrada de imágenes hasta la ejecución, como una sola solicitud.

Yoon Sang-doo, líder del Centro de IA Futura de Naver, declaró que "la tecnología de búsqueda visual que Naver ha acumulado a través de SmartLens durante casi 10 años es tecnología central para crear los ojos a través de los cuales los agentes de IA ven el mundo", y agregó que "en el futuro, el servicio de agente de IA de Naver evolucionará en una dirección que entiende la intención del usuario no solo a través de texto, sino también de imágenes, y se conecta con acciones reales".

FAQ

¿Qué presentó Naver el día 2? Naver presentó un nuevo modelo de IA el día 2 en Naver D2SF Gangnam que incorpora información orientada a la vida real de publicaciones en cafés de madres y reseñas de restaurantes. El modelo está basado en HyperCLOVA X y utiliza ingeniería de arneses para reflejar experiencias reales de usuarios en sus respuestas.

¿Cuánto redujo Naver los costos operativos con el nuevo modelo de IA? Naver redujo los costos operativos de equipos hasta 3 veces utilizando una estructura de Modelo de Lenguaje Pequeño (SLM). La compañía también mejoró la velocidad de respuesta más de 2 veces y redujo la alucinación hasta en 30 puntos porcentuales en comparación con HyperCLOVA X.

¿Qué es la tecnología multimodal SmartLens en la búsqueda con IA de Naver? SmartLens es la tecnología multimodal de Naver que permite a los usuarios subir imágenes en la barra de búsqueda y recibir respuestas a comandos como 'encontrar productos similares' o 'reservar lugares con este ambiente'. La tecnología entiende todo el proceso, desde la entrada de imágenes hasta la ejecución, como una sola solicitud, aprovechando la tecnología de búsqueda visual que Naver ha acumulado durante casi 10 años.

Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios