Mô hình ngôn ngữ nhỏ (SLMs) được ca ngợi là điều lớn tiếp theo trong lĩnh vực trí tuệ nhân tạo

Trong khi các công ty đang đổ tiền vào các mô hình ngôn ngữ lớn (LLMs), một số chuyên gia ngành công nghệ AI tin rằng các mô hình ngôn ngữ nhỏ (SLMs) sẽ trở thành xu hướng lớn tiếp theo.

Điều này đến khi hoạt động trong ngành tiếp tục phát triển khi mùa lễ đang đến với các công ty công nghệ đầu tư nhiều hơn để phát triển công nghệ của họ.

Tương lai nằm trong các mô hình ngôn ngữ nhỏ

Các dự án như xAI do tỷ phú đa tỷ USD Elon Musk điều hành đã thành công trong việc huy động thêm 5 tỷ đô la từ Andreessen Horowitz, Qatar Investment Authority, Sequoia và Valor Equity Partners, trong khi Amazon đã đầu tư thêm 4 tỷ đô la vào Anthropic, một đối thủ của OpenAI.

Trong khi những công ty công nghệ lớn này và những người khác đang đầu tư hàng tỷ đô la tập trung vào việc phát triển các LLM lớn để xử lý nhiều nhiệm vụ khác nhau, thực tế của AI là không có một kích cỡ phù hợp với tất cả vì cần có các mô hình cụ thể cho các nhiệm vụ kinh doanh.

Theo giám đốc điều hành của AWS Matt Garman trong một thông báo về việc mở rộng hợp tác và đầu tư của họ, đã có phản hồi quá tải từ khách hàng AWS đang phát triển trí tuệ nhân tạo tạo bởi Anthropic.

LLMs cho hầu hết các công ty vẫn là lựa chọn hàng đầu cho một số dự án nhất định, nhưng đối với những dự án khác, lựa chọn này có thể tốn kém về chi phí, năng lượng và tài nguyên máy tính.

Steven McMillan, chủ tịch và CEO của Teradata, người đã đề xuất một con đường thay thế cho một số doanh nghiệp, cũng có những quan điểm khác. Ông tin rằng tương lai nằm trong SLMs.

“Khi nhìn vào tương lai, chúng tôi cho rằng mô hình ngôn ngữ nhỏ và trung bình cùng môi trường kiểm soát như LLMs chuyên ngành sẽ cung cấp các giải pháp tốt hơn rất nhiều.”

~ McMillan

Các Mô hình Ngôn ngữ Đặc thù (SLM) tạo ra các đầu ra tùy chỉnh trên các loại dữ liệu cụ thể, vì các mô hình ngôn ngữ được đào tạo đặc biệt để làm điều đó. Vì dữ liệu được tạo ra bởi SLM được giữ bên trong, các mô hình ngôn ngữ được đào tạo trên dữ liệu có thể nhạy cảm.

Với LLMs tiêu thụ năng lượng, các phiên bản ngôn ngữ nhỏ được đào tạo để tỉ lệ cả tính toán và sử dụng năng lượng theo nhu cầu thực tế của dự án. Với những điều chỉnh như vậy, điều đó có nghĩa là SLMs hiệu quả với chi phí thấp hơn so với các mô hình lớn hiện tại.

Đối với người dùng muốn sử dụng trí tuệ nhân tạo cho kiến thức cụ thể, có tùy chọn LLM chuyên môn vì chúng không cung cấp kiến thức rộng. Nó được đào tạo để hiểu sâu về chỉ một loại thông tin và phản hồi chính xác hơn, ví dụ như một CMO so với một CFO, trong lĩnh vực đó.

Tại sao SLM là một lựa chọn ưu tiên

Theo Hiệp hội Khoa học Dữ liệu (ADaSci), việc phát triển một SLM với 7 tỷ tham số cho một triệu người dùng chỉ cần 55,1MWh (giờ Megawatt).

ADaSci đã phát hiện ra rằng việc huấn luyện GPT-3 với 175 tỷ tham số đã tiêu thụ khoảng 1.287MWh điện năng và điều này không bao gồm khi nó chính thức được sử dụng bởi công chúng. Do đó, một SLM sử dụng khoảng 5% năng lượng tiêu thụ thông qua việc huấn luyện một LLM.

Các mô hình lớn thường được chạy trên máy tính đám mây vì chúng sử dụng nhiều công suất tính toán hơn bao giờ hết có sẵn trên một thiết bị cá nhân. Điều này dẫn đến những rắc rối cho các công ty khi họ mất kiểm soát về thông tin của mình khi nó di chuyển đến đám mây, và phản hồi chậm khi chúng di chuyển qua internet.

Trong tương lai, việc áp dụng trí tuệ nhân tạo trong doanh nghiệp sẽ không phải là một kích cỡ phổ quát vì hiệu quả và lựa chọn công cụ tốt nhất và giá rẻ nhất để hoàn thành nhiệm vụ sẽ được chú trọng, điều đó có nghĩa là chọn mô hình phù hợp nhất cho mỗi dự án.

Việc này sẽ được thực hiện cho tất cả các mô hình, cho dù là LLM phổ quát, hay LLM nhỏ hơn và cụ thể cho từng lĩnh vực, tùy thuộc vào mô hình nào sẽ mang lại kết quả tốt hơn, yêu cầu ít tài nguyên hơn và giảm thiểu nhu cầu di chuyển dữ liệu lên đám mây.

Đối với giai đoạn tiếp theo, trí tuệ nhân tạo sẽ rất quan trọng đối với quyết định kinh doanh khi công chúng tin tưởng cao vào các câu trả lời do trí tuệ nhân tạo tạo ra.

“Khi bạn nghĩ đến việc đào tạo mô hình trí tuệ nhân tạo, chúng phải được xây dựng trên nền tảng dữ liệu tuyệt vời.”

~ McMillan

“Đó là điều chúng tôi đang nỗ lực, cung cấp bộ dữ liệu đáng tin cậy và sau đó cung cấp các khả năng và khả năng phân tích để khách hàng, và khách hàng của họ, có thể tin tưởng vào các đầu ra,” thêm McMillan.

Với sự hiệu quả và độ chính xác được yêu cầu cao trên thế giới, các mô hình ngôn ngữ máy học nhỏ hơn và cụ thể cho từng lĩnh vực cung cấp một lựa chọn khác để mang lại kết quả mà các công ty và công chúng rộng lớn có thể tin cậy.

Một Bước Một To Launching Your Web3 Career and Landing High-Paying Tiền điện tử Jobs in 90 Days.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Ghim