Phòng phân tích thị trường của Atlanta Capital báo cáo rằng các công ty trí tuệ nhân tạo, từng chi hàng tỷ USD để phát triển các mô hình ngôn ngữ lớn, hiện đang chuyển sang nghiên cứu mô hình ngôn ngữ nhỏ nhằm giảm hao tổn tài nguyên và đảm bảo hiệu suất công việc.
Apple (NASDAQ:AAPL), Microsoft (NASDAQ:MSFT), Meta, và Google (NASDAQ:GOOGL) gần đây đã phát hành các mô hình AI mới tiêu tốn ít tham số nhưng vẫn hoạt động hiệu quả. Động thái này nhằm hỗ trợ các doanh nghiệp tiết giảm chi phí trong bối cảnh lo ngại ngày càng tăng về nguồn vốn khổng lồ và dữ liệu tính toán cần thiết để vận hành các mô hình ngôn ngữ lớn như ChatGPT.
Thông thường, số lượng các tham số càng lớn sẽ đảm bảo cho hiệu suất và khả năng thực hiện các nhiệm vụ phức tạp của AI. Các mẫu như GPT-4 của OpenAI và Gemini 1.5 Pro của Google có số lượng tham số ước tính có thể vượt hơn 1 nghìn tỷ, trong khi Meta đang phát triển phiên bản 400 tỷ tham số của mô hình Llama.
Tuy nhiên, việc phải đối mặt với các thách thức như nguồn vốn và dữ liệu khổng lồ để vận hành các sản phẩm AI tổng hợp đã buộc các công ty như Meta và Google nghiên cứu các mô hình ngôn ngữ nhỏ chỉ với vài tỷ tham số. Những mô hình này giúp giảm chi phí, tiết kiệm năng lượng, có khả năng tùy chỉnh và hạn chế sử dụng dữ liệu nhạy cảm.
Eric Boyd, Phó giám đốc phụ trách nền tảng AI Azure của Microsoft, cho biết: “Những mô hình này hoạt động với hiệu suất cao, đảm bảo chất lượng thông tin mà khách hàng tìm kiếm, mà vẫn có thể giúp doanh nghiệp tiết kiệm chi phí do tốn ít tài nguyên hơn.”
Nick Clegg, giám đốc phụ trách các vấn đề toàn cầu của Meta, cho biết mô hình 8 tỷ tham số của Llama 3 có thể so sánh với GPT-4. Trong khi đó, Microsoft cho rằng mô hình Phi-3 của mình với 7 tỷ tham số hoạt động hiệu quả hơn so với GPT-3.5 của OpenAI.
Các mô hình nhỏ có thể xử lý các tác vụ cục bộ ngay trên thiết bị, điều này thu hút những khách hàng quan tâm đến quyền riêng tư và muốn giữ thông tin trong mạng nội bộ. Charlotte Marshall, luật sư tại Addleshaw Goddard, cho biết: “Các mô hình nhỏ sẽ giúp doanh nghiệp hạn chế gặp phải các vấn đề pháp lý và truyền dữ liệu.”
Ngoài ra, các mô hình AI nhỏ này cũng được tích hợp nhiều hơn trên thiết bị di động, chẳng hạn như mô hình Gemini Nano của Google trên mẫu điện thoại Pixel mới nhất và dòng S24 của Samsung. Apple cũng đang phát triển các mô hình AI trên dòng iPhone bán chạy nhất và đã giới thiệu mô hình OpenELM cho các tác vụ viết văn bản như email.
Giám đốc OpenAI Sam Altman cho biết công ty đã cung cấp các mô hình AI với quy mô khác nhau cho khách hàng nhằm phục vụ các nhiệm vụ riêng biệt, và OpenAI sẽ tiếp tục phát triển và cung cấp các mô hình này. Tuy nhiên, OpenAI sẽ vẫn tập trung vào việc xây dựng các mô hình AI lớn với khả năng thực hiện các nhiệm vụ phức tạp như suy luận, lập kế hoạch và thực hiện các nhiệm vụ tương tự con người.