Tập đoàn công nghệ Meta vừa công bố bộ đôi mô hình AI Llama 4 mới với nhiều cải tiến vượt bậc, hứa hẹn mang lại trải nghiệm vượt trội so với các đối thủ trên nhiều tiêu chí đánh giá.
Meta chính thức giới thiệu hai mô hình AI mới nhất trong hệ sinh thái Llama 4, bao gồm Llama 4 Scout và Llama 4 Maverick. Cả hai đã được tích hợp vào trợ lý ảo Meta AI trên các nền tảng web, WhatsApp, Messenger và Instagram. Người dùng cũng có thể tải trực tiếp từ Meta hoặc Hugging Face.
Llama 4 Scout được thiết kế nhỏ gọn, có thể chạy trên một GPU Nvidia H100 đơn lẻ. Mô hình này sở hữu bộ nhớ ngữ cảnh lên đến 10 triệu token, được Meta khẳng định vượt trội so với Gemma 3 và Gemini 2.0 Flash-Lite của Google cũng như Mistral 3.1 mã nguồn mở.
Trong khi đó, Llama 4 Maverick có quy mô tương đương GPT-4o của OpenAI và Gemini 2.0 Flash của Google. “Maverick cho kết quả tương đương DeepSeek-V3 trong các tác vụ lập trình và suy luận nhưng chỉ sử dụng chưa đến một nửa tham số hoạt động”, đại diện Meta cho biết.
Đáng chú ý, Meta đang đào tạo phiên bản Llama 4 Behemoth với 288 tỷ tham số hoạt động và 2.000 tỷ tham số tổng thể. CEO Mark Zuckerberg khẳng định đây sẽ là “mô hình cơ sở có hiệu suất cao nhất thế giới”, dự kiến vượt trội so với GPT-4.5 và Claude Sonnet 3.7 trên nhiều bài kiểm tra STEM.

Meta đã chuyển sang sử dụng kiến trúc “hỗn hợp chuyên gia” (MoE) cho Llama 4, giúp tối ưu hóa tài nguyên bằng cách chỉ sử dụng các phần cần thiết của mô hình cho từng tác vụ cụ thể. Công ty sẽ công bố thêm chi tiết về kế hoạch phát triển AI tại hội nghị LlamaCon vào ngày 29/4 tới.
Mặc dù được Meta gọi là “mã nguồn mở”, giấy phép Llama 4 vẫn gây tranh cãi khi yêu cầu các tổ chức thương mại có hơn 700 triệu người dùng hàng tháng phải xin phép Meta trước khi sử dụng. Tổ chức Sáng kiến Mã nguồn Mở (OSI) từng nhận định điều khoản này khiến Llama không còn thuần túy là mã nguồn mở.
Với việc ra mắt Llama 4, Meta tiếp tục khẳng định tham vọng dẫn đầu trong cuộc đua phát triển AI, cạnh tranh trực tiếp với các gã khổng lồ công nghệ như OpenAI và Google. Các mô hình mới hứa hẹn mang lại những cải tiến đáng kể trong khả năng xử lý ngôn ngữ và tác vụ đa phương tiện.