Tại CES 2025, NVIDIA đã ra mắt dòng mô hình Llama Nemotron và Cosmos Nemotron, đánh dấu bước tiến mới trong việc phát triển AI agent cho doanh nghiệp. Với khả năng ứng dụng từ chăm sóc khách hàng đến phát hiện gian lận, các mô hình này hứa hẹn cải thiện năng suất và tối ưu hóa quy trình trong nhiều ngành công nghiệp.
Llama Nemotron: Tinh chỉnh từ nền tảng Llama 3.1
Dựa trên mô hình nền tảng Llama 3.1, Llama Nemotron được NVIDIA phát triển nhằm phục vụ các nhu cầu cụ thể của doanh nghiệp. Theo CEO Jensen Huang, “Llama 3.1 là một hiện tượng, với hơn 650.000 lượt tải và 60.000 mô hình được phát triển từ nó. Đây là lý do kích hoạt mọi ngành công nghiệp chuyển đổi sang AI.”
Để tối ưu hóa, NVIDIA đã sử dụng chuyên môn của mình để tinh chỉnh các mô hình này, biến chúng thành bộ công cụ Llama Nemotron với ba kích thước: Nano, Super và Ultra. Các phiên bản này phù hợp với nhiều nhu cầu triển khai, từ ứng dụng thời gian thực yêu cầu độ trễ thấp đến các trung tâm dữ liệu đòi hỏi độ chính xác cao.
Cosmos Nemotron: Mở rộng AI vào xử lý hình ảnh và video
Bên cạnh Llama Nemotron, NVIDIA còn giới thiệu Cosmos Nemotron, tập trung vào các tác vụ liên quan đến hình ảnh và video. Các mô hình này hỗ trợ phân tích và phản hồi trực quan, mở ra cơ hội ứng dụng trong các ngành như hệ thống tự động, y tế, bán lẻ, và truyền thông. Đặc biệt, NVIDIA còn công bố Cosmos World Foundation Models, hỗ trợ tạo video theo nhận thức vật lý trong lĩnh vực robot và phương tiện tự hành.

Tích hợp toàn diện và ứng dụng doanh nghiệp
NVIDIA cho biết các mô hình Nemotron có thể được tải xuống từ build.nvidia.com, Hugging Face, hoặc thông qua chương trình NVIDIA Developer. Ngoài ra, các mô hình này sẽ được triển khai trên nền tảng NVIDIA AI Enterprise, cho phép tích hợp vào hệ thống đám mây và trung tâm dữ liệu tăng tốc.
Một điểm đáng chú ý khác là NVIDIA NeMo microservices, công cụ tùy chỉnh mô hình theo từng lĩnh vực cụ thể. NeMo Retriever cũng được tích hợp, giúp kết nối với dữ liệu doanh nghiệp và tăng cường khả năng truy xuất thông tin.
SAP và ServiceNow, hai nhà cung cấp nền tảng AI hàng đầu, đã bày tỏ sự ủng hộ đối với Nemotron. SAP có kế hoạch sử dụng mô hình này trên nền tảng Joule để cải thiện năng suất người dùng doanh nghiệp, trong khi ServiceNow sẽ áp dụng cho các dịch vụ AI agent trong nhiều ngành khác nhau.
Với sự ra mắt của Llama Nemotron và Cosmos Nemotron, NVIDIA không chỉ cung cấp các công cụ mạnh mẽ cho doanh nghiệp mà còn đặt nền móng cho thế hệ AI agent tiếp theo. Từ khả năng xử lý văn bản đến hình ảnh, các mô hình này mở ra tiềm năng ứng dụng rộng lớn, giúp doanh nghiệp vượt qua giới hạn hiện tại trong tối ưu hóa quy trình và tăng năng suất.