Thứ Hai, 28 Tháng 4, 2025

OpenAI ra mắt o3-mini

-

OpenAI tiếp tục đẩy mạnh cuộc đua AI với việc ra mắt o3-mini, một mô hình lập luận mới tập trung vào độ chính xác và hiệu quả chi phí.

Ngày 31/1/2025, OpenAI chính thức ra mắt o3-mini, mô hình AI lập luận mới nhất trong dòng sản phẩm o của hãng. Đây là bước đi quan trọng nhằm củng cố vị thế của OpenAI trong cuộc đua AI toàn cầu, đặc biệt khi đối thủ như DeepSeek đang ngày càng lớn mạnh.

o3-mini: Mô hình tiết kiệm

Khác với các mô hình ngôn ngữ lớn thông thường, o3-mini được thiết kế để tự kiểm tra thông tin kỹ lưỡng trước khi đưa ra kết quả. Điều này giúp nó tránh được nhiều sai sót thường gặp ở các mô hình khác. Mặc dù tốc độ phản hồi chậm hơn một chút, o3-mini được đánh giá là đáng tin cậy hơn trong các lĩnh vực như vật lý, toán học và lập trình.

OpenAI tuyên bố rằng o3-mini có khả năng tương đương với dòng o1, nhưng chạy nhanh hơn và chi phí thấp hơn. Theo kết quả thử nghiệm, o3-mini được người dùng ưa chuộng hơn o1-mini trong hơn 50% trường hợp. Ngoài ra, nó mắc ít hơn 39% lỗi nghiêm trọng trên các câu hỏi thực tế khó và đưa ra câu trả lời rõ ràng hơn với tốc độ nhanh hơn 24%.

Khả năng tiếp cận và giá cả

o3-mini sẽ được tích hợp vào ChatGPT từ ngày 31/1, với các mức giới hạn truy vấn khác nhau tùy thuộc vào gói dịch vụ:

  • Người dùng miễn phí: Có thể sử dụng nút “Reason” để kích hoạt o3-mini.
  • ChatGPT Plus và Team: Được phép 150 truy vấn mỗi ngày.
  • ChatGPT Pro: Truy cập không giới hạn.
  • ChatGPT Enterprise và Edu: Sẽ được hỗ trợ trong vòng một tuần.

Đối với nhà phát triển, o3-mini sẽ có sẵn qua API của OpenAI với ba mức độ lập luận: thấp, trung bình và cao. Giá của o3-mini là 0,55 USD cho mỗi triệu token đầu vào và 4,40 USD cho mỗi triệu token đầu ra, rẻ hơn 63% so với o1-mini.

So sánh với đối thủ

Mặc dù o3-mini không vượt trội hoàn toàn so với mô hình R1 của DeepSeek, nó vẫn thể hiện được ưu thế trong một số bài kiểm tra. Ví dụ, o3-mini vượt R1 trong bài kiểm tra AIME 2024 (đo lường khả năng hiểu và phản hồi các chỉ dẫn phức tạp) và SWE-bench Verified (kiểm tra lập trình). Tuy nhiên, trên bài kiểm tra GPQA Diamond (vật lý, sinh học và hóa học cấp tiến sĩ), o3-mini chỉ vượt R1 khi được đặt ở mức lập luận cao.

OpenAI khẳng định rằng o3-mini an toàn hơn hoặc ít nhất là ngang bằng với dòng o1 nhờ vào quy trình “deliberative alignment” – phương pháp giúp mô hình “suy nghĩ” về chính sách an toàn của OpenAI khi phản hồi. Theo công ty, o3-mini vượt trội hơn GPT-4o trong các đánh giá về an toàn và khả năng chống jailbreak.

Tuy nhiên, o3-mini vẫn có những hạn chế. Trên một số bài kiểm tra, hiệu suất của nó chỉ nhỉnh hơn o1 một chút, chẳng hạn như AIME 2024 (chỉ hơn 0,3 điểm).

Với việc ra mắt o3-mini, OpenAI tiếp tục khẳng định vị thế dẫn đầu trong lĩnh vực AI. Mô hình này không chỉ mang lại hiệu suất cao mà còn tiết kiệm chi phí, phù hợp với cả người dùng cá nhân và doanh nghiệp.

Đội ngũ admin quản trị luôn nỗ lực hết mình để đem đến những nội dung chất lượng nhất cho các thành viên tham gia. Mọi ý kiến đóng góp xin gửi về [email protected]. Xin trân trọng cảm ơn!

GameN - MXH dành cho game thủ Việt

Ban quản trị

BÀI MỚI

Crystal of Atlan chốt ngày ra đòn

Game nhập vai hành động trực tuyến nhiều người chơi Crystal of Atlan sẽ ra mắt vào ngày 28/5 tới đây trên đa nền tảng.

VIractal: Hành trình kỳ ảo giữa bàn cờ và bài lá sắp ra mắt

Nhà phát triển series Dokapon giới thiệu tựa game RPG phong cách board game đầy lôi cuốn.

Hướng dẫn cách đạt max level trong Blox Fruits không cần Robux

Hãy cùng tìm hiểu lộ trình chi tiết giúp bạn chinh phục thử thách này trong Blox Fruits.

Siêu phẩm Vong Xuyên Phong Hoa Lục sắp được phát hành tại Việt Nam?

Sau một thời gian dài chờ đợi thì tín hiệu đầu tiên về việc Vong Xuyên Phong Hoa Lục sắp ra mắt tại Việt Nam đã xuất hiện!

Follow us

5,655Thành viênThích
1,204Người theo dõiTheo dõi
2,189Người theo dõiĐăng Ký
Dành cho quảng cáo

ĐỌC NHIỀU