Thứ Hai, 28 Tháng 4, 2025

OpenAI ra mắt o3-mini

-

OpenAI tiếp tục đẩy mạnh cuộc đua AI với việc ra mắt o3-mini, một mô hình lập luận mới tập trung vào độ chính xác và hiệu quả chi phí.

Ngày 31/1/2025, OpenAI chính thức ra mắt o3-mini, mô hình AI lập luận mới nhất trong dòng sản phẩm o của hãng. Đây là bước đi quan trọng nhằm củng cố vị thế của OpenAI trong cuộc đua AI toàn cầu, đặc biệt khi đối thủ như DeepSeek đang ngày càng lớn mạnh.

o3-mini: Mô hình tiết kiệm

Khác với các mô hình ngôn ngữ lớn thông thường, o3-mini được thiết kế để tự kiểm tra thông tin kỹ lưỡng trước khi đưa ra kết quả. Điều này giúp nó tránh được nhiều sai sót thường gặp ở các mô hình khác. Mặc dù tốc độ phản hồi chậm hơn một chút, o3-mini được đánh giá là đáng tin cậy hơn trong các lĩnh vực như vật lý, toán học và lập trình.

OpenAI tuyên bố rằng o3-mini có khả năng tương đương với dòng o1, nhưng chạy nhanh hơn và chi phí thấp hơn. Theo kết quả thử nghiệm, o3-mini được người dùng ưa chuộng hơn o1-mini trong hơn 50% trường hợp. Ngoài ra, nó mắc ít hơn 39% lỗi nghiêm trọng trên các câu hỏi thực tế khó và đưa ra câu trả lời rõ ràng hơn với tốc độ nhanh hơn 24%.

Khả năng tiếp cận và giá cả

o3-mini sẽ được tích hợp vào ChatGPT từ ngày 31/1, với các mức giới hạn truy vấn khác nhau tùy thuộc vào gói dịch vụ:

  • Người dùng miễn phí: Có thể sử dụng nút “Reason” để kích hoạt o3-mini.
  • ChatGPT Plus và Team: Được phép 150 truy vấn mỗi ngày.
  • ChatGPT Pro: Truy cập không giới hạn.
  • ChatGPT Enterprise và Edu: Sẽ được hỗ trợ trong vòng một tuần.

Đối với nhà phát triển, o3-mini sẽ có sẵn qua API của OpenAI với ba mức độ lập luận: thấp, trung bình và cao. Giá của o3-mini là 0,55 USD cho mỗi triệu token đầu vào và 4,40 USD cho mỗi triệu token đầu ra, rẻ hơn 63% so với o1-mini.

So sánh với đối thủ

Mặc dù o3-mini không vượt trội hoàn toàn so với mô hình R1 của DeepSeek, nó vẫn thể hiện được ưu thế trong một số bài kiểm tra. Ví dụ, o3-mini vượt R1 trong bài kiểm tra AIME 2024 (đo lường khả năng hiểu và phản hồi các chỉ dẫn phức tạp) và SWE-bench Verified (kiểm tra lập trình). Tuy nhiên, trên bài kiểm tra GPQA Diamond (vật lý, sinh học và hóa học cấp tiến sĩ), o3-mini chỉ vượt R1 khi được đặt ở mức lập luận cao.

OpenAI khẳng định rằng o3-mini an toàn hơn hoặc ít nhất là ngang bằng với dòng o1 nhờ vào quy trình “deliberative alignment” – phương pháp giúp mô hình “suy nghĩ” về chính sách an toàn của OpenAI khi phản hồi. Theo công ty, o3-mini vượt trội hơn GPT-4o trong các đánh giá về an toàn và khả năng chống jailbreak.

Tuy nhiên, o3-mini vẫn có những hạn chế. Trên một số bài kiểm tra, hiệu suất của nó chỉ nhỉnh hơn o1 một chút, chẳng hạn như AIME 2024 (chỉ hơn 0,3 điểm).

Với việc ra mắt o3-mini, OpenAI tiếp tục khẳng định vị thế dẫn đầu trong lĩnh vực AI. Mô hình này không chỉ mang lại hiệu suất cao mà còn tiết kiệm chi phí, phù hợp với cả người dùng cá nhân và doanh nghiệp.

Đội ngũ admin quản trị luôn nỗ lực hết mình để đem đến những nội dung chất lượng nhất cho các thành viên tham gia. Mọi ý kiến đóng góp xin gửi về [email protected]. Xin trân trọng cảm ơn!

GameN - MXH dành cho game thủ Việt

Ban quản trị

BÀI MỚI

Infinity Nikki cập nhật 1.5

Tựa game phiêu lưu thời trang Infinity Nikki sắp nhận được bản cập nhật lớn mang tên "Bubble Season".

Meta hiện tại của EA FC 25

Hiểu rõ meta của EA FC 25 là điều cần thiết - từ đội hình, chiến thuật đến những cầu thủ mạnh nhất trong game.

EA FC 25 Team of the Season: Tất tần tật thông tin cần biết

Team of the Season (TOTS) luôn là sự kiện được mong chờ nhất trong EA FC 25, nơi các cầu thủ xuất sắc nhất mùa giải được vinh danh với phiên bản card đặc biệt.

Vayne Reroll ĐTCL mùa 14: Xạ thủ khuấy đảo meta đấu trường

Ở Đấu Trường Chân Lý mùa 14 này, cái tên Vayne Reroll ĐTCL mùa 14 đang trở thành tâm điểm của mọi bàn luận.

Follow us

5,655Thành viênThích
1,204Người theo dõiTheo dõi
2,189Người theo dõiĐăng Ký
Dành cho quảng cáo

ĐỌC NHIỀU