OpenAI ra mắt o3-mini

OpenAI tiếp tục đẩy mạnh cuộc đua AI với việc ra mắt o3-mini, một mô hình lập luận mới tập trung vào độ chính xác và hiệu quả chi phí.

Ngày 31/1/2025, OpenAI chính thức ra mắt o3-mini, mô hình AI lập luận mới nhất trong dòng sản phẩm o của hãng. Đây là bước đi quan trọng nhằm củng cố vị thế của OpenAI trong cuộc đua AI toàn cầu, đặc biệt khi đối thủ như DeepSeek đang ngày càng lớn mạnh.

o3-mini: Mô hình tiết kiệm

Khác với các mô hình ngôn ngữ lớn thông thường, o3-mini được thiết kế để tự kiểm tra thông tin kỹ lưỡng trước khi đưa ra kết quả. Điều này giúp nó tránh được nhiều sai sót thường gặp ở các mô hình khác. Mặc dù tốc độ phản hồi chậm hơn một chút, o3-mini được đánh giá là đáng tin cậy hơn trong các lĩnh vực như vật lý, toán học và lập trình.

OpenAI tuyên bố rằng o3-mini có khả năng tương đương với dòng o1, nhưng chạy nhanh hơn và chi phí thấp hơn. Theo kết quả thử nghiệm, o3-mini được người dùng ưa chuộng hơn o1-mini trong hơn 50% trường hợp. Ngoài ra, nó mắc ít hơn 39% lỗi nghiêm trọng trên các câu hỏi thực tế khó và đưa ra câu trả lời rõ ràng hơn với tốc độ nhanh hơn 24%.

Khả năng tiếp cận và giá cả

o3-mini sẽ được tích hợp vào ChatGPT từ ngày 31/1, với các mức giới hạn truy vấn khác nhau tùy thuộc vào gói dịch vụ:

Người dùng miễn phí: Có thể sử dụng nút “Reason” để kích hoạt o3-mini.
ChatGPT Plus và Team: Được phép 150 truy vấn mỗi ngày.
ChatGPT Pro: Truy cập không giới hạn.
ChatGPT Enterprise và Edu: Sẽ được hỗ trợ trong vòng một tuần.

Đối với nhà phát triển, o3-mini sẽ có sẵn qua API của OpenAI với ba mức độ lập luận: thấp, trung bình và cao. Giá của o3-mini là 0,55 USD cho mỗi triệu token đầu vào và 4,40 USD cho mỗi triệu token đầu ra, rẻ hơn 63% so với o1-mini.

So sánh với đối thủ

Mặc dù o3-mini không vượt trội hoàn toàn so với mô hình R1 của DeepSeek, nó vẫn thể hiện được ưu thế trong một số bài kiểm tra. Ví dụ, o3-mini vượt R1 trong bài kiểm tra AIME 2024 (đo lường khả năng hiểu và phản hồi các chỉ dẫn phức tạp) và SWE-bench Verified (kiểm tra lập trình). Tuy nhiên, trên bài kiểm tra GPQA Diamond (vật lý, sinh học và hóa học cấp tiến sĩ), o3-mini chỉ vượt R1 khi được đặt ở mức lập luận cao.

OpenAI khẳng định rằng o3-mini an toàn hơn hoặc ít nhất là ngang bằng với dòng o1 nhờ vào quy trình “deliberative alignment” – phương pháp giúp mô hình “suy nghĩ” về chính sách an toàn của OpenAI khi phản hồi. Theo công ty, o3-mini vượt trội hơn GPT-4o trong các đánh giá về an toàn và khả năng chống jailbreak.

Tuy nhiên, o3-mini vẫn có những hạn chế. Trên một số bài kiểm tra, hiệu suất của nó chỉ nhỉnh hơn o1 một chút, chẳng hạn như AIME 2024 (chỉ hơn 0,3 điểm).

Với việc ra mắt o3-mini, OpenAI tiếp tục khẳng định vị thế dẫn đầu trong lĩnh vực AI. Mô hình này không chỉ mang lại hiệu suất cao mà còn tiết kiệm chi phí, phù hợp với cả người dùng cá nhân và doanh nghiệp.

OpenAI ra mắt o3-mini

OpenAI tiếp tục đẩy mạnh cuộc đua AI với việc ra mắt o3-mini, một mô hình lập luận mới tập trung vào độ chính xác và hiệu quả chi phí.

o3-mini: Mô hình tiết kiệm

Khả năng tiếp cận và giá cả

So sánh với đối thủ

Manus AI: Đối thủ mới của thức OpenAI

OpenAI đi chợ

AI Agents của OpenAI có giá trên trời

OpenAI tham vọng nhất thống loạn AI với GPT-5

Elon Musk dẫn đầu nhóm muốn thâu tóm OpenAI giá 97,4 tỷ USD

Figure AI chấm dứt với OpenAI

OpenAI đã căng, vừa bổ sung cho ChatGPT một tính năng này

GameN - MXH dành cho game thủ Việt

BÀI MỚI

Crystal of Atlan chốt ngày ra đòn

VIractal: Hành trình kỳ ảo giữa bàn cờ và bài lá sắp ra mắt

Hướng dẫn cách đạt max level trong Blox Fruits không cần Robux

Siêu phẩm Vong Xuyên Phong Hoa Lục sắp được phát hành tại Việt Nam?

ĐỌC NHIỀU

ChatGPT có thể ra mắt công cụ tìm kiếm khiến Google nhức đầu

OpenAI ra mắt mô hình GPT-4o mới miễn phí

GPT-5 sẽ sở hữu bộ não của một tiến sĩ

Cuối cùng thì máy Mac cũng có ChatGPT miễn phí

Ra mắt GPT-4o mini

OpenAI ra mắt o3-mini

OpenAI tiếp tục đẩy mạnh cuộc đua AI với việc ra mắt o3-mini, một mô hình lập luận mới tập trung vào độ chính xác và hiệu quả chi phí.

o3-mini: Mô hình tiết kiệm

Khả năng tiếp cận và giá cả

So sánh với đối thủ

GameN - MXH dành cho game thủ Việt

BÀI MỚI

Follow us

ĐỌC NHIỀU