Trong một động thái được cả cộng đồng công nghệ mong đợi, OpenAI gần đây đã chính thức bước chân vào thế giới mã nguồn mở với việc phát hành hai mô hình ngôn ngữ mạnh mẽ: gpt-oss-120b và gpt-oss-20b. Đây không chỉ là một tin tức lớn đối với các nhà phát triển và nhà nghiên cứu, mà còn là một tín hiệu cho thấy sự thay đổi chiến lược quan trọng từ một trong những tên tuổi hàng đầu trong lĩnh vực trí tuệ nhân tạo.
Giới thiệu “Tân Binh” GPT-OSS: Không Chỉ Là Mã Nguồn Mở
Khác với các phiên bản trước đây, bộ đôi gpt-oss (Open Source Software) được phát hành theo giấy phép Apache 2.0, một giấy phép rất thông thoáng, cho phép cộng đồng tự do sử dụng, sửa đổi, và triển khai các mô hình này cho cả mục đích thương mại mà không gặp nhiều ràng buộc.
Vậy hai mô hình này có gì đặc biệt?
- gpt-oss-120b: Phiên bản lớn hơn với 117 tỷ tham số, được thiết kế cho các tác vụ đòi hỏi khả năng suy luận phức tạp và hiệu suất cao. Đáng chú ý, nó có thể chạy hiệu quả trên một GPU 80GB duy nhất.
- gpt-oss-20b: Một phiên bản nhỏ gọn hơn với 21 tỷ tham số, được tối ưu hóa để có thể chạy ngay trên các phần cứng phổ thông, thậm chí là máy tính cá nhân.
Cả hai mô hình đều được xây dựng trên kiến trúc Mixture-of-Experts (MoE), giúp tối ưu hóa hiệu quả tính toán, cho phép mô hình hoạt động nhanh và tiết kiệm chi phí hơn.
Open models by OpenAI
Advanced open-weight reasoning models to customize for any use case and run anywhere.
Tại Sao Đây Là Một “Cú Hích” Lớn?
Việc OpenAI “mở lòng” mang lại nhiều ý nghĩa quan trọng:
- Khả năng tùy chỉnh sâu: Các nhà phát triển giờ đây có toàn quyền truy cập vào “bộ não” của mô hình. Họ có thể tinh chỉnh (fine-tune) mô hình trên các bộ dữ liệu chuyên biệt của riêng mình để tạo ra các ứng dụng AI độc đáo, phục vụ cho các lĩnh vực từ y tế, tài chính đến giáo dục.
- Tăng cường sự minh bạch và tin cậy: Việc công khai “chuỗi suy nghĩ” (chain-of-thought) của mô hình giúp người dùng dễ dàng gỡ lỗi và hiểu được tại sao mô hình lại đưa ra một câu trả lời cụ thể, từ đó tăng độ tin cậy vào kết quả.
- Thúc đẩy cạnh tranh và đổi mới: Động thái này của OpenAI tạo ra một sân chơi cạnh tranh và sôi động hơn. Các công ty và nhà phát triển có thêm lựa chọn chất lượng cao bên cạnh các mô hình mã nguồn mở khác như Llama của Meta hay Mistral.
- An toàn là ưu tiên hàng đầu: OpenAI nhấn mạnh rằng an toàn là nền tảng trong cách tiếp cận của họ. Các mô hình gpt-oss đã trải qua quá trình huấn luyện và kiểm thử an toàn nghiêm ngặt để đảm bảo việc triển khai có trách nhiệm.
Model performance
Chỉ số | gpt-oss-120b | gpt-oss-20b | OpenAI o3 | OpenAI o4-mini |
Suy luận & Kiến thức (Reasoning & knowledge) | ||||
MMLU | 90.0 | 85.3 | 93.4 | 93.0 |
GPQA Diamond | 80.1 | 71.5 | 83.3 | 81.4 |
Humanity’s Last Exam | 19.0 | 17.3 | 24.9 | 17.7 |
Toán thi đấu (Competition math) | ||||
AIME 2024 | 96.6 | 96.0 | 95.2 | 98.7 |
AIME 2025 | 97.9 | 98.7 | 98.4 | 99.5 |
Bắt Đầu Với GPT-OSS Ở Đâu?
OpenAI đã hợp tác với nhiều nền tảng lớn để giúp các nhà phát triển có thể dễ dàng tiếp cận và sử dụng các mô hình mới:
- Hugging Face: Bạn có thể tìm thấy và tải xuống các mô hình này một cách dễ dàng.
- Nền tảng đám mây: Các dịch vụ lớn như Amazon Web Services (AWS), Microsoft Azure, và Databricks đều đã tích hợp gpt-oss, cho phép triển khai và mở rộng quy mô một cách linh hoạt.
- Chạy cục bộ: Với các công cụ như Ollama, bạn hoàn toàn có thể chạy mô hình gpt-oss-20b ngay trên máy tính của mình.
Mọi người có thể trải nghiệm: Tại đây
Hướng Tới Tương Lai Mở
Việc OpenAI phát hành gpt-oss không chỉ đơn thuần là việc cung cấp thêm công cụ mới. Nó thể hiện sự ghi nhận và cam kết của OpenAI đối với hệ sinh thái mã nguồn mở, một cộng đồng đã và đang đóng góp rất lớn vào sự phát triển của AI. Đây là một bước đi chiến lược, hứa hẹn sẽ mở ra một chương mới đầy sáng tạo và đột phá cho ngành trí tuệ nhân tạo toàn cầu.