OpenAI đã tăng gấp đôi giá mỗi token trên dòng GPT-5 với việc phát hành GPT-5.5 vào ngày 23/4/2026. Giá đầu vào tăng từ 2,50 USD lên 5,00 USD cho mỗi triệu token, đầu ra tăng từ 15,00 USD lên 30,00 USD mỗi triệu. Giá Pro vẫn giữ nguyên ở mức 30/180 USD. Đó là tiêu đề chính; các chi tiết là nơi ẩn chứa chi phí thực tế.
Bài viết này hướng dẫn chi tiết cách tính chi phí và các phương án triển khai thực tế: từ giá API chuẩn, Batch, Flex, Priority, đến giá Pro, giới hạn Codex và cách dự toán chi phí cho khối lượng công việc thực tế trước khi chuyển đổi mô hình.
Tham khảo tổng quan mô hình tại GPT-5.5 là gì. Hướng dẫn dành cho developer: Cách sử dụng API GPT-5.5.
Tóm tắt
| Dịch vụ | Đầu vào / Triệu | Đầu ra / Triệu |
|---|---|---|
| API tiêu chuẩn GPT-5.5 | $5.00 | $30.00 |
| API GPT-5.5 Pro | $30.00 | $180.00 |
| GPT-5.5 Batch (giảm 50%) | $2.50 | $15.00 |
| GPT-5.5 Flex (giảm 50%) | $2.50 | $15.00 |
| GPT-5.5 Priority (gấp 2,5 lần) | $12.50 | $75.00 |
| API tiêu chuẩn GPT-5.4 | $2.50 | $15.00 |
| API GPT-5.4-mini | $0.25 | $2.00 |
GPT-5.5 có giá gấp đôi GPT-5.4 ở cấp token, nhưng OpenAI tuyên bố hiệu quả tăng ~20% khi tính đến hiệu quả sử dụng token.
Các con số chính
- GPT-5.5: $5.00/m triệu token đầu vào, $30.00/m triệu token đầu ra.
- GPT-5.5 Pro: $30.00/m triệu đầu vào, $180.00/m triệu đầu ra.
- Cửa sổ ngữ cảnh: 1 triệu token trên cả hai biến thể. Token suy luận tính vào hóa đơn đầu ra.
Batch, Flex và Priority
OpenAI cung cấp 3 cấp độ giá ngoài chuẩn giúp bạn chủ động kiểm soát chi phí và tốc độ.
API Batch
Gửi request qua endpoint Batch, bạn được giảm 50% giá tiêu chuẩn, hoàn thành dưới 24h. Batch rất phù hợp cho:
- Chạy batch đánh giá trên toàn bộ dataset
- Bổ sung hoặc xử lý lại dữ liệu lịch sử
- Quy trình off-line, độ trễ hàng giờ không ảnh hưởng
Với giá này, GPT-5.5 ngang giá GPT-5.4. Hãy cân nhắc batch cho mọi tác vụ không cần realtime.
Xử lý Flex
Flex cũng giảm 50% chi phí, thời gian phản hồi thay đổi từ vài giây đến vài phút tùy tải. Dùng Flex khi chấp nhận được biến động latency và muốn giá rẻ gần như Batch cho trải nghiệm gần realtime.
Xử lý ưu tiên
Priority giá gấp 2,5 lần chuẩn (12,50 USD / 75,00 USD mỗi triệu token trên GPT-5.5), mang lại thông lượng và rate limit cao, độ trễ gần bằng 0. Dùng cho các tính năng user-facing realtime đòi hỏi tốc độ phản hồi cao.
Tính toán chi phí chế độ suy nghĩ (Thinking mode)
Chế độ suy nghĩ (GPT-5.5 Thinking, dùng reasoning.effort cao hơn) không tăng giá mỗi token, nhưng tăng số token sử dụng trên mỗi request. Hệ số nhân tùy nỗ lực:
| Nỗ lực | Hệ số token đầu ra | Khi nào nên dùng |
|---|---|---|
thấp (mặc định) |
1× | Đa số use case thông thường |
trung bình |
1.3–2× | Mã hóa multi-step, content có cấu trúc |
cao |
2–4× | Nghiên cứu chuyên sâu, yêu cầu độ chính xác |
rất cao |
3–8× | Agent loop, chuỗi tool, lập kế hoạch chi tiết |
Ví dụ: 1 call xhigh với prompt dài có thể dùng 20k token suy luận. Với giá $30/m triệu token, chỉ riêng phần này đã tốn $0.60, chưa kể token đầu ra.
Lập ngân sách theo workload, không theo từng request lẻ.
Giá Codex
Codex gắn với các gói ChatGPT, không tính phí từng token. Ngày 23/4/2026, cấu trúc như sau:
| Gói | Truy cập Codex | GPT-5.5 | Ghi chú |
|---|---|---|---|
| Miễn phí | Có (giới hạn thời gian) | Có | Giới hạn weekly |
| Go | Có (giới hạn thời gian) | Có | Gấp đôi Free |
| Plus ($20/tháng) | Có | Có | Giới hạn tiêu chuẩn |
| Pro ($200/tháng) | Có | Có + Thinking + Pro (trong ChatGPT) | Giới hạn cao nhất/user |
| Business | Có | Có | Tính theo seat |
| Doanh nghiệp/Giáo dục | Có | Có | Hợp đồng riêng |
Nếu bạn làm việc nhiều trên terminal với Codex, Plus/Pro là cách rẻ nhất để chạy GPT-5.5 - đặc biệt khi vượt vài trăm nghìn token/ngày. Xem hướng dẫn về con đường miễn phí để tận dụng tối đa.
So sánh: GPT-5.5 và các phiên bản còn lại
Khi nào nên trả tiền cho GPT-5.5, khi nào nên giữ GPT-5.4 hoặc GPT-5.4-mini? Tính toán chi phí dựa vào mức độ phức tạp và khối lượng đầu ra.
| Mô hình | Đầu vào / Triệu | Đầu ra / Triệu | Chi phí cho 1k token đầu ra |
|---|---|---|---|
| GPT-5.4-mini | $0.25 | $2.00 | $0.0020 |
| GPT-5.4 | $2.50 | $15.00 | $0.0150 |
| GPT-5.5 | $5.00 | $30.00 | $0.0300 |
| GPT-5.5 Pro | $30.00 | $180.00 | $0.1800 |
- Đầu ra lớn, rủi ro thấp (phân loại, tóm tắt, chat đơn giản): GPT-5.4-mini.
- Khối lượng sản xuất, 5.4 đáp ứng chất lượng: GPT-5.4.
- Mã hóa phức tạp, agent multi-step, nghiên cứu sâu: GPT-5.5.
- Yêu cầu cực cao về độ chính xác: GPT-5.5 Pro.
Ví dụ thực tế: chi phí agent mã hóa mỗi tác vụ
Một phiên agent thông qua API GPT-5.5 với reasoning.effort: "medium":
- Token đầu vào/tác vụ (context + prompt): ~15,000
- Token đầu ra/tác vụ (code + giải thích): ~3,000
- Token suy luận/tác vụ (medium): ~6,000
Chi phí/tác vụ với giá chuẩn:
- Đầu vào: 15k × $5.00/m = $0.075
- Đầu ra: (3k+6k) × $30.00/m = $0.27
- Tổng: $0.345/tác vụ mã hóa hoàn thành
Chạy cùng workload trên GPT-5.4:
- Đầu vào: 15k × $2.50/m = $0.0375
- Đầu ra: 9k × $15.00/m = $0.135
- Tổng: $0.1725/tác vụ
GPT-5.5 đắt gấp 2 lần/tác vụ với cùng mức effort. Việc nâng cấp chỉ hợp lý khi hiệu năng (SWE-bench 88,7% vs ~74%) giúp hoàn thành nhiều tác vụ hơn mà không phải làm lại thủ công.
Các biện pháp kiểm soát chi phí nên áp dụng từ đầu
5 đòn bẩy giúp kiểm soát bill GPT-5.5:
-
Giới hạn cứng
max_output_tokenscho mọi call. Mặc định 2.000, tăng nếu thật sự cần đầu ra dài. - JSON schema nghiêm ngặt. Output lỗi phải retry, retry là 1 call tính phí đầy đủ.
- Routing theo độ khó. Request dễ giao cho GPT-5.4-mini, khó mới giao GPT-5.5. 10 dòng code routing tiết kiệm hơn tối ưu prompt.
- Batch cho mọi tác vụ offline. Đánh giá, dữ liệu, report ban đêm đều giảm 50% giá.
-
Theo dõi
usage.reasoning_tokens. Bill bất ngờ thường do token suy luận ở effort cao. Nên đặt cảnh báo usage bất thường.
Ước tính chi phí hàng tháng theo gói
| Gói | Giá hàng tháng | Phù hợp nhất |
|---|---|---|
| Miễn phí | $0 | Dùng thử GPT-5.5 với Codex trước khi commit |
| Go | $4/tháng | Học sinh, sinh viên, người dùng ít |
| Plus | $20/tháng | Dev cá nhân dùng Codex + ChatGPT hàng ngày |
| Pro | $200/tháng | Power user cần Thinking & Pro trên ChatGPT |
| Business | $25/seat/tháng | Nhóm cần workspace chung |
| Doanh nghiệp/Giáo dục | Tùy chỉnh | Hợp đồng riêng, có SLA |
Nếu chạy >4 triệu token đầu ra/tháng qua API, gói Pro + Codex CLI sẽ rẻ hơn trả phí từng token, miễn là workload nằm trong context window 400k token của CLI.
Tín hiệu thay đổi giá cần theo dõi
- GA (General Availability) API GPT-5.5: Giá có thể giảm khi cạnh tranh với Anthropic, Gemini, các mô hình open source trên bảng xếp hạng Vellum.
- Dân chủ hóa Pro: OpenAI thường hạ giá gói Pro sau 3–6 tháng. Không nên mặc định giá 30/180 USD là cố định mãi mãi.
Câu hỏi thường gặp
Lưu cache có giảm chi phí đầu vào không? Có. Token đầu vào cache trên GPT-5.5 tính phí thấp hơn nhiều so với chuẩn; trang giá OpenAI có hệ số cụ thể. Cache mọi thứ tái sử dụng được (prompt system, schema tool, context repo).
Có chiết khấu số lượng lớn không? Chưa công bố. Doanh nghiệp lớn ký hợp đồng riêng, OpenAI điều chỉnh giá nếu usage lớn. Liên hệ sales nếu annual spending >1 triệu USD.
Chế độ suy nghĩ có tốn thêm chi phí ngoài giá token? Không. Tốn vì dùng nhiều token hơn, không phải do giá token khác.
Sử dụng Codex CLI có tính phí riêng với API không? Chỉ khi đăng nhập bằng API key. Đăng nhập ChatGPT tính vào gói, còn API key tính usage riêng.
Cách rẻ nhất để dùng thử GPT-5.5? Gói Free/Go + Codex CLI. Xem hướng dẫn con đường miễn phí để biết các lựa chọn không tốn phí.
Top comments (0)