Sebastian Petrus

Posted on Apr 24 • Originally published at apidog.com

Bảng Giá GPT-5.5: Chi Tiết API, Codex và Chi Phí ChatGPT (Tháng 4/2026)

OpenAI đã tăng gấp đôi giá mỗi token trên dòng GPT-5 với việc phát hành GPT-5.5 vào ngày 23/4/2026. Giá đầu vào tăng từ 2,50 USD lên 5,00 USD cho mỗi triệu token, đầu ra tăng từ 15,00 USD lên 30,00 USD mỗi triệu. Giá Pro vẫn giữ nguyên ở mức 30/180 USD. Đó là tiêu đề chính; các chi tiết là nơi ẩn chứa chi phí thực tế.

Dùng thử Apidog ngay hôm nay

Bài viết này hướng dẫn chi tiết cách tính chi phí và các phương án triển khai thực tế: từ giá API chuẩn, Batch, Flex, Priority, đến giá Pro, giới hạn Codex và cách dự toán chi phí cho khối lượng công việc thực tế trước khi chuyển đổi mô hình.

Tham khảo tổng quan mô hình tại GPT-5.5 là gì. Hướng dẫn dành cho developer: Cách sử dụng API GPT-5.5.

Tóm tắt

Dịch vụ	Đầu vào / Triệu	Đầu ra / Triệu
API tiêu chuẩn GPT-5.5	$5.00	$30.00
API GPT-5.5 Pro	$30.00	$180.00
GPT-5.5 Batch (giảm 50%)	$2.50	$15.00
GPT-5.5 Flex (giảm 50%)	$2.50	$15.00
GPT-5.5 Priority (gấp 2,5 lần)	$12.50	$75.00
API tiêu chuẩn GPT-5.4	$2.50	$15.00
API GPT-5.4-mini	$0.25	$2.00

GPT-5.5 có giá gấp đôi GPT-5.4 ở cấp token, nhưng OpenAI tuyên bố hiệu quả tăng ~20% khi tính đến hiệu quả sử dụng token.

Các con số chính

GPT-5.5: $5.00/m triệu token đầu vào, $30.00/m triệu token đầu ra.
GPT-5.5 Pro: $30.00/m triệu đầu vào, $180.00/m triệu đầu ra.
Cửa sổ ngữ cảnh: 1 triệu token trên cả hai biến thể. Token suy luận tính vào hóa đơn đầu ra.

Batch, Flex và Priority

OpenAI cung cấp 3 cấp độ giá ngoài chuẩn giúp bạn chủ động kiểm soát chi phí và tốc độ.

API Batch

Gửi request qua endpoint Batch, bạn được giảm 50% giá tiêu chuẩn, hoàn thành dưới 24h. Batch rất phù hợp cho:

Chạy batch đánh giá trên toàn bộ dataset
Bổ sung hoặc xử lý lại dữ liệu lịch sử
Quy trình off-line, độ trễ hàng giờ không ảnh hưởng

Với giá này, GPT-5.5 ngang giá GPT-5.4. Hãy cân nhắc batch cho mọi tác vụ không cần realtime.

Xử lý Flex

Flex cũng giảm 50% chi phí, thời gian phản hồi thay đổi từ vài giây đến vài phút tùy tải. Dùng Flex khi chấp nhận được biến động latency và muốn giá rẻ gần như Batch cho trải nghiệm gần realtime.

Xử lý ưu tiên

Priority giá gấp 2,5 lần chuẩn (12,50 USD / 75,00 USD mỗi triệu token trên GPT-5.5), mang lại thông lượng và rate limit cao, độ trễ gần bằng 0. Dùng cho các tính năng user-facing realtime đòi hỏi tốc độ phản hồi cao.

Tính toán chi phí chế độ suy nghĩ (Thinking mode)

Chế độ suy nghĩ (GPT-5.5 Thinking, dùng reasoning.effort cao hơn) không tăng giá mỗi token, nhưng tăng số token sử dụng trên mỗi request. Hệ số nhân tùy nỗ lực:

Nỗ lực	Hệ số token đầu ra	Khi nào nên dùng
`thấp` (mặc định)	1×	Đa số use case thông thường
`trung bình`	1.3–2×	Mã hóa multi-step, content có cấu trúc
`cao`	2–4×	Nghiên cứu chuyên sâu, yêu cầu độ chính xác
`rất cao`	3–8×	Agent loop, chuỗi tool, lập kế hoạch chi tiết

Ví dụ: 1 call xhigh với prompt dài có thể dùng 20k token suy luận. Với giá $30/m triệu token, chỉ riêng phần này đã tốn $0.60, chưa kể token đầu ra.

Lập ngân sách theo workload, không theo từng request lẻ.

Giá Codex

Codex gắn với các gói ChatGPT, không tính phí từng token. Ngày 23/4/2026, cấu trúc như sau:

Gói	Truy cập Codex	GPT-5.5	Ghi chú
Miễn phí	Có (giới hạn thời gian)	Có	Giới hạn weekly
Go	Có (giới hạn thời gian)	Có	Gấp đôi Free
Plus ($20/tháng)	Có	Có	Giới hạn tiêu chuẩn
Pro ($200/tháng)	Có	Có + Thinking + Pro (trong ChatGPT)	Giới hạn cao nhất/user
Business	Có	Có	Tính theo seat
Doanh nghiệp/Giáo dục	Có	Có	Hợp đồng riêng

Nếu bạn làm việc nhiều trên terminal với Codex, Plus/Pro là cách rẻ nhất để chạy GPT-5.5 - đặc biệt khi vượt vài trăm nghìn token/ngày. Xem hướng dẫn về con đường miễn phí để tận dụng tối đa.

So sánh: GPT-5.5 và các phiên bản còn lại

Khi nào nên trả tiền cho GPT-5.5, khi nào nên giữ GPT-5.4 hoặc GPT-5.4-mini? Tính toán chi phí dựa vào mức độ phức tạp và khối lượng đầu ra.

Mô hình	Đầu vào / Triệu	Đầu ra / Triệu	Chi phí cho 1k token đầu ra
GPT-5.4-mini	$0.25	$2.00	$0.0020
GPT-5.4	$2.50	$15.00	$0.0150
GPT-5.5	$5.00	$30.00	$0.0300
GPT-5.5 Pro	$30.00	$180.00	$0.1800

Đầu ra lớn, rủi ro thấp (phân loại, tóm tắt, chat đơn giản): GPT-5.4-mini.
Khối lượng sản xuất, 5.4 đáp ứng chất lượng: GPT-5.4.
Mã hóa phức tạp, agent multi-step, nghiên cứu sâu: GPT-5.5.
Yêu cầu cực cao về độ chính xác: GPT-5.5 Pro.

Ví dụ thực tế: chi phí agent mã hóa mỗi tác vụ

Một phiên agent thông qua API GPT-5.5 với reasoning.effort: "medium":

Token đầu vào/tác vụ (context + prompt): ~15,000
Token đầu ra/tác vụ (code + giải thích): ~3,000
Token suy luận/tác vụ (medium): ~6,000

Chi phí/tác vụ với giá chuẩn:

Đầu vào: 15k × $5.00/m = $0.075
Đầu ra: (3k+6k) × $30.00/m = $0.27
Tổng: $0.345/tác vụ mã hóa hoàn thành

Chạy cùng workload trên GPT-5.4:

Đầu vào: 15k × $2.50/m = $0.0375
Đầu ra: 9k × $15.00/m = $0.135
Tổng: $0.1725/tác vụ

GPT-5.5 đắt gấp 2 lần/tác vụ với cùng mức effort. Việc nâng cấp chỉ hợp lý khi hiệu năng (SWE-bench 88,7% vs ~74%) giúp hoàn thành nhiều tác vụ hơn mà không phải làm lại thủ công.

Các biện pháp kiểm soát chi phí nên áp dụng từ đầu

5 đòn bẩy giúp kiểm soát bill GPT-5.5:

Giới hạn cứng max_output_tokens cho mọi call. Mặc định 2.000, tăng nếu thật sự cần đầu ra dài.
JSON schema nghiêm ngặt. Output lỗi phải retry, retry là 1 call tính phí đầy đủ.
Routing theo độ khó. Request dễ giao cho GPT-5.4-mini, khó mới giao GPT-5.5. 10 dòng code routing tiết kiệm hơn tối ưu prompt.
Batch cho mọi tác vụ offline. Đánh giá, dữ liệu, report ban đêm đều giảm 50% giá.
Theo dõi usage.reasoning_tokens. Bill bất ngờ thường do token suy luận ở effort cao. Nên đặt cảnh báo usage bất thường.

Ước tính chi phí hàng tháng theo gói

Gói	Giá hàng tháng	Phù hợp nhất
Miễn phí	$0	Dùng thử GPT-5.5 với Codex trước khi commit
Go	$4/tháng	Học sinh, sinh viên, người dùng ít
Plus	$20/tháng	Dev cá nhân dùng Codex + ChatGPT hàng ngày
Pro	$200/tháng	Power user cần Thinking & Pro trên ChatGPT
Business	$25/seat/tháng	Nhóm cần workspace chung
Doanh nghiệp/Giáo dục	Tùy chỉnh	Hợp đồng riêng, có SLA

Nếu chạy >4 triệu token đầu ra/tháng qua API, gói Pro + Codex CLI sẽ rẻ hơn trả phí từng token, miễn là workload nằm trong context window 400k token của CLI.

Tín hiệu thay đổi giá cần theo dõi

GA (General Availability) API GPT-5.5: Giá có thể giảm khi cạnh tranh với Anthropic, Gemini, các mô hình open source trên bảng xếp hạng Vellum.
Dân chủ hóa Pro: OpenAI thường hạ giá gói Pro sau 3–6 tháng. Không nên mặc định giá 30/180 USD là cố định mãi mãi.

Câu hỏi thường gặp

Lưu cache có giảm chi phí đầu vào không? Có. Token đầu vào cache trên GPT-5.5 tính phí thấp hơn nhiều so với chuẩn; trang giá OpenAI có hệ số cụ thể. Cache mọi thứ tái sử dụng được (prompt system, schema tool, context repo).

Có chiết khấu số lượng lớn không? Chưa công bố. Doanh nghiệp lớn ký hợp đồng riêng, OpenAI điều chỉnh giá nếu usage lớn. Liên hệ sales nếu annual spending >1 triệu USD.

Chế độ suy nghĩ có tốn thêm chi phí ngoài giá token? Không. Tốn vì dùng nhiều token hơn, không phải do giá token khác.

Sử dụng Codex CLI có tính phí riêng với API không? Chỉ khi đăng nhập bằng API key. Đăng nhập ChatGPT tính vào gói, còn API key tính usage riêng.

Cách rẻ nhất để dùng thử GPT-5.5? Gói Free/Go + Codex CLI. Xem hướng dẫn con đường miễn phí để biết các lựa chọn không tốn phí.

DEV Community