Sebastian Petrus

Posted on Jun 26 • Originally published at apidog.com

Sol, Terra, Luna: OpenAI vừa tách tên mô hình khỏi số phiên bản

OpenAI đã công bố GPT-5.6 vào ngày 26 tháng 6 năm 2026. Điểm đáng chú ý nhất không chỉ nằm ở bản thân mô hình, mà ở cách đặt tên: Sol, Terra và Luna không phải ba phiên bản tách biệt, mà là ba cấp độ khả năng trong cùng một thế hệ GPT-5.6. Số phiên bản cho biết thế hệ; tên gọi cho biết cấp độ. Cách phân tách này sẽ ảnh hưởng trực tiếp đến cách developer đọc tài liệu, chọn model và thiết kế cấu hình tích hợp trong các lần phát hành tiếp theo.

Dùng thử Apidog hôm nay

Trước khi đi vào triển khai, cần làm rõ kỳ vọng: hiện tại bạn chưa thể sử dụng Sol, Terra hoặc Luna rộng rãi. GPT-5.6 đang ở bản xem trước giới hạn thông qua OpenAI API và Codex, chưa có trong ChatGPT, và quyền truy cập chỉ dành cho khoảng 20 đối tác được chính phủ Hoa Kỳ phê duyệt. OpenAI cho biết khả năng truy cập rộng rãi hơn trên ChatGPT, Codex và API sẽ có “trong những tuần tới”. Vì vậy, bài viết này tập trung vào cách hiểu cấu trúc, chuẩn bị tích hợp và thiết kế abstraction để sẵn sàng khi quyền truy cập được mở.

Tóm tắt nhanh

GPT-5.6 là một thế hệ model.
Sol, Terra và Luna là ba cấp độ khả năng trong cùng thế hệ đó.
Sol là cấp cao nhất, Terra cân bằng, Luna nhanh và chi phí thấp nhất.
Con số là thế hệ; tên gọi là cấp độ.
Bản xem trước hiện bị giới hạn: API và Codex, chưa có trong ChatGPT.
Giá preview được công bố theo 1 triệu token:
- Sol: 5$ input / 30$ output
- Terra: 2.50$ input / 15$ output
- Luna: 1$ input / 6$ output
Với developer, điểm quan trọng là không nên hard-code logic quanh một model duy nhất. Hãy thiết kế cấu hình theo generation và tier.

Cách đọc tên model: generation và tier

Trước đây, tên model của OpenAI thường được hiểu theo số phiên bản: GPT-4, GPT-5, GPT-5.5. Cách đọc phổ biến là model mới hơn thường tốt hơn và có thể thay thế model cũ.

GPT-5.6 thay đổi cách đọc đó:

GPT-5.6 Sol
│       │
│       └── Tier: cấp độ khả năng / chi phí / tốc độ
└────────── Generation: thế hệ model

Với cấu trúc này:

5.6 cho biết thế hệ.
Sol, Terra, Luna cho biết cấp độ vận hành.
Các cấp độ không nhất thiết thay thế nhau.
Mỗi cấp độ phục vụ một nhóm workload khác nhau.

Nếu bạn muốn hiểu nền tảng mà cách phân tầng này được xây dựng dựa trên, xem thêm bài giải thích về GPT-5.5 là gì.

Ba cấp độ GPT-5.6 nên được hiểu như thế nào?

OpenAI định vị ba cấp độ như sau.

Sol: cấp hàng đầu

Sol là cấp mạnh nhất trong GPT-5.6. Nó được tinh chỉnh cho các tác vụ khó như:

lý luận sâu,
lập trình phức tạp,
phân tích khoa học,
phân tích bảo mật,
các tác vụ cần nhiều compute hơn.

Sol cũng là nơi OpenAI giới thiệu các điều khiển lý luận mới như max và ultra.

Terra: cấp cân bằng

Terra là cấp trung gian. OpenAI mô tả Terra rẻ hơn khoảng 2 lần so với GPT-5.5 trong khi vẫn mang lại hiệu suất tương tự.

Đây có thể là cấp phù hợp cho nhiều workload hằng ngày khi được mở rộng, ví dụ:

trợ lý lập trình,
phân tích tài liệu,
tạo nội dung kỹ thuật,
xử lý yêu cầu API thông thường,
các tác vụ cần cân bằng giữa chất lượng và chi phí.

Luna: cấp nhanh và chi phí thấp

Luna là cấp có chi phí thấp nhất và tốc độ cao nhất trong ba cấp. Nó phù hợp hơn với các workload có khối lượng lớn, nơi latency và chi phí quan trọng hơn khả năng lý luận tối đa.

Ví dụ:

phân loại văn bản ngắn,
trích xuất trường dữ liệu,
routing request,
tạo phản hồi ngắn,
batch processing quy mô lớn.

Mô hình phân tách tốc độ và chiều sâu không hoàn toàn mới. Chúng tôi từng phân tích hướng này trong bài GPT-5.5 Pro so với Instant. Điểm mới ở GPT-5.6 là các cấp độ có tên riêng ổn định thay vì chỉ là hậu tố gắn vào số phiên bản.

Vì sao developer nên quan tâm đến “tier”?

Nếu bạn đang xây dựng ứng dụng dùng LLM qua API, cách đặt tên này ảnh hưởng đến thiết kế cấu hình.

Thay vì hard-code như sau:

const model = "gpt-5.6-sol";

hãy tách cấu hình theo vai trò:

const llmProfiles = {
  deepReasoning: {
    generation: "gpt-5.6",
    tier: "sol"
  },
  defaultAssistant: {
    generation: "gpt-5.6",
    tier: "terra"
  },
  highVolume: {
    generation: "gpt-5.6",
    tier: "luna"
  }
};

Khi API chính thức công bố model ID, bạn có thể map profile nội bộ sang ID thực tế:

const modelIdMap = {
  "gpt-5.6:sol": process.env.MODEL_GPT_56_SOL,
  "gpt-5.6:terra": process.env.MODEL_GPT_56_TERRA,
  "gpt-5.6:luna": process.env.MODEL_GPT_56_LUNA
};

function resolveModel({ generation, tier }) {
  const key = `${generation}:${tier}`;
  const modelId = modelIdMap[key];

  if (!modelId) {
    throw new Error(`Model chưa được cấu hình: ${key}`);
  }

  return modelId;
}

Cách này giúp bạn:

đổi model ID mà không sửa logic ứng dụng,
routing request theo workload,
A/B test giữa các cấp độ,
kiểm soát chi phí theo từng nhóm tác vụ,
chuẩn bị cho các thế hệ tương lai như GPT-5.7 hoặc GPT-6.

Khi nào dùng Sol, Terra hoặc Luna?

Bạn có thể bắt đầu bằng bảng quyết định đơn giản:

Nhu cầu	Cấp phù hợp
Lý luận nhiều bước, phân tích sâu	Sol
Coding task phức tạp	Sol
Tác vụ hằng ngày cần cân bằng chất lượng và chi phí	Terra
Chatbot kỹ thuật thông thường	Terra
Phân loại, routing, trích xuất dữ liệu đơn giản	Luna
Batch lớn, nhạy cảm chi phí	Luna
Latency quan trọng hơn độ sâu	Luna

Một cách triển khai thực tế là định nghĩa policy routing:

function chooseTier(task) {
  if (task.requiresDeepReasoning) return "sol";
  if (task.highVolume || task.latencySensitive) return "luna";
  return "terra";
}

const task = {
  type: "code_review",
  requiresDeepReasoning: true,
  highVolume: false,
  latencySensitive: false
};

const tier = chooseTier(task);

console.log(tier); // "sol"

Sau đó, request builder chỉ cần nhận tier và map sang model thực tế khi ID chính thức có sẵn.

Giá preview cho thấy cách định vị sản phẩm

OpenAI đã công bố giá preview cho mỗi 1 triệu token input/output:

Tier	Input	Output
Sol	5$	30$
Terra	2.50$	15$
Luna	1$	6$

Nên đọc đây như một phổ định vị, không phải menu mua hàng ngay bây giờ, vì quyền truy cập vẫn bị giới hạn.

Điểm quan trọng:

Sol có chi phí cao nhất vì tập trung vào reasoning nặng.
Terra nằm giữa, hướng đến cân bằng.
Luna là mức chi phí thấp nhất.
Mỗi cấp thấp hơn gần như giảm khoảng một nửa chi phí.

Nếu bạn đang thiết kế hệ thống production, nên tách chi phí theo workload ngay từ đầu:

const estimatedCostPerMillionTokens = {
  sol: {
    input: 5,
    output: 30
  },
  terra: {
    input: 2.5,
    output: 15
  },
  luna: {
    input: 1,
    output: 6
  }
};

function estimateCost({ tier, inputTokens, outputTokens }) {
  const price = estimatedCostPerMillionTokens[tier];

  return (
    (inputTokens / 1_000_000) * price.input +
    (outputTokens / 1_000_000) * price.output
  );
}

console.log(
  estimateCost({
    tier: "terra",
    inputTokens: 500_000,
    outputTokens: 200_000
  })
);

Bạn không cần đợi đến khi model mở GA mới xây logic kiểm soát chi phí. Phần này có thể chuẩn bị trước.

Điều khiển reasoning mới trên Sol

GPT-5.6 giới thiệu các điều khiển lý luận mới, tập trung ở cấp Sol.

Theo OpenAI:

max cho phép Sol có nhiều thời gian hơn để lý luận sâu.
ultra vượt xa một tác nhân duy nhất bằng cách tận dụng các tác nhân phụ để tăng tốc công việc phức tạp.

Điều này cho thấy Sol không chỉ là “GPT-5.6 nhưng đắt hơn”. Nó là cấp nơi các cơ chế reasoning nặng hoạt động.

Một cấu hình request trong ứng dụng có thể được thiết kế dạng trừu tượng như sau:

{
  "model_profile": "deepReasoning",
  "reasoning": {
    "effort": "max",
    "mode": "ultra"
  },
  "input": "Phân tích kiến trúc hệ thống này và đề xuất rủi ro bảo mật."
}

Sau này, khi OpenAI công bố schema API chính thức, bạn chỉ cần map cấu hình nội bộ này sang field thật.

Xác minh tính đến tháng 6 năm 2026: GPT-5.6 vẫn đang trong preview giới hạn. OpenAI chưa công bố đầy đủ mọi chi tiết, bao gồm model ID API chính xác. Không nên hard-code chuỗi ID model. Các thông tin như cửa sổ ngữ cảnh vẫn chưa được xác nhận thống nhất. Hãy coi chúng là tín hiệu, không phải thông số production, cho đến khi có tài liệu chính thức.

Các cấp độ được tối ưu cho workload nào?

Theo OpenAI, trọng tâm của GPT-5.6 bao gồm:

lập trình,
khoa học,
sinh học, với GeneBench v1,
an ninh mạng, với ExploitBench và ExploitGym.

Phần bảo mật cần được hiểu đúng. Sol được tinh chỉnh để tìm lỗ hổng phần mềm và viết bản vá, đồng thời chống lại nỗ lực tổng hợp chuỗi khai thác hoàn chỉnh. Đây là hướng phòng thủ, không phải mô hình được trình bày như công cụ tấn công.

Với developer, cách áp dụng an toàn hơn là dùng model cho các tác vụ như:

review mã nguồn,
phát hiện pattern dễ gây lỗi,
đề xuất bản vá,
tạo test case bảo mật,
giải thích rủi ro trong dependency hoặc API contract.

Ví dụ prompt phòng thủ:

Bạn là trợ lý review bảo mật mã nguồn.

Nhiệm vụ:
1. Xác định rủi ro bảo mật trong đoạn code.
2. Giải thích vì sao rủi ro xảy ra.
3. Đề xuất bản vá an toàn.
4. Không tạo payload khai thác hoàn chỉnh.

Code:
<dán code tại đây>

Theo OpenAI và các báo cáo ban đầu, Sol và cấu hình ultra dẫn đầu trong một số tác vụ lập trình tác nhân. Tuy nhiên, các số liệu đó đến từ báo cáo thứ cấp, không phải từ tài liệu benchmark đầy đủ mà chúng tôi trực tiếp xác minh. Bạn có thể đọc thông báo của OpenAI tại GPT-5.6 Sol và phần tổng hợp của VentureBeat.

Vì sao preview bị hạn chế?

Thay đổi tên gọi diễn ra cùng một đợt ra mắt mà hầu hết developer chưa thể truy cập. Theo nội dung được báo cáo, chính quyền Hoa Kỳ đã hạn chế việc ra mắt theo sắc lệnh hành pháp ngày 2 tháng 6 năm 2026, thiết lập cơ chế đánh giá và chấm điểm cho các mô hình AI mới.

Hiện tại:

quyền truy cập thông qua API và Codex,
chỉ khoảng 20 đối tác được phê duyệt,
ChatGPT chưa bao gồm GPT-5.6 trong giai đoạn preview.

Theo MacRumors, OpenAI nói: “Chúng tôi đang thực hiện bước ngắn hạn này vì chúng tôi tin rằng đây là con đường vững chắc nhất để có sẵn rộng rãi hơn trong những tuần tới.”

Nói cách khác, các cấp độ, giá và điều khiển đã được mô tả, nhưng hầu hết developer vẫn phải chờ quyền truy cập rộng rãi hơn.

Cách chuẩn bị tích hợp GPT-5.6 ngay từ bây giờ

Bạn chưa thể gọi Sol, Terra hoặc Luna rộng rãi hôm nay, nhưng vẫn có thể chuẩn bị hệ thống.

1. Không hard-code model trong business logic

Không nên rải model ID trong nhiều file:

// Không nên
await client.responses.create({
  model: "some-hard-coded-model",
  input: userInput
});

Thay vào đó, dùng biến môi trường:

await client.responses.create({
  model: process.env.DEFAULT_LLM_MODEL,
  input: userInput
});

Hoặc dùng profile:

const profiles = {
  deep: process.env.LLM_MODEL_DEEP,
  balanced: process.env.LLM_MODEL_BALANCED,
  fast: process.env.LLM_MODEL_FAST
};

await client.responses.create({
  model: profiles.balanced,
  input: userInput
});

2. Tách workload theo cấp độ

Định nghĩa workload trước khi chọn model:

const workloadPolicy = {
  codeReview: "deep",
  apiDocSummary: "balanced",
  requestClassification: "fast"
};

function getProfileForWorkload(workload) {
  return workloadPolicy[workload] ?? "balanced";
}

Khi GPT-5.6 mở quyền truy cập, bạn có thể map:

deep      -> Sol
balanced  -> Terra
fast      -> Luna

3. Ghi log token và latency

Ngay cả khi đang dùng model khác, hãy bắt đầu thu thập:

input tokens,
output tokens,
latency,
error rate,
cost estimate,
workload type,
selected profile.

Ví dụ log đơn giản:

function logLLMCall({
  workload,
  profile,
  inputTokens,
  outputTokens,
  latencyMs,
  success
}) {
  console.log(
    JSON.stringify({
      workload,
      profile,
      inputTokens,
      outputTokens,
      latencyMs,
      success,
      timestamp: new Date().toISOString()
    })
  );
}

Khi có quyền truy cập GPT-5.6, bạn sẽ có baseline để so sánh Sol, Terra và Luna với model hiện tại.

4. Chuẩn hóa test case

Tạo bộ test cố định cho các workload quan trọng:

[
  {
    "name": "code-review-auth-bug",
    "workload": "codeReview",
    "expected": ["phát hiện lỗi xác thực", "đề xuất bản vá"]
  },
  {
    "name": "summarize-api-doc",
    "workload": "apiDocSummary",
    "expected": ["tóm tắt endpoint", "liệt kê tham số"]
  },
  {
    "name": "classify-support-ticket",
    "workload": "requestClassification",
    "expected": ["billing", "technical", "account"]
  }
]

Bộ test này giúp bạn so sánh các cấp độ theo tiêu chí thực tế thay vì chỉ dựa vào benchmark công bố.

Apidog phù hợp ở đâu?

Bạn không thể thử nghiệm Sol, Terra hoặc Luna rộng rãi hôm nay. Nhưng bạn có thể chuẩn bị pipeline API với các model hiện có như Claude Mythos 5, Claude Fable 5, GPT-5.5, Gemini 3.5 và 3.1 Pro, GLM-5.2 và Fugu Ultra. Các model này cung cấp endpoint HTTP tương thích OpenAI hoặc chuẩn, nghĩa là bạn có thể gửi request, kiểm tra response và xây assertion trong Apidog ngay bây giờ.

Một workflow thực tế:

Tạo collection cho endpoint LLM hiện tại.
Đặt base_url, api_key, model trong environment.
Viết request mẫu cho từng workload.
Thêm assertion cho JSON response, latency hoặc field bắt buộc.
Lưu test case làm baseline.
Khi có quyền truy cập GPT-5.6, chỉ đổi base_url và model.

Ví dụ body request có thể giữ dạng cấu hình:

{
  "model": "{{model}}",
  "input": "{{prompt}}",
  "metadata": {
    "workload": "code_review",
    "profile": "deep"
  }
}

Khi được cấp quyền truy cập GPT-5.6, bạn không cần xây lại bộ test. Bạn chỉ thay biến môi trường.

Cách đọc các bản phát hành OpenAI trong tương lai

Sau GPT-5.6, khi đọc thông báo model mới, hãy hỏi hai câu:

Generation là gì?

Ví dụ: GPT-5.6, GPT-5.7, GPT-6.
Tier là gì?

Ví dụ: Sol, Terra, Luna.

Một tiêu đề như GPT-5.7 Sol có nghĩa là:

thế hệ mới hơn,
vẫn ở làn hàng đầu.

Một thông báo như Luna được cập nhật có nghĩa là:

làn nhanh/chi phí thấp đã thay đổi,
Sol và Terra không nhất thiết thay đổi.

Cách đọc này giúp bạn thiết kế hệ thống ổn định hơn: logic ứng dụng bám theo workload, còn model cụ thể được cấu hình bên ngoài.

Câu hỏi thường gặp

Sol, Terra và Luna có nghĩa là gì?

Chúng là ba cấp độ khả năng của GPT-5.6. Sol là cấp hàng đầu, Terra là cấp cân bằng, Luna là cấp nhanh và chi phí thấp nhất. 5.6 là thế hệ; tên gọi là cấp độ.

Sol có phải model khác với GPT-5.6 không?

Không. Sol là GPT-5.6 ở cấp hàng đầu. Terra và Luna cũng thuộc cùng thế hệ GPT-5.6 nhưng ở các cấp chi phí và tốc độ khác nhau.

Tôi có thể dùng Sol, Terra hoặc Luna ngay hôm nay không?

Chưa. GPT-5.6 đang trong preview giới hạn thông qua API và Codex, chỉ dành cho khoảng 20 đối tác được phê duyệt, và chưa có trong ChatGPT. OpenAI nói quyền truy cập rộng rãi hơn sẽ có trong những tuần tới. Xem thêm bài GPT-5.6 Sol là gì.

Giá khác nhau như thế nào?

Theo giá preview mỗi 1 triệu token:

Sol: 5$ input / 30$ output
Terra: 2.50$ input / 15$ output
Luna: 1$ input / 6$ output

Mỗi cấp thấp hơn gần như giảm khoảng một nửa chi phí.

Có nên hard-code model ID GPT-5.6 ngay không?

Không. OpenAI chưa công bố đầy đủ model ID API chính xác. Hãy dùng biến môi trường, profile nội bộ hoặc routing layer để dễ thay đổi khi tài liệu chính thức có sẵn.

Các tên Sol, Terra và Luna có tiếp tục tồn tại trong thế hệ sau không?

Theo cách OpenAI định vị, các cấp độ này được thiết kế để bền vững và phát triển theo nhịp độ riêng. Vì vậy, một Terra trong thế hệ tương lai vẫn nên báo hiệu cấp cân bằng, ngay cả khi model nền đã thay đổi.

Kết luận

GPT-5.6 không chỉ là một model mới; nó là một cách đặt tên mới. 5.6 cho biết thế hệ, còn Sol, Terra và Luna cho biết cấp độ về khả năng, tốc độ và chi phí. Với developer, điều quan trọng là thiết kế hệ thống theo profile và workload thay vì hard-code một model duy nhất.

Hiện tại, bạn vẫn chưa thể sử dụng GPT-5.6 rộng rãi. Nhưng bạn có thể chuẩn bị request, environment, test case và cost tracking ngay bây giờ. Tải xuống Apidog để xây sẵn kịch bản kiểm thử với các model bạn có thể truy cập hôm nay, để khi Sol, Terra hoặc Luna mở quyền truy cập, việc thử nghiệm chỉ còn là thay đổi cấu hình.

DEV Community