Thanawat Wongchai

Posted on Jun 22 • Originally published at apidog.com

ราคา Sakana Fugu: แผนสมาชิก, จ่ายเท่าที่ใช้ และโมเดลต้นทุนส่งผ่าน

ราคาของ Sakana Fugu สร้างขึ้นจากโครงสร้างสองแบบที่ได้รับการยืนยัน: ระดับการสมัครสมาชิกสำหรับการใช้งานทั่วไปในแต่ละวัน และแผนแบบจ่ายตามการใช้งานจริง (pay-as-you-go) สำหรับงานที่หนักขึ้นและงานระดับองค์กร กลไกใหม่ที่สำคัญคือการเรียกเก็บเงินแบบ passthrough ซึ่งช่วยให้เอเจนต์หลายตัวทำงานในคำขอเดียวได้โดยไม่ต้องเสียค่าธรรมเนียมแยกสำหรับแต่ละเอเจนต์ ตัวเลขดอลลาร์ทั้งหมดด้านล่างอ้างอิงจากแหล่งข้อมูลทุติยภูมิ เนื่องจาก หน้าเผยแพร่ ของ Sakana อธิบายโครงสร้างแต่ไม่ได้แสดงตัวเลขโดยตรง โปรดทราบว่า Fugu เป็นระบบการจัดการ ที่นำเสนอเหมือนโมเดลเดี่ยว ซึ่งทำให้กลไกการเรียกเก็บเงินนี้เป็นไปได้

ลองใช้ Apidog วันนี้

โครงสร้างราคาของ Fugu เป็นอย่างไร

Fugu ไม่ได้คิดราคาเหมือนโมเดลแชททั่วไป เพราะมันทำหน้าที่เป็น “ตัวนำ” (conductor): โมเดลภาษาที่ถูกฝึกให้มอบหมายงาน ตัดสินใจว่าจะตอบพร้อมท์เอง หรือจะเรียกทีมโมเดลผู้ทำงาน รวมถึงการเรียกตัวเองซ้ำ การออกแบบนี้ส่งผลโดยตรงต่อค่าใช้จ่าย

Sakana ยืนยันช่องทางการซื้อไว้ 2 แบบ:

ระดับการสมัครสมาชิก สำหรับงานประจำวัน เช่น เขียนโค้ด ตรวจสอบโค้ด แชทบอท และบริการเชิงโต้ตอบ โดยจ่ายค่าธรรมเนียมรายเดือนคงที่

จ่ายตามการใช้งานจริง (PAYG) สำหรับงานหนัก งานแบบแบตช์ งานวิจัย และปริมาณการใช้งานที่พุ่งสูง โดยคิดตามจำนวนโทเค็น

ทั้งรุ่น “Fugu” ที่เน้นสมดุล และ “Fugu Ultra” ที่เน้นคุณภาพสูงกว่า อยู่หลัง endpoint ที่เข้ากันได้กับ OpenAI เพียงจุดเดียว คุณเลือกรุ่นด้วย model ID จากนั้น Fugu จะตัดสินใจภายในว่าจะใช้พลังประมวลผลเท่าใด

ยังไม่มีรายงานระดับฟรีแบบเดี่ยว สิ่งที่ใกล้เคียงที่สุดคือโปรโมชั่นเปิดตัว ซึ่งกล่าวถึงด้านล่าง

ถ้าคุณต้องการประเมินต้นทุนก่อนใช้งานจริง ให้ชี้ไคลเอนต์ OpenAI ที่มีอยู่ไปยัง Fugu แล้วบันทึก token usage แบบต่อคำขอ Apidog ช่วยให้เห็น request-level view ซึ่งสำคัญมากสำหรับ Fugu เพราะคำขอเดียวอาจแตกเป็นการเรียกโมเดลหลายครั้งภายในระบบ

ราคาที่รายงาน: ตรวจสอบข้อมูลสดก่อนวางงบประมาณ

ระดับการสมัครสมาชิกที่รายงาน

แผน	ราคาที่รายงานต่อเดือน	กลุ่มเป้าหมาย
Entry	รายงาน $20 / เดือน	นักพัฒนาแต่ละราย, งานทั่วไปแบบเบา
Mid	รายงาน $100 / เดือน	ทีม, งานเขียนโค้ดและตรวจสอบโค้ดที่สม่ำเสมอ
Top	รายงาน $200 / เดือน	ผู้ใช้ขั้นสูง, บริการเชิงโต้ตอบที่มีปริมาณมาก

รายงานว่าระดับเดียวกันนี้ใช้ได้กับทั้ง Fugu และ Fugu Ultra และมีโปรโมชั่นเปิดตัวที่ให้ใช้ฟรีเดือนที่สอง หากสมัครก่อนสิ้นเดือนกรกฎาคม 2026 หากโปรโมชั่นนี้มีผลต่อการตัดสินใจ ให้ตรวจสอบในคอนโซลก่อน เพราะข้อเสนอเปิดตัวเปลี่ยนแปลงได้เร็ว และข้อเสนอนี้ยังไม่ได้รับการยืนยันในหน้าเผยแพร่

อัตราจ่ายตามการใช้งานจริงที่รายงาน

ประเภทโทเค็น	อัตราที่รายงาน ต่อ 1 ล้านโทเค็น	ค่าบริการเพิ่มเติมที่รายงานเมื่อบริบทเกิน 272K
Input	รายงาน $5	รายงาน $10
Output	รายงาน $30	รายงาน $45
Cached input	รายงาน $0.50	รายงาน $1.00

จุดที่ต้องระวังคือคอลัมน์ค่าบริการเพิ่มเติม คำขอที่มีบริบทขนาดยาวเกินประมาณ 272K โทเค็น มีรายงานว่าค่าใช้จ่ายต่อ 1 ล้านโทเค็นจะเพิ่มขึ้นประมาณสองเท่า

สำหรับงานแบบ agentic หรือ orchestration พร้อมท์มักโตเร็ว เพราะตัวนำต้องส่งบริบทระหว่างเอเจนต์ผู้ทำงาน ดังนั้นการรัน Fugu Ultra สำหรับงานวิจัยอาจแตะช่วง long context ได้เร็วกว่าที่คาด

หากต้องการเห็นภาพว่าอัตรา PAYG เหล่านี้อยู่ระดับใด ให้เทียบกับโมเดลที่มีราคาเผยแพร่แล้ว เช่น หากคุณเคยประเมินราคา Claude Fable 5 คุณจะคุ้นกับรูปแบบการคิดราคาแบบ Frontier

คุณยังคงต้องจ่ายส่วนต่างของ Sakana เพิ่มเติมจากค่าใช้จ่ายของโมเดลผู้ทำงาน

ควรอ่านคำว่า passthrough billing อย่างระมัดระวัง รุ่น Fugu พื้นฐานใช้อัตราของโมเดลพื้นฐาน แต่รุ่น Fugu Ultra และอัตรา PAYG มีราคาสูงกว่าโมเดลผู้ทำงานที่ถูกที่สุดด้วยเหตุผล: คุณกำลังจ่ายให้ Sakana สำหรับการทำงานของตัวนำ เช่น การเลือกเส้นทาง การสื่อสารระหว่างเอเจนต์ และการสังเคราะห์คำตอบสุดท้าย

การตีความที่ตรงไปตรงมาคือ:

ตัวจัดการเองมีต้นทุนต่ำ เอกสาร Trinity อธิบายตัวประสานงานที่มีพารามิเตอร์น้อยกว่า 20,000 ตัวซึ่งปรับแต่งด้วยวิวัฒนาการ และ เอกสาร Conductor อธิบายโมเดล 7B ที่ฝึกด้วย reinforcement learning ซึ่งอ้างว่าเอาชนะ Mixture-of-Agents ได้ด้วยต้นทุนต่ำกว่า ตัวจัดการไม่ใช่แหล่งต้นทุนหลัก
โมเดลที่ตัวนำเรียกใช้อาจมีราคาแพง เมื่อ Fugu ตัดสินใจว่าปัญหายากต้องใช้โมเดลระดับ Frontier มันจะเรียกโมเดลนั้น และคุณจะจ่ายในอัตรา Frontier สำหรับโทเค็นเหล่านั้น รวมถึงส่วนต่างของ Sakana สำหรับการจัดการ

พูดง่าย ๆ: ตัวนำราคาถูกที่จ้างแรงงานแพงก็ยังสร้างใบแจ้งหนี้แพงได้ ข้อได้เปรียบด้านต้นทุนของ Fugu จะเกิดขึ้นเมื่อ workload ของคุณมีงานง่ายจำนวนมาก และมีงานยากเป็นครั้งคราวเท่านั้น

การเปรียบเทียบกับราคา Frontier จริง

คุณไม่ควรตัดสินตัวเลขของ Fugu โดยไม่มี baseline ให้เทียบ ตารางนี้ใช้ราคาของ Anthropic ณ วันที่ 2026-06-09:

โมเดล	Input ต่อ 1M	Output ต่อ 1M	คืออะไร
Fable 5	$10	$50	โมเดลที่ทรงพลังที่สุดของ Anthropic ที่มีให้ใช้งานทั่วไป ซึ่งสูงกว่า Opus 4.8 หนึ่งระดับ
Mythos 5	$10	$50	ช่วงราคาเดียวกับ Fable 5
Mythos Preview	$25	$125	โมเดล Frontier เดือนเมษายน 2026 ที่ถูกระงับไว้เนื่องจาก “อันตรายเกินกว่าจะเผยแพร่”

เมื่อเทียบกับอัตรา PAYG ที่รายงานของ Fugu คือประมาณ $5 สำหรับ input และ $30 สำหรับ output ต่อ 1 ล้านโทเค็น บนกระดาษ Fugu ดูถูกกว่า Fable 5 ต่อโทเค็น แต่การเปรียบเทียบแบบนี้อาจทำให้เข้าใจผิดหากดูแค่อัตราหน้าปก

Sakana อ้างว่า Fugu Ultra “เทียบเคียงได้กับโมเดลชั้นนำอย่าง Fable 5 และ Mythos Preview” ในงานวิศวกรรม วิทยาศาสตร์ และ benchmark ด้าน reasoning นี่เป็นการอ้างถึงความเทียบเคียง ไม่ใช่การอ้างว่า “ดีกว่า”

ที่สำคัญคือสถาปัตยกรรม: Fugu เป็นตัวจัดการที่เรียกใช้โมเดล Frontier ของผู้ขายรายอื่น และอาจเรียกตัวเองซ้ำ ดังนั้นเมื่อ Fugu สร้างคำตอบระดับ Frontier มันอาจทำได้โดยเรียกใช้โมเดล Frontier แล้วสังเคราะห์ผลลัพธ์ ตัวเลข token rate ที่เห็นเป็นของตัวนำ แต่การเรียกภายในของตัวนำจะถูกนำมาคิดต้นทุนด้วย

หากคุณกำลังพิจารณา Fugu เทียบกับโมเดลอื่น คู่มือ วิธีการเข้าถึง Sakana Fugu อธิบายขั้นตอนการลงทะเบียนไว้แล้ว ความแตกต่างสำคัญคือ Fable 5 และ Mythos เป็นโมเดลเดี่ยวที่มีอัตราเผยแพร่ชัดเจน ส่วน Fugu เป็นระบบที่ต้นทุนจริงขึ้นอยู่กับว่ามันตัดสินใจเรียกโมเดลใด

การเรียกใช้ Fugu ผ่านไคลเอนต์ที่เข้ากันได้กับ OpenAI

Fugu เปิด endpoint ที่เข้ากันได้กับ OpenAI เพียงจุดเดียว ดังนั้นคุณสามารถใช้ OpenAI SDK เดิมได้โดยเปลี่ยน base_url และ API key เท่านั้น

URL พื้นฐานไม่ได้เผยแพร่ในหน้าสาธารณะ ให้คัดลอกจากคอนโซลของคุณ และอย่าฮาร์ดโค้ด host ที่เดาเอง

ตัวอย่าง Python:

from openai import OpenAI

# Copy the real base URL from console.sakana.ai after you log in.
client = OpenAI(
    api_key="YOUR_SAKANA_API_KEY",
    base_url="<YOUR_FUGU_BASE_URL_FROM_CONSOLE>",
)

# "fugu" routes the balanced, passthrough-billed variant.
# "fugu-ultra" routes the maximum-quality variant.
response = client.chat.completions.create(
    model="fugu",
    messages=[
        {
            "role": "user",
            "content": "Review this function for security issues."
        },
    ],
)

print(response.choices[0].message.content)
print(response.usage)  # watch token counts; this is where cost shows up

แนวทางใช้งานจริง:

คัดลอก base_url จากคอนโซล Sakana
เก็บ API key ใน environment variable แทนการใส่ในโค้ด
ยืนยัน model ID ในคอนโซล เช่น fugu หรือ fugu-ultra เพราะอาจมี suffix วันที่
บันทึก response.usage ทุกครั้ง
ตั้ง alert หรือ budget จากจำนวน token ที่ใช้จริง

ตัวอย่างแบบใช้ environment variable:

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["SAKANA_API_KEY"],
    base_url=os.environ["FUGU_BASE_URL"],
)

response = client.chat.completions.create(
    model=os.environ.get("FUGU_MODEL", "fugu"),
    messages=[
        {"role": "system", "content": "You are a concise code reviewer."},
        {"role": "user", "content": "Find bugs in this API handler."},
    ],
)

usage = response.usage

print(response.choices[0].message.content)
print({
    "prompt_tokens": usage.prompt_tokens,
    "completion_tokens": usage.completion_tokens,
    "total_tokens": usage.total_tokens,
})

สำหรับ Fugu ฟิลด์ usage สำคัญมาก เพราะเป็นสัญญาณที่ชัดที่สุดของค่าใช้จ่ายต่อคำขอ คำเรียกภายในของตัวนำจะถูกรวมเข้าในจำนวน token ที่รายงาน รูปแบบ request/response ใช้สัญญา OpenAI chat completions มาตรฐาน ดังนั้นเครื่องมือหรือไคลเอนต์ที่รองรับโปรโตคอลนี้ควรใช้งานได้โดยไม่ต้องแก้เยอะ

ดูขั้นตอนการตั้งค่าเพิ่มเติมได้ในคู่มือ วิธีการใช้ Sakana Fugu API

วิธีประเมินต้นทุน Fugu ในโปรเจกต์จริง

ก่อนเลือกแผน ให้ทดสอบด้วย workload จริงของคุณแทนการดูราคาเฉลี่ยอย่างเดียว

1. แยกประเภทคำขอ

แบ่งคำขอออกเป็นกลุ่ม เช่น:

งานง่าย: สรุปข้อความ, แก้ grammar, ตอบ FAQ
งานปานกลาง: review โค้ด, เขียน test, วิเคราะห์ log
งานยาก: reasoning หลายขั้น, research, long context, multi-file code review

2. เก็บ usage ต่อคำขอ

สร้าง wrapper เพื่อ log token usage:

def call_fugu(messages, model="fugu"):
    response = client.chat.completions.create(
        model=model,
        messages=messages,
    )

    usage = response.usage

    log_record = {
        "model": model,
        "prompt_tokens": usage.prompt_tokens,
        "completion_tokens": usage.completion_tokens,
        "total_tokens": usage.total_tokens,
    }

    print(log_record)

    return response

3. คำนวณต้นทุนจาก token ที่ใช้จริง

ตัวอย่าง pseudo-calculation ตามอัตราที่รายงาน:

INPUT_RATE_PER_1M = 5.00
OUTPUT_RATE_PER_1M = 30.00

def estimate_cost(prompt_tokens, completion_tokens):
    input_cost = (prompt_tokens / 1_000_000) * INPUT_RATE_PER_1M
    output_cost = (completion_tokens / 1_000_000) * OUTPUT_RATE_PER_1M
    return input_cost + output_cost

ใช้ตัวเลขนี้เพื่อทดลองเท่านั้น ต้องยืนยันอัตราจริงในคอนโซลก่อนนำไปใช้วางงบประมาณ

4. ทดสอบ long context แยกต่างหาก

ถ้าคำขอของคุณมีบริบทยาว เช่น เอกสารหลายไฟล์ repo ขนาดใหญ่ หรือ research corpus ให้ทดสอบแยก เพราะบริบทที่เกินประมาณ 272K token มีรายงานว่าอัตราจะสูงขึ้น

5. เปรียบเทียบกับโมเดลเดี่ยว

สำหรับแต่ละ workload ให้ลองรันทั้ง:

Fugu
Fugu Ultra
โมเดลเดี่ยวที่คุณใช้อยู่

จากนั้นเทียบ:

คุณภาพคำตอบ
latency
prompt tokens
output tokens
total cost ต่อ request
failure cases

คำถามที่พบบ่อย

Fugu มีระดับฟรีหรือไม่?

ไม่มีรายงานระดับฟรีแบบเดี่ยว ข้อเสนอที่ใกล้เคียงที่สุดคือโปรโมชั่นเปิดตัวที่รายงานว่าให้ใช้ฟรีเดือนที่สอง หากสมัครก่อนสิ้นเดือนกรกฎาคม 2026 โปรโมชั่นนี้ไม่ได้รับการยืนยันในหน้าเผยแพร่ ดังนั้นควรตรวจสอบในคอนโซลที่ console.sakana.ai ก่อนตัดสินใจ

ทำไม Fugu ดูถูกกว่าต่อโทเค็น แต่อาจมีค่าใช้จ่ายสูงกว่า?

อัตราต่อโทเค็นที่รายงานเป็นของตัวนำ ไม่ใช่ต้นทุนทั้งหมดของโมเดลระดับ Frontier ที่มันอาจเรียกใช้ Fugu เป็นตัวจัดการที่มอบหมายปัญหายากให้โมเดลของผู้ขายรายอื่น และมีส่วนต่างสำหรับการจัดการเพิ่มเข้ามา โมเดล Frontier เดี่ยวมีอัตราเผยแพร่เพียงอัตราเดียว จึงเปรียบเทียบต้นทุนได้ตรงกว่า เช่นในการวิเคราะห์ ราคา Claude Fable 5

Passthrough billing ใน Fugu คืออะไร?

รายงานว่า Fugu รุ่นพื้นฐานถูกเรียกเก็บเงินตามอัตรามาตรฐานของโมเดลพื้นฐานที่มันเรียกใช้ โดยไม่มีค่าธรรมเนียมการจัดการต่อเอเจนต์แยกต่างหาก อย่างไรก็ตาม คุณยังคงต้องจ่ายส่วนต่างของ Sakana สำหรับรุ่นพรีเมียมและแผนแบบจ่ายต่อโทเค็น

ควรเลือกระบบสมัครสมาชิกหรือจ่ายตามการใช้งานจริง?

เลือกระบบสมัครสมาชิกหาก workload สม่ำเสมอ เช่น เขียนโค้ด ตรวจสอบโค้ด และแชทบอท เพราะค่าใช้จ่ายรายเดือนคาดการณ์ได้ง่ายกว่า

เลือกจ่ายตามการใช้งานจริงหาก workload เป็นแบบพุ่งสูง งานหนัก งาน batch หรืองานวิจัย และควรเผื่องบสำหรับ long context surcharge ที่รายงานว่าเริ่มมีผลเมื่อบริบทเกินประมาณ 272K token

จะติดตามค่าใช้จ่ายของคำขอ Fugu ได้อย่างไร?

บันทึกฟิลด์ usage ในทุก response เพราะฟิลด์นี้รวมการเรียกโมเดลภายในของตัวนำเป็นจำนวน token เดียว การส่งคำขอผ่านเครื่องมือที่บันทึก usage ต่อ request จะช่วยให้เห็นว่าค่าใช้จ่ายเพิ่มขึ้นจาก prompt แบบใด

หากคุณกำลังเปรียบเทียบ Fugu กับระบบ routing aggregator คู่มือ ทางเลือก OpenRouter ที่ดีที่สุด อธิบายแนวทางวัดต้นทุนระหว่าง routing กับ orchestration

สรุปสำหรับนักพัฒนา

ราคาของ Fugu เหมาะกับ workload ที่ส่วนใหญ่เป็นงานง่าย และมีปัญหายากเป็นครั้งคราว แต่จะไม่เหมาะเสมอไปหาก workload ของคุณต้องใช้คุณภาพระดับ Frontier อย่างต่อเนื่อง

ก่อนเลือกแผน ให้ทำ 3 อย่างนี้:

ยืนยันราคาจริงและโปรโมชั่นในคอนโซล
รัน benchmark ด้วย prompt จริงของโปรเจกต์
บันทึก response.usage ทุกคำขอ แล้วคำนวณต้นทุนจาก token จริง

หากต้องการติดตาม token usage ของ Fugu แบบทีละคำขอระหว่างทดสอบ ให้ ดาวน์โหลด Apidog แล้วส่งคำเรียกที่เข้ากันได้กับ OpenAI ผ่าน Apidog

DEV Community