DEV Community

Cover image for วิธีใช้ Google Genie 3: สอนใช้งาน, เคล็ดลับสร้างสรรค์ และสิ่งที่คุณควรรู้
Thanawat Wongchai
Thanawat Wongchai

Posted on • Originally published at apidog.com

วิธีใช้ Google Genie 3: สอนใช้งาน, เคล็ดลับสร้างสรรค์ และสิ่งที่คุณควรรู้

สรุปย่อ

Google Genie 3 เป็นโมเดลแปลงภาพสเก็ตช์เป็นวิดีโอที่เปิดให้เข้าถึงเฉพาะการวิจัยในต้นปี 2026 ปัจจุบันเข้าถึงได้เฉพาะผ่านสาธิตเชิงทดลองและโครงการนำร่องกับพันธมิตรที่เลือก อินเทอร์เฟซเน้นที่แคนวาส (canvas) สำหรับอัปโหลดภาพสเก็ตช์หรือภาพอ้างอิง พร้อมกับข้อความแจ้งเพื่อสร้างคลิปวิดีโอแบบโต้ตอบ การกำหนดราคา การเข้าถึง API และนโยบาย商ใช้เชิงพาณิชย์ยังไม่แน่ชัด คู่มือนี้จะแนะนำสิ่งที่ทราบและวิธีเตรียมตัวสำหรับการเปิดให้ใช้งาน

ทดลองใช้ Apidog วันนี้

บทนำ

Google Genie 3 แตกต่างจากเครื่องมือสร้างวิดีโอ AI ทั่วไป เช่น Sora หรือ Kling เพราะเน้นสร้างวิดีโอแบบโต้ตอบโดยใช้ภาพสเก็ตช์เป็นหลัก: วาดฉาก เพิ่มข้อความแจ้ง โมเดลจะสร้างการเคลื่อนไหวที่เล่นได้จริง

กรณีใช้งานหลัก ได้แก่ การสร้างต้นแบบเกม, เนื้อหาแบบโต้ตอบ, และออกแบบการเคลื่อนไหว เหมาะกับการเปลี่ยนแนวคิดให้เป็นการเคลื่อนไหวที่ทดสอบได้รวดเร็ว

คู่มือนี้เน้นโครงสร้างอินเทอร์เฟซ วิธีสร้างผลงาน แนวทางปฏิบัติที่ดีที่สุด และสิ่งที่ยังไม่ทราบเกี่ยวกับการเข้าถึง/ราคา

สถานะการเข้าถึงปัจจุบัน

ต้นปี 2026 Genie 3 ยังอยู่ในสภาพแวดล้อมการวิจัยที่จำกัด สำหรับนักพัฒนา:

  • เครื่องมือภายในของ Google: ใช้งานเฉพาะนักวิจัยและพันธมิตรที่เลือก
  • การสาธิตเชิงทดลอง: เฉพาะในงานอีเวนต์หรือเอกสารเทคนิค
  • โครงการนำร่องกับพันธมิตร: สำหรับนักพัฒนาในสายเฉพาะ

หากต้องการเข้าถึงก่อนใคร ให้ติดตามประกาศของ Google DeepMind และลงทะเบียนรายการรอหรือโปรแกรมพรีวิวสำหรับนักพัฒนา

สำหรับการสร้างวิดีโอจริงตอนนี้ โมเดลที่เปิด API เช่น Kling 2.0, Seedance 2.0, WAN 2.5 พร้อมใช้งานผ่าน API ของ WaveSpeedAI


โครงสร้างอินเทอร์เฟซ

อินเทอร์เฟซ Genie 3 ตามสาธิตประกอบด้วย 3 ส่วนหลัก:

  • แคนวาส/พรีวิว: ส่วนอัปโหลดภาพสเก็ตช์ วางอ้างอิง ดูผลลัพธ์วิดีโอที่สร้าง
  • แผงพร้อมต์และบริบท: ช่องข้อความ (ขวาหรือใต้แคนวาส) ใส่บันทึกสไตล์/ทิศทางกล้อง โมเดลอ่านทั้งภาพและข้อความ
  • ไทม์ไลน์/รายการรัน: แถบเลื่อนล่างหรือภาพย่อเปรียบเทียบรันหลายครั้งจากอินพุตเดียวกัน

ขั้นตอนพื้นฐาน: อัปโหลดภาพสเก็ตช์หรืออ้างอิง → เพิ่มข้อความแจ้ง → สร้าง → ตรวจสอบ → ปรับแต่ง → สร้างใหม่


วิธีเขียนพร้อมต์ที่มีประสิทธิภาพ

Genie 3 ใช้ภาพสเก็ตช์เป็นอินพุตหลัก ข้อความเป็นบริบทเสริม

  • ใช้ข้อความเป็นคำสั่งบนเวที ไม่ใช่เรื่องเล่า

    • ตัวอย่างที่ดี: กล้องมุมสูงแบบออร์โธกราฟิก, ตัวละครวิ่งจากซ้ายไปขวา, เลื่อนด้านข้างอย่างราบรื่น
    • ตัวอย่างที่ควรเลี่ยง: ฮีโร่ผู้กล้าหาญเริ่มต้นการผจญภัยครั้งยิ่งใหญ่ผ่านภูมิประเทศอันตราย
  • ใช้ภาษาภาพที่เฉพาะเจาะจง

    • "ภาพพิกเซลอาร์ต 2 มิติแบบแบน, สไตล์ NES"
    • "กล้องแพลตฟอร์มแบบเลื่อนด้านข้างที่ราบรื่น, ติดตามผู้เล่น"
    • "มุมมองคงที่, ตัวละครเดียวกระโดด"
  • ทำให้ภาพสเก็ตช์เรียบง่ายและชัดเจน

    • ใช้ตัวละคร/วัตถุเดียวสำหรับทดสอบ
    • โครงร่างเด่นชัด หลีกเลี่ยงรายละเอียดที่ไม่ต้องการ
    • สิ่งที่วาดคือสิ่งที่ได้

พารามิเตอร์การสร้าง

จากเอกสารสาธิต:

  • ระยะเวลาและความละเอียด:

    • คลิปสั้น (2-8 วินาที) สร้างต้นแบบดีที่สุด
    • คลิปยาว/ความละเอียดสูงอาจมีอาการผิดปกติ (artifacts)
    • วนซ้ำที่ความละเอียดต่ำก่อน แล้วค่อยเพิ่มขนาด
  • คำแนะนำสไตล์:

    • ใช้ภาษาศิลปะ/เกมเฉพาะเจาะจง เช่น
    • "กล้องแพลตฟอร์มแบบเลื่อนด้านข้างที่ราบรื่น, ติดตามผู้เล่น (เกม)"
    • "กล้องออร์โธกราฟิกมุมสูง, เกม RPG มุมมองจากบนลงล่าง (เกม)"
    • "แอนิเมชันแบบตัดกระดาษ 2 มิติ, อัตราเฟรมจำกัด (แอนิเมชัน)"
  • ความสุ่ม/ความแปรปรวน:

    • ความสุ่มต่ำ: ผลลัพธ์อินพุตเดียวกันสอดคล้องกัน
    • ความสุ่มสูง: เกิดไอเดียใหม่แต่คาดเดายาก

แนวทางปฏิบัติที่ดีที่สุดจากการสาธิต

  • เริ่มง่ายแล้วค่อยเพิ่มความซับซ้อน
    • เริ่มด้วยตัวละครเดียว ท่าทางเดียว เพิ่มความซับซ้อนทีละขั้น
  • ใช้อ้างอิงแต่ไม่มากเกินไป
    • อ้างอิงภาพเดียวช่วยยึดสไตล์ อ้างอิงมากไปจะขัดแย้งกัน
    • เมื่อได้สไตล์ที่ต้องการ ลองลบอ้างอิงดูว่าโมเดลจำสไตล์ได้หรือไม่
  • ควบคุมภาพสเก็ตช์
    • ภาพสเก็ตช์สำคัญกว่าข้อความ ถ้าสเก็ตช์ขัดกับข้อความ โมเดลจะยึดสเก็ตช์
    • ใช้ข้อความอธิบายสิ่งที่สเก็ตช์ไม่แสดง เช่น ทิศทางการเคลื่อนไหว สไตล์ บรรยากาศ

สิ่งที่ยังไม่ทราบ

ต้นปี 2026 Genie 3 ยังไม่มีรายละเอียดดังนี้:

  • โมเดลการกำหนดราคา: ยังไม่ระบุ (ต่อคลิป, ตามโทเค็น, หรือสมัครสมาชิก)
  • การเข้าถึง API: ยังไม่มีปลายทาง API สาธารณะ
  • ข้อจำกัดและโควต้า: ยังไม่เปิดเผย
  • สิทธิ์การใช้งานเชิงพาณิชย์: ยังไม่ชัดเจนเรื่องเนื้อหา/ทรัพย์สินทางปัญญา
  • ความพร้อมใช้งานภูมิภาค: ยังไม่มีข้อมูล
  • สร้างเนื้อหายาว: ความต่อเนื่องในหลายฉากยังไม่แน่ชัด

ก่อนใช้ Genie 3 ในงานผลิตจริง ต้องรอข้อมูลส่วนนี้


การใช้ทางเลือกอื่นที่เข้าถึงได้ผ่าน API ในปัจจุบัน

แม้ Genie 3 ยังไม่เปิดใช้งานสาธารณะ แต่มีโมเดลสร้างวิดีโอที่พร้อมผลิตได้ทันที

ทดสอบ Kling 2.0 ด้วย Apidog:

POST https://api.wavespeed.ai/api/v2/kling/v2/standard/text-to-video
Authorization: Bearer {{WAVESPEED_API_KEY}}
Content-Type: application/json

{
  "prompt": "A small character runs across a flat 2D platformer level, side-scrolling camera, pixel art style",
  "duration": 5,
  "aspect_ratio": "16:9"
}
Enter fullscreen mode Exit fullscreen mode

การตั้งค่าสภาพแวดล้อมใน Apidog:

  • สร้าง Environment โดยใช้ WAVESPEED_API_KEY เป็น Secret Variable
  • เพิ่มการยืนยันผลลัพธ์:
Status code is 200
Response body has field id
Response body, field status equals "processing"
Enter fullscreen mode Exit fullscreen mode

สำหรับการสร้างต้นแบบสไตล์เกม WAN 2.5 และ Kling จัดการแอนิเมชันที่มีสไตล์ได้ดี แม้จะไม่ได้รับอินพุต sketch-first แบบ Genie 3 แต่การสร้างจากข้อความที่ละเอียดก็เป็นจุดเริ่มต้นที่ดีในการสร้างต้นแบบ


คำถามที่พบบ่อย

Genie 3 เปิดให้ใช้งานสาธารณะหรือไม่?

ไม่, ต้นปี 2026 ใช้งานได้เฉพาะกลุ่มวิจัยและพันธมิตรที่เลือก

อะไรคือความแตกต่างระหว่าง Genie 3 กับเครื่องมือสร้างวิดีโอ AI อื่น?

Genie 3 เน้นสร้างวิดีโอแบบโต้ตอบจากภาพสเก็ตช์ เหมาะกับต้นแบบเกม/ประสบการณ์โต้ตอบ ไม่ใช่วิดีโอภาพยนตร์หรือเนื้อหาการตลาด

Genie 3 จะมี API สาธารณะเมื่อใด?

ยังไม่มีประกาศเวลาที่แน่นอน โดยปกติ Google จะเปิดแบบจำกัดก่อนแล้วขยายเป็นสาธารณะใน 6-18 เดือน ติดตามข่าวจาก Google DeepMind

ควรใช้อะไรระหว่างรอ Genie 3?

Kling 2.0 และ Seedance 2.0 พร้อมใช้งานผ่าน API ของ WaveSpeedAI วันนี้ เหมาะกับการสร้างวิดีโอ AI ในงานผลิตจริง

Genie 3 แข่งขันกับ Unity หรือ Unreal ในการสร้างเกมหรือไม่?

ไม่ Genie 3 สร้างคลิปวิดีโอ ไม่ใช่สินทรัพย์เกมแบบโต้ตอบ ใช้สร้างต้นแบบการเคลื่อนไหว ไม่ใช่แทนที่เอนจินเกม

Top comments (0)