Thanawat Wongchai

Posted on Apr 8 • Originally published at apidog.com

Claude Mythos: อันตรายเกินไป Anthropic เผยไม่ปล่อยโมเดลนี้

สรุปย่อ (TL;DR)

Claude Mythos Preview ดูเหมือนจะเป็นโมเดลของ Anthropic ที่ถูกจำกัดการเข้าถึง และกำลังถูกทดสอบผ่าน Project Glasswing ซึ่งเป็นโครงการตัวอย่างที่เน้นด้านความปลอดภัยทางไซเบอร์ ไม่ใช่การเปิดตัวสู่สาธารณะ ตัวเลขผลการทดสอบที่รายงานระบุว่ามันอาจแข็งแกร่งกว่า Claude Opus 4.6 มากในงานวิศวกรรมซอฟต์แวร์ แต่ Anthropic ยังไม่ได้เผยแพร่ในวงกว้าง เหตุผลที่เป็นไปได้คือความเสี่ยงในการใช้งานสองทาง: โมเดลที่ช่วยผู้ป้องกันก็อาจช่วยผู้โจมตีได้เช่นกัน

ทดลองใช้ Apidog วันนี้

บทนำ

ห้องปฏิบัติการ AI รายใหญ่ทุกแห่งกล่าวว่าพวกเขายึดมั่นในความปลอดภัยอย่างจริงจัง มีห้องปฏิบัติการเพียงไม่กี่แห่งที่พิสูจน์ได้ด้วยการยับยั้งโมเดลอันทรงพลัง แทนที่จะรีบผลักดันออกสู่ตลาดให้เร็วที่สุด

นั่นคือสิ่งที่ทำให้ Claude Mythos Preview น่าสนใจ Anthropic ไม่ได้ประกาศการเปิดตัวเหมือนกับการเปิดตัว Claude ปกติ ไม่มีการเผยแพร่ API สู่สาธารณะในวงกว้าง ไม่มีการเปิดตัวผลิตภัณฑ์แชทมาตรฐาน และไม่มีหน้า "ลองใช้เลย" ที่เป็นมิตรต่อทุกคน แต่โมเดลนี้ปรากฏขึ้นจากการรายงานข่าวที่เชื่อมโยงกับ Project Glasswing ซึ่งเป็นโครงการที่จำกัดการเข้าถึงและมุ่งเน้นงานด้านความปลอดภัยทางไซเบอร์เชิงป้องกัน

แค่นั้นก็เพียงพอที่จะทำให้ผู้คนหันมาสนใจแล้ว แต่ตัวเลขผลการทดสอบที่แนบมากับ Claude Mythos Preview ทำให้เรื่องราวใหญ่ขึ้นมาก ผลลัพธ์ที่รายงานชี้ให้เห็นถึงการก้าวกระโดดครั้งใหญ่เมื่อเทียบกับ Claude Opus 4.6 ในงานเขียนโค้ดสไตล์ SWE-Bench หากตัวเลขเหล่านั้นถูกต้อง Anthropic อาจมีโมเดลที่สามารถเปลี่ยนแปลงสมดุลระหว่างความสามารถทางไซเบอร์เชิงรุกและเชิงรับได้อย่างมาก

💡 หากคุณสร้างเครื่องมือที่เกี่ยวข้องกับการเปิดตัวโมเดล AI นี่คือสถานการณ์ที่การทดสอบ API-first มีความสำคัญอย่างยิ่ง ห้องปฏิบัติการอาจเปิดเผยโมเดลให้กับพันธมิตรกลุ่มเล็กๆ นานก่อนที่จะมีการเปิดตัวสู่สาธารณะ Apidog ช่วยให้ทีมสามารถจำลองการไหลของ API ในอนาคตเหล่านี้ จำลองปลายทางที่ถูกจำกัดการเข้าถึง และทดสอบตรรกะการรวมระบบก่อนที่จะมีการเข้าถึงในวงกว้างขึ้น ดาวน์โหลด Apidog ฟรี หากคุณต้องการสร้างต้นแบบการรวมโมเดล AI โดยไม่ต้องรอการเปิดตัวสู่สาธารณะเต็มรูปแบบ

Claude Mythos Preview คืออะไร?

จากการรายงานข่าวในปัจจุบัน Claude Mythos Preview เป็นโมเดลของ Anthropic ที่ยังไม่เผยแพร่สู่สาธารณะ โดยมีให้เฉพาะพันธมิตรและนักวิจัยด้านความปลอดภัยทางไซเบอร์เชิงป้องกันที่ได้รับเลือกเท่านั้น

นี่ไม่เหมือนกับการเปิดตัวตระกูล Claude ปกติ เช่น Sonnet หรือ Opus มันดูเหมือนจะเป็นโมเดลตัวอย่างที่ถูกควบคุม โดยมีการจำกัดการเข้าถึงที่เชื่อมโยงกับกรณีการใช้งานที่เฉพาะเจาะจง สำนักข่าว Reuters รายงานว่า Anthropic กำลังทำงานร่วมกับพันธมิตรหลักหลายราย ซึ่งรวมถึง Amazon, Microsoft, Apple, Google, Nvidia, CrowdStrike และ Palo Alto Networks ภายใต้ Project Glasswing โดยมีวัตถุประสงค์เพื่อการวิจัยความปลอดภัยทางไซเบอร์เชิงป้องกัน ไม่ใช่การเข้าถึงของผู้บริโภคจำนวนมาก

ดังนั้น คำอธิบายที่ชัดเจนที่สุดในตอนนี้คือ: Claude Mythos Preview ดูเหมือนจะเป็นโมเดลของ Anthropic ที่จำกัดการเข้าถึงสำหรับการทำงานด้านความปลอดภัยเชิงป้องกัน ไม่ใช่ระดับ Claude สาธารณะ

เหตุใดโมเดลนี้จึงได้รับความสนใจมากขนาดนี้

คำตอบง่ายๆ คือ: ตัวเลขผลการทดสอบที่รายงานมานั้นสูงผิดปกติ

ตามรายงานข่าวที่ปรากฏขึ้นในวงจรข่าว AI วันนี้ Claude Mythos Preview มีรายงานว่าทำได้:

เกณฑ์มาตรฐาน	Claude Mythos Preview	Claude Opus 4.6
SWE-Bench Verified	93.9%	80.8%
SWE-Bench Pro	77.8%	53.4%

หากตัวเลขเหล่านั้นถูกต้อง นี่ไม่ใช่การอัปเกรดเล็กน้อย แต่มันคือการก้าวกระโดดครั้งใหญ่

เกณฑ์มาตรฐาน SWE-Bench มีความสำคัญเนื่องจากเป็นหนึ่งในตัวชี้วัดสาธารณะที่ชัดเจนที่สุดที่เรามีสำหรับความสามารถด้านวิศวกรรมซอฟต์แวร์ที่แท้จริง มันทดสอบว่าโมเดลสามารถอ่าน repository, เข้าใจข้อผิดพลาดหรือปัญหา, ทำการเปลี่ยนแปลงโค้ดที่ถูกต้อง และแก้ปัญหาภายใต้ข้อจำกัดที่สมจริงได้หรือไม่ การก้าวกระโดดขนาดนี้บ่งชี้ว่า Anthropic ได้ก้าวข้ามขีดจำกัดเดิมของตนในงานที่ต้องใช้การเขียนโค้ดจำนวนมากและงานเชิงตัวแทนอย่างมาก

นั่นคือเหตุผลที่ผู้คนตอบสนองอย่างรุนแรง เรื่องราวไม่ได้มีแค่ว่า Anthropic อาจมีโมเดลที่แข็งแกร่งกว่าเท่านั้น เรื่องราวคือ Anthropic อาจมีโมเดลนั้นอยู่แล้ว และยังคงเลือกที่จะไม่เผยแพร่สู่สาธารณะ

เหตุผลที่ Anthropic อาจเก็บ Claude Mythos ไว้เป็นส่วนตัว

คำอธิบายที่เป็นไปได้มากที่สุดคือความเสี่ยงในการใช้งานสองทาง (dual-use risk)

โมเดลที่แข็งแกร่งพอที่จะช่วยผู้ป้องกันค้นหาช่องโหว่ วิเคราะห์เส้นทางการโจมตี ตรวจสอบโค้ดที่ไม่ปลอดภัย และแก้ไขปัญหาโดยอัตโนมัติ ก็สามารถทำให้เวิร์กโฟลว์เชิงรุกง่ายขึ้นได้เช่นกัน ความสามารถเดียวกันที่ช่วยให้ทีม Blue Team แก้ไขระบบได้เร็วขึ้น ก็สามารถช่วยทีม Red Team หรือผู้ไม่ประสงค์ดีเคลื่อนไหวได้เร็วขึ้นเช่นกัน

การแลกเปลี่ยนนี้จะชัดเจนขึ้นเมื่อโมเดลเก่งขึ้นในด้าน:

การทำความเข้าใจโค้ดระดับ repository
การใช้เครื่องมืออย่างอิสระ
การจำลองช่องโหว่
การแก้ปัญหาระยะยาว
การเชื่อมโยงการกระทำหลายอย่างเข้าด้วยกันโดยไม่สูญเสียบริบท

สิ่งเหล่านี้คือความสามารถที่ห้องปฏิบัติการ AI สมัยใหม่ต้องการสำหรับ Coding Agents และเป็นความสามารถที่ทำให้เกิดความกังวลในด้านความปลอดภัยทางไซเบอร์เช่นกัน

Anthropic ได้ส่งสัญญาณมาระยะหนึ่งแล้วว่าการเปิดตัวโมเดลที่เป็นสุดยอดอาจต้องใช้กลยุทธ์การเปิดตัวที่ตรงเป้าหมายมากขึ้น Claude Mythos Preview ดูเหมือนจะเป็นตัวอย่างที่ชัดเจนที่สุดของกลยุทธ์นั้นจนถึงตอนนี้ แทนที่จะเป็น "เผยแพร่ในวงกว้างแล้วค่อยแก้ไขในภายหลัง" การเคลื่อนไหวในครั้งนี้ดูเหมือนจะเป็น "จำกัดการเข้าถึงก่อน เรียนรู้จากผู้ใช้ที่ผ่านการตรวจสอบ แล้วจึงตัดสินใจว่าจะเกิดอะไรขึ้นต่อไป"

Project Glasswing ดูเหมือนจะหมายความว่าอย่างไร

Project Glasswing คือกรอบงานที่ทำให้เรื่องราวของ Mythos มีความหมาย

แนวคิดที่รายงานไม่ได้เป็นเพียง "นี่คือโมเดลที่ดีกว่า" แต่เป็น "นี่คือโมเดลที่ดีกว่า แต่ตอนนี้มีเพียงพันธมิตรด้านการป้องกันที่เชื่อถือได้เท่านั้นที่สามารถใช้งานได้" นั่นเปลี่ยนเรื่องราวของผลิตภัณฑ์ไปอย่างสิ้นเชิง

แทนที่จะเป็นการเปิดตัวสำหรับผู้บริโภค นี่ใกล้เคียงกับโปรแกรมตัวอย่างด้านความปลอดภัยมากกว่า แทนที่จะให้การเติบโตเป็นตัวชี้วัดหลัก ตัวชี้วัดหลักอาจเป็นการประเมินที่ถูกควบคุม: การทำความเข้าใจว่าโมเดลสามารถทำอะไรได้บ้างสำหรับผู้ป้องกัน ความเสี่ยงในการใช้งานในทางที่ผิดที่ปรากฏในทางปฏิบัติ และมาตรการป้องกันการเผยแพร่นั้นเพียงพอหรือไม่

ห้องปฏิบัติการต่างๆ ได้ใช้เวลาสองปีที่ผ่านมาพยายามเพิ่มการเข้าถึงของสาธารณะสูงสุดในขณะที่พูดถึงความปลอดภัย Project Glasswing ชี้ให้เห็นถึงโมเดลที่แตกต่างกัน: ระบบที่มีความสามารถสูงสุดอาจปรากฏขึ้นครั้งแรกในการใช้งานที่จำกัดเฉพาะภาคส่วน ซึ่งนักวิจัยด้านความปลอดภัยและพันธมิตรองค์กรทดสอบภายใต้ข้อจำกัดที่แท้จริง

Claude Mythos แข็งแกร่งกว่า Opus 4.6 หรือไม่?

ตามตัวเลขผลการทดสอบที่รายงาน อาจเป็นเช่นนั้น

สิ่งที่เราสามารถพูดได้:

ตัวเลขที่รายงานบ่งชี้ว่า Claude Mythos Preview มีประสิทธิภาพเหนือกว่า Opus 4.6 อย่างมีนัยสำคัญในงานวิศวกรรมซอฟต์แวร์สไตล์ SWE-Bench
มีรายงานว่า Anthropic ถือว่ามันเป็นโมเดลที่มีความเสี่ยงสูง
โมเดลนี้ไม่ได้ถูกเปิดตัวเหมือนกับการเปิดตัว Claude สาธารณะทั่วไป

สิ่งที่เรายังไม่สามารถพูดได้อย่างแน่นอน:

ว่ามันแข็งแกร่งกว่า Opus 4.6 ในทุกหมวดหมู่
ว่าเงื่อนไขการเปรียบเทียบที่เผยแพร่นั้นเหมือนกันทุกประการในทุกรายละเอียด
ว่าผู้ใช้สาธารณะจะเห็นผลลัพธ์ที่เพิ่มขึ้นแบบเดียวกันในทุกเวิร์กโฟลว์

ดังนั้น เวอร์ชันที่ระมัดระวังคือ: Claude Mythos Preview ดูเหมือนจะแข็งแกร่งกว่า Claude Opus 4.6 อย่างมากในเกณฑ์มาตรฐานการเขียนโค้ดที่สำคัญบางอย่าง และแข็งแกร่งพอที่ Anthropic อาจจำกัดการเข้าถึงเนื่องจากความเสี่ยง

สิ่งนี้อาจมีความหมายอย่างไรต่อผู้พัฒนา

สำหรับผู้พัฒนาส่วนใหญ่ Claude Mythos ไม่ใช่สิ่งที่คุณสามารถใช้ได้ในวันนี้ แต่มันยังคงมีความสำคัญเพราะมันบ่งบอกถึงทิศทางของโมเดลการเขียนโค้ดคลื่นลูกถัดไป

มีนัยสำคัญสามประการที่โดดเด่น:

1. โมเดล Claude สาธารณะอาจไม่สะท้อนถึงขีดจำกัดสูงสุดของ Anthropic

หลายคนสันนิษฐานว่าโมเดล Claude สาธารณะที่ดีที่สุดนั้นใกล้เคียงกับความสามารถภายในที่ดีที่สุดของห้องปฏิบัติการ Claude Mythos Preview ชี้ให้เห็นว่าช่องว่างนั้นอาจกว้างกว่าที่หลายคนคาดการณ์ไว้

2. ความสามารถด้านไซเบอร์อาจกลายเป็นคอขวดหลักในการเผยแพร่

ข้อจำกัดที่ใหญ่ที่สุดในการเผยแพร่อาจไม่ใช่คุณภาพของโมเดลอีกต่อไป มันอาจเป็นว่าโมเดลนั้นข้ามเกณฑ์ที่ความเสี่ยงจากการใช้งานในทางที่ผิดเชิงรุกสูงเกินไปหรือไม่

3. โมเดลที่ดีที่สุดอาจมาถึงผ่านโปรแกรมองค์กรที่จำกัดการเข้าถึงก่อน

แทนที่จะเห็นระบบที่แข็งแกร่งที่สุดในแอปแชทสาธารณะก่อน เราอาจเห็นมันภายในเครือข่ายพันธมิตรที่จำกัด โครงการนำร่องในอุตสาหกรรม และการแสดงตัวอย่างสำหรับองค์กรที่ถูกควบคุม

สิ่งนี้จะส่งผลกระทบต่อวิธีที่ผู้พัฒนาวางแผน Roadmaps ประเมินผู้ให้บริการ และคิดถึงความเสี่ยงในการเข้าถึง

สิ่งนี้อาจมีความหมายอย่างไรต่ออุตสาหกรรม AI

Claude Mythos Preview อาจมีความสำคัญน้อยกว่าในฐานะผลิตภัณฑ์ และมีความสำคัญมากกว่าในฐานะสัญญาณ

หาก Anthropic เต็มใจที่จะยับยั้งโมเดลเนื่องจากความเสี่ยงด้านไซเบอร์ ห้องปฏิบัติการอื่นๆ ก็อาจทำเช่นเดียวกัน นั่นจะสร้างตลาด AI แบบสองทาง:

โมเดลสาธารณะที่มีการเข้าถึงในวงกว้างและข้อจำกัดที่เข้มงวดขึ้น
โมเดลที่ถูกจำกัดด้วยความสามารถที่แข็งแกร่งขึ้นและการควบคุมการเข้าถึงที่เข้มงวดขึ้น

การแบ่งแยกนี้จะส่งผลกระทบต่อการวัดประสิทธิภาพด้วย ห้องปฏิบัติการอาจมีระบบที่แข็งแกร่งกว่าที่สาธารณะเคยเห็น ในขณะที่ยังคงแข่งขันกับระบบที่ปลอดภัยกว่าและอ่อนแอกว่าในที่สาธารณะ นอกจากนี้ยังทำให้คนนอกตัดสินขีดจำกัดที่แท้จริงจาก API สาธารณะเพียงอย่างเดียวได้ยากขึ้น

จากมุมมองด้านนโยบาย นี่คือกรณีที่นักกฎหมายและนักวิจัยด้านความปลอดภัยคาดการณ์ไว้ คำถามที่น่าสนใจไม่ใช่ว่าโมเดลที่ทรงพลังจะมีอยู่หรือไม่ แต่เป็นว่าห้องปฏิบัติการสามารถสร้างกลไกการเผยแพร่ที่รักษาคุณค่าในการป้องกัน โดยไม่ทำให้การใช้งานในทางที่ผิดเชิงรุกง่ายขึ้นอย่างมากได้หรือไม่

Claude Mythos Preview อาจเป็นตัวอย่างแรกที่มีชื่อเสียงของห้องปฏิบัติการที่พยายามแก้ไขปัญหานั้นแบบเรียลไทม์

ผู้พัฒนาควรกังวลในตอนนี้หรือไม่?

ใช่ แต่ไม่ใช่เพราะคุณต้องเปลี่ยนเครื่องมือในวันพรุ่งนี้

คุณควรกังวลเพราะสิ่งนี้เปลี่ยนวิธีที่คุณอ่านประกาศเกี่ยวกับโมเดล

เมื่อห้องปฏิบัติการกล่าวว่าโมเดลสาธารณะเป็นโมเดล "ที่ดีที่สุดที่มีอยู่" นั่นอาจไม่ได้หมายความว่าเป็นโมเดลที่แข็งแกร่งที่สุดที่ห้องปฏิบัติการมีอีกต่อไป มันอาจหมายถึงว่าเป็นโมเดลที่แข็งแกร่งที่สุดที่ห้องปฏิบัติการยินดีที่จะเผยแพร่ในวงกว้างเท่านั้น นั่นคือคำกล่าวที่แตกต่างกัน

คุณควรกังวลด้วยเพราะสิ่งนี้ส่งผลกระทบต่อตำแหน่งทางการแข่งขันในหมู่ผู้ให้บริการ หาก Anthropic กำลังยับยั้งโมเดลการเขียนโค้ดที่แข็งแกร่งกว่า การเปรียบเทียบระหว่าง Claude, GPT, Gemini, GLM และโมเดลการเขียนโค้ดแบบ Open-weight ที่เผยแพร่สู่สาธารณะ อาจประเมินความสามารถที่ระบบสุดยอดส่วนตัวมีอยู่แล้วต่ำเกินไป

บทสรุป

Claude Mythos Preview ไม่ใช่การเปิดตัวผลิตภัณฑ์ปกติ มันดูเหมือนจะเป็นโมเดลของ Anthropic ที่ถูกจำกัดการเข้าถึง ซึ่งอาจแข็งแกร่งกว่า Claude Opus 4.6 อย่างมีนัยสำคัญในงานวิศวกรรมซอฟต์แวร์ และถูกจำกัดมากพอที่ Anthropic ดูเหมือนจะไม่เต็มใจที่จะเผยแพร่ในวงกว้าง

แค่นั้นก็ทำให้มันเป็นหนึ่งในเรื่องราว AI ที่สำคัญที่สุดในปัจจุบันแล้ว

หากเกณฑ์มาตรฐานที่รายงานมาถูกต้อง พาดหัวข่าวไม่ได้เป็นเพียงแค่ว่า Anthropic สร้างโมเดลที่ดีกว่าเท่านั้น พาดหัวข่าวที่แท้จริงคือ Anthropic อาจกำลังดำเนินการอยู่ในโลกที่โมเดลสุดยอดบางรุ่นมีความสามารถสูงเกินไป หรืออย่างน้อยก็มีความเสี่ยงเกินไปสำหรับการเผยแพร่สู่สาธารณะทันที

สิ่งนั้นจะเป็นการเปลี่ยนแปลงครั้งใหญ่ในวิธีที่ระบบ AI ขั้นสูงเข้าสู่ตลาด

คำถามที่พบบ่อย (FAQ)

Claude Mythos Preview คืออะไร?

จากการรายงานข่าวในปัจจุบัน มันคือโมเดลตัวอย่างของ Anthropic ที่ถูกจำกัดการเข้าถึง ซึ่งกำลังถูกทดสอบกับพันธมิตรด้านความปลอดภัยทางไซเบอร์เชิงป้องกันที่ได้รับเลือก แทนที่จะเผยแพร่สู่สาธารณะ

Claude Mythos มีให้สาธารณะชนใช้หรือไม่?

ไม่มีการประกาศการเปิดตัวสู่สาธารณะในวงกว้าง รายงานข่าวปัจจุบันบ่งชี้ว่าการเข้าถึงถูกจำกัดผ่าน Project Glasswing

Claude Mythos แข็งแกร่งกว่า Claude Opus 4.6 หรือไม่?

ตัวเลขผลการทดสอบที่รายงานระบุว่ามันอาจแข็งแกร่งกว่าอย่างมีนัยสำคัญในงานเขียนโค้ดสไตล์ SWE-Bench แต่ไม่ได้พิสูจน์ว่ามันแข็งแกร่งกว่าในทุกหมวดหมู่

Project Glasswing คืออะไร?

Project Glasswing ดูเหมือนจะเป็นโครงการที่จำกัดการเข้าถึงของ Anthropic สำหรับการประเมิน Claude Mythos Preview ในสถานการณ์ความปลอดภัยทางไซเบอร์เชิงป้องกัน

เหตุใด Anthropic จึงปฏิเสธที่จะเผยแพร่โมเดลที่แข็งแกร่งกว่า?

เหตุผลที่เป็นไปได้คือความเสี่ยงในการใช้งานสองทาง โมเดลที่ช่วยผู้ป้องกันในการเขียนโค้ดและงานด้านความปลอดภัยโดยอัตโนมัติก็สามารถทำให้การใช้งานในทางที่ผิดเชิงรุกง่ายขึ้นเช่นกัน

ผู้พัฒนาสามารถใช้ Claude Mythos ได้ในวันนี้หรือไม่?

ไม่สามารถใช้ได้อย่างกว้างขวาง ในขณะนี้ดูเหมือนว่าจะจำกัดอยู่เฉพาะพันธมิตรและนักวิจัยที่ได้รับเลือกเท่านั้น ไม่ใช่ผู้ใช้ API ทั่วไป

DEV Community