DEV Community

Cover image for MCP The Series: ตอนที่ 1. MCP คืออะไร? มาตรฐานกลางเชื่อมโลก AI
Watchara Sukka for silicon brain

Posted on

MCP The Series: ตอนที่ 1. MCP คืออะไร? มาตรฐานกลางเชื่อมโลก AI

สวัสดีครับสำหรับบทความนี้จะเป็นซีรีย์แรกของ silicon brain โดยนำเสนอเกี่ยวกับ Model Context Protocal หรือ MCP ซึ่งเป็นมาตรฐานสำหรับการสื่อสารของเอเจนต์ AI กับโลกภายนอกโดยซีรีย์นี้จะแบ่งเป็น 5 ตอน

  • ตอนที่ 1: MCP คืออะไร? มาตรฐานกลางเชื่อมโลก AI(บทความนี้)
  • ตอนที่ 2: เริ่มต้นพัฒนา MCP Server ด้วย .NET (C#) ในเครื่อง
  • ตอนที่ 3: ส่งข้อมูลประกอบ (Context) ให้เอเจนต์ทำงานได้ดีขึ้น
  • ตอนที่ 4: สร้างเครื่องมือโต้ตอบอัจฉริยะ (Elicitations และ Structured Output)
  • ตอนที่ 5: ความปลอดภัยระดับมืออาชีพ: OAUTH 2.1 และการจัดการ Token

ความท้าทายในการพัฒนา AI ยุคใหม่

โมเดลภาษาขนาดใหญ่ (Large Language Model,LLMs) เช่น Claude หรือ ChatGPT จะมีความสามารถในการให้เหตุผลและการทำงานที่มีคุณภาพสูง แต่พวกมันมักประสบปัญหาสำคัญประการหนึ่งคือการถูก แยกออกจากข้อมูล, เครื่องมือ, และระบบภายนอก ที่มีอยู่จริง
LLMs เหล่านี้ถูกจำกัดอยู่เบื้องหลังสิ่งที่เรียกว่า "information silos" (ไซโลข้อมูล) ทำให้การเข้าถึงข้อมูลที่สำคัญหรือการดำเนินการในโลกแห่งความเป็นจริงเป็นไปได้ยาก ในอดีต เมื่อนักพัฒนาต้องการเชื่อมต่อ LLM เข้ากับแหล่งข้อมูลใหม่แต่ละแหล่ง การเชื่อมต่อเหล่านั้นต้องอาศัยการติดตั้งที่กำหนดเอง (custom implementation) ทำให้การสร้างระบบ AI ที่เชื่อมต่อถึงกันและสามารถปรับขนาด (scale) ได้อย่างแท้จริงเป็นเรื่องที่ยากมาก

แนะนำ Model Context Protocol (MCP)

Model Context Protocol (MCP) คือ มาตรฐานแบบเปิด (open-source standard) ที่ถูกพัฒนาโดย Anthropic(ผู้สรา้ง Claude)เพื่อเชื่อมต่อแอปพลิเคชัน AI เข้ากับระบบภายนอก MCP ถูกออกแบบมาเพื่อแก้ไขความท้าทายที่ LLMs ถูกแยกออกจากข้อมูลและระบบภายนอก ซึ่งความท้าทายนี้ในอดีตมักจะต้องอาศัยการติดตั้งที่กำหนดเอง (custom implementation) สำหรับแหล่งข้อมูลใหม่แต่ละแหล่ง
เราอาจมอง MCP ในฐานะที่เป็น:
• "อะแดปเตอร์สากล" (Universal Adapter) สำหรับแอปพลิเคชัน AI MCP จัดเตรียมวิธีการที่เป็นมาตรฐานในการเชื่อมต่อ Large Language Models (LLMs) เข้ากับข้อมูล, เครื่องมือ, และทรัพยากรต่าง ๆ
• "ภาษาสากลสำหรับการสื่อสารของเอเจนต์ AI" (Universal Language for AI Agent Communication) ซึ่งเข้ามาแทนที่การรวมระบบที่กระจัดกระจาย (fragmented integrations) ด้วยโปรโตคอลเดียวที่ง่ายกว่าและน่าเชื่อถือยิ่งขึ้น
MCP Description

วัตถุประสงค์หลักของ MCP:

• การเข้าถึงข้อมูลและเครื่องมือ: MCP ช่วยให้เอเจนต์ AI สามารถ เข้าถึงข้อมูลหลัก, เครื่องมือ, และขั้นตอนการทำงาน ได้อย่างปลอดภัยและเป็นมาตรฐาน
• ยกระดับคุณภาพของผลลัพธ์: วัตถุประสงค์คือการช่วยให้โมเดลสามารถสร้าง การตอบสนองที่ดีขึ้นและเกี่ยวข้องกับบริบทมากขึ้น
• ลดภาระการพัฒนา: สำหรับนักพัฒนา, MCP ช่วย ลดความซับซ้อนและเวลาในการพัฒนา เมื่อต้องสร้างหรือรวมเข้ากับแอปพลิเคชัน AI หรือเอเจนต์

องค์ประกอบหลักของสถาปัตยกรรม MCP

สถาปัตยกรรม Model Context Protocol ประกอบด้วยส่วนประกอบหลักสามส่วนที่ทำงานร่วมกันเพื่อให้เอเจนต์สามารถปฏิบัติงานได้อย่างราบรื่น:
MCP Component
1. Host (โฮสต์):
◦ คือแอปพลิเคชัน AI หลักที่ทำหน้าที่จัดการและประสานงานส่วนประกอบอื่น ๆ ทั้งหมด
◦ ตัวอย่าง Host ที่สำคัญในสภาพแวดล้อมการพัฒนาซอฟต์แวร์ ได้แก่ Visual Studio (VS) และ Visual Studio Code (VS Code)

2. Client (ไคลเอนต์):
◦ คือส่วนประกอบที่อยู่ภายใน Host โดยเฉพาะ
◦ ทำหน้าที่สำคัญในการ รักษาการเชื่อมต่อ กับ Server และ ดึงข้อมูลบริบท จาก Server เหล่านั้น

3. Server (เซิร์ฟเวอร์):
◦ คือแอปพลิเคชันที่มีน้ำหนักเบา (light weight application) ที่มีหน้าที่หลักในการ จัดเตรียมบริบท (Context)
◦ MCP Server สามารถรันได้ทั้งในเครื่อง (locally) หรือจากระยะไกล (remotely) และทำหน้าที่เปิดเผย Tools หรือ Resources ที่เอเจนต์ต้องการ

ปลดล็อกศักยภาพ LLM ด้วย MPC จากตัวอย่างการใช้งานจริง

การนำ MCP มาใช้ทำให้เอเจนต์ AI ก้าวข้ามข้อจำกัดของ "ความรู้ที่ถูกบรรจุไว้ในตัวโมเดล" (pre-trained knowledge) และสามารถดำเนินการกับโลกภายนอกได้อย่างชาญฉลาด ทำให้เกิดการใช้งานใหม่ ๆ ที่น่าตื่นเต้นในหลายอุตสาหกรรม:
• ผู้ช่วย AI ส่วนบุคคลที่แท้จริง: เอเจนต์สามารถเข้าถึงระบบเฉพาะบุคคล เช่น Google Calendar และ Notion เพื่อทำหน้าที่เป็นผู้ช่วย AI ที่มีความเฉพาะเจาะจงมากขึ้น
• การสร้างสรรค์ซอฟต์แวร์แบบอัตโนมัติ: เอเจนต์เฉพาะทาง เช่น Claude Code สามารถทำงานอย่างซับซ้อน เช่น การสร้างแอปพลิเคชันเว็บที่สมบูรณ์ทั้งระบบ โดยเริ่มต้นจากเพียงแค่แบบร่างจาก Figma design
• การวิเคราะห์ข้อมูลองค์กร: แชทบอทระดับองค์กรสามารถเชื่อมต่อกับฐานข้อมูลหลายแห่งทั่วทั้งบริษัท ทำให้นักพัฒนาและผู้ใช้สามารถวิเคราะห์ข้อมูลที่ละเอียดอ่อนและเฉพาะทางของธุรกิจผ่านการสนทนา (chat) โดยไม่ต้องใช้คำสั่ง SQL หรือโค้ดที่ซับซ้อน
• การควบคุมอุปกรณ์กายภาพ: MCP สามารถปลดล็อกความสามารถให้ AI โมเดลสามารถสร้างสรรค์ 3D designs บน Blender และส่งแบบนั้นไปพิมพ์ผ่าน 3D printer ได้
• การทำ End-to-End Workflow: เอเจนต์สามารถดำเนินการแบบอัตโนมัติได้อย่างสมบูรณ์ เช่น การวิเคราะห์คำถามของลูกค้าสินเชื่อของธนาคาร แล้วดำเนินการ "เชื่อมต่อ" กับ Vector Database เพื่อค้นหากฎเกณฑ์ และ "เรียกใช้ฟังก์ชัน" เพื่อ Query ข้อมูลประวัติการชำระเงินจาก Relational Database ก่อนที่จะตอบคำถามได้อย่างถูกต้อง
MCP เปลี่ยนภาระของนักพัฒนาจากการสร้าง การเชื่อมต่อแบบกำหนดเอง (custom implementation) สำหรับแต่ละแหล่งข้อมูล ไปสู่การพัฒนาตามมาตรฐานโปรโตคอลเดียว ซึ่งเป็นการสร้างสถาปัตยกรรมที่ยั่งยืนกว่าเดิม

ตอนต่อไป เราจะาสรา้ง MCP Server ผ่าน C# SDK โดยใช้ Visual Studio Code (VS Code) เป็นเครื่องมือในการพัฒนา

Top comments (0)