DEV Community

Kittipat.po
Kittipat.po

Posted on

1

Geometric Distribution คือ?

⭐️ ก่อนที่เราจะมาทำความรู้จักกับการแจกแจงแบบ Geometric ก่อนอื่นเรามาเริ่มรู้จักกับการแจกแจงแบบ Binomial ก่อนดีกว่า 👇

การแจกแจงแบบ Geometric เป็นยังไง ?

ถ้าเราจำ Binomial Distribution ได้มันคือการทำการทดลอง n ครั้งแล้วหาความน่าจะเป็นที่จะสำเร็จ x ครั้ง เช่น ทำข้อสอบ 10 ข้อหาความน่าจะเป็นที่จะทำถูก 5 ข้อ แต่ Geometric Distribution คือความน่าจะเป็นที่เราทำการทดลองสำเร็จครั้งแรกเป็นครั้งที่ x ฟังดูงงๆ ถ้ายกตัวอย่างเป็นการเดาข้อสอบ ก็คือความน่าจะเป็นที่เราจะเดาข้อสอบ 5 ข้อแล้วถูกเป็นข้อแรก(ข้อ 1-4 เดาผิด ข้อ 5 เดาถูก)

ฟังก์ชันความน่าจะเป็น

p = ความน่าจะเป็นที่จะสำเร็จ ( เดาข้อสอบ 4 ตัวเลือกถูก p = 1/4 )
k = จำนวนครั้งที่ทำการทดลองจนสำเร็จเป็นครั้งแรก ( เช่น k=3 หมายถึง 2 ข้อแรกเดาผิด ข้อ 3 เดาถูก)

เพื่อความเข้าใจเรามาดูตัวอย่างกัน

Example 1

กล่องใบหนึ่งมีลูกบอลสีขาว 4 ลูกสีดำ 6 ลูกถ้าสุ่มหยิบลูกบอลออกจากกล่องครั้งละลูกโดยหยิบแล้วใส่คืน ความน่าจะเป็นที่หยิบได้ลูกบอลสีขาวเป็นครั้งแรกของการสุ่มหยิบเป็นครั้งที่ 3 เป็นเท่าใด
p = ความน่าจะเป็นที่จะได้สีขาว = 0.4 (4/10)
k = จำนวนครั้งที่หยิบจนได้สีขาวเป็นครั้งแรก = 3

จากสูตรจริงๆก็ตรงไปตรงมาโอกาสที่ได้ลูกบอลสีขาวเป็นครั้งแรกของการสุ่มหยิบเป็นครั้งที่ 3 (ดำ ดำ ขาว) = โอกาสที่ได้สีดำ (6/10) ยกกำลัง 2 เพราะได้ 2 ลูก คูณกับ โอกาสที่ได้สีขาว 4/10

Example 2

เคยมั้ยครับตอนเด็กๆ เรากินขนมแล้วในห่อขนมมันชอบแถมของเล่นมาให้สะสมเราลองมาคิดดูดีกว่าว่าเราต้องกินกี่ห่อถึงจะได้ครบทุกแบบ (เราต้องใช้ ค่าคาดหวัง มาช่วยคิดซะแล้ว 🤔 )

📊 ค่าคาดหวัง (Expected Value) คือเฉลี่ยทางสถิติ ซึ่งอ่านความหมายแบบนี้แล้วก็อาจจะยังงง ๆ กันอยู่ ค่าเฉลี่ยทางสถิติในที่นี้คือ ค่าเฉลี่ยของผลลัพธ์ที่เกิดขึ้นจากการทดลองซ้ำ ๆ เช่นการทอยลูกเต๋า 1 ลูก ซ้ำ ๆ เป็นหมื่น เป็นแสน ครั้งแล้วเอาแต้มที่ได้มาเฉลี่ยกัน ค่าเฉลี่ยอันนี้เรียกว่า ค่าคาดหวังนั่นเอง (จะสลับกันเป็นทอยลูกเต๋า แสนลูก 1 ครั้ง ก็ได้เหมือนกัน)

กลับมาที่คำถามที่ว่าต้องกินขนมกี่ห่อถึงจะได้ของสะสมครบทุกแบบ ถ้าของสะสมมีแค่ 1 แบบเราก็ตอบได้เลยถูกมั้ยครับว่า 1 ห่อ ถ้าของสะสมมี 2 แบบหละ เราก็จะคิดว่าห่อแรกได้ของสะสมมา 1 แบบ ส่วนห่อที่ 2 ก็มีโอกาสได้แบบใหม่ 50% ได้ซำ้ 50% ดังนั้นโดยเฉลี่ยเราต้องกิน 3 ห่อถึงจะได้ครบทุกแบบ

ค่าคาดหวัง (Expected Value) ของ Geometric Distribution เราสามารถจำได้เลยครับว่ามีค่าเท่ากับ 1/p (p = ความน่าจะเป็นที่จะสำเร็จ) จากที่ยกตัวอย่างเมื่อกี้เอาแค่ห่อที่ 2 เราจะเห็นใช่มั้ยครับว่า p = ความน่าจะเป็นที่จะสำเร็จ = ความน่าจะเป็นที่จะได้ของสะสมไม่ซ้ำ = 0.5 (50%) แทนค่า 1/0.5 = 2 ห่อนั่นเอง

📝 งั้นลองมาคิดกับคำถามเดิมแต่เปลี่ยนเป็น มีของสะสม 5 แบบ ต้องกินขนมกี่ห่อถึงจะได้ของสะสมครบทุกแบบ (ผมคิดในสมมติฐานที่ว่าของสะสมทุกแบบมีโอกาสออกเท่าๆกันนะครับไม่มีของ rare)
ลองคิดแบบนี้ดูครับ

X1 = จำนวนห่อขนมที่ต้องซื้อจนกว่าจะได้ของสะสมที่ไม่ซ้ำกับที่มีอันแรก (เรายังไม่มีของสะสมสักแบบ) P(X=k) ~ Geo(p=1) ได้ว่า X1 เป็น Geometric Distribution ค่าคาดหวัง = 1/p = 1/1 = 1 ห่อ (ความหมายคือถ้าเรายังไม่มีของสะสมเลยสักแบบเราซื้อขนมแค่ 1 ห่อก็จะได้ของสะสมใหม่ที่ไม่ซ้ำกับที่มีแล้ว)

X2 = จำนวนห่อขนมที่ต้องซื้อจนกว่าจะได้ของสะสมที่ไม่ซ้ำกับที่มีอันที่ 2 (เรามีของสะสมแล้ว 1 แบบ) P(X=k) ~ Geo(p=4/5) ได้ว่า X2 เป็น Geometric Distribution ค่าคาดหวัง = 1/p = 1/(4/5) = 5/4 ห่อ (ความหมายคือถ้าเรามีของสะสมแล้ว 1 แบบ เราต้องซื้อขนม 5/4 ห่อโดยเฉลี่ยถึงจะได้ของสะสมใหม่ที่ไม่ซ้ำกับที่มีอยู่แล้ว)

X3 = จำนวนห่อขนมที่ต้องซื้อจนกว่าจะได้ของสะสมที่ไม่ซ้ำกับที่มีอันที่ 3 (เรามีของสะสมแล้ว 2 แบบ) P(X=k) ~ Geo(p=3/5) ได้ว่า X3 เป็น Geometric Distribution ค่าคาดหวัง = 1/p = 1/(3/5) = 5/3 ห่อ (ความหมายคือถ้าเรามีของสะสมแล้ว 2 แบบ เราต้องซื้อขนม 5/3 ห่อโดยเฉลี่ยถึงจะได้ของสะสมใหม่ที่ไม่ซ้ำกับที่มีอยู่แล้ว)

X4 = จำนวนห่อขนมที่ต้องซื้อจนกว่าจะได้ของสะสมที่ไม่ซ้ำกับที่มีอันที่ 4 (เรามีของสะสมแล้ว 3 แบบ) P(X=k) ~ Geo(p=2/5) ได้ว่า X4 เป็น Geometric Distribution ค่าคาดหวัง = 1/p = 1/(2/5) = 5/2 ห่อ (ความหมายคือถ้าเรามีของสะสมแล้ว 3 แบบ เราต้องซื้อขนม 5/2 ห่อโดยเฉลี่ยถึงจะได้ของสะสมใหม่ที่ไม่ซ้ำกับที่มีอยู่แล้ว)

X5 = จำนวนห่อขนมที่ต้องซื้อจนกว่าจะได้ของสะสมที่ไม่ซ้ำกับที่มีอันที่ 5 (เรามีของสะสมแล้ว 4 แบบ) P(X=k) ~ Geo(p=1/5) ได้ว่า X5 เป็น Geometric Distribution ค่าคาดหวัง = 1/p = 1/(1/5) = 5/1 ห่อ (ความหมายคือถ้าเรามีของสะสมแล้ว 4 แบบ เราต้องซื้อขนม 5 ห่อโดยเฉลี่ยถึงจะได้ของสะสมใหม่ที่ไม่ซ้ำกับที่มีอยู่แล้ว)

เราก็ตอบคำถามที่ว่า ต้องกินขนมกี่ห่อถึงจะได้ของสะสมครบทุกแบบ ได้แล้วนะครับ
ก็เอา ค่าคาดหวัง ของ X1+X2+X3+X4+X5 = 1+5/4+5/3+5/2+5/1 = 11.416 ซื้อ 11-12 ห่อโดยเฉลี่ยก็จะได้ครบ (คิดในสมมติฐานที่ของสะสมทุกแบบมีโอกาสออกเท่าๆกันนะครับไม่มีของ rare)

Image of Timescale

🚀 pgai Vectorizer: SQLAlchemy and LiteLLM Make Vector Search Simple

We built pgai Vectorizer to simplify embedding management for AI applications—without needing a separate database or complex infrastructure. Since launch, developers have created over 3,000 vectorizers on Timescale Cloud, with many more self-hosted.

Read more →

Top comments (0)

Postmark Image

Speedy emails, satisfied customers

Are delayed transactional emails costing you user satisfaction? Postmark delivers your emails almost instantly, keeping your customers happy and connected.

Sign up