PDA

View Full Version : มารู้จักการเบี่ยงเบนกันดีกว่า


Nay
11 พฤษภาคม 2005, 21:30
ในวิชาสถิติค่าที่เราต้องการหาจากข้อมูลชุดหนึ่ง นั้นมีหลายค่า เช่น

1. ค่าเฉลี่ย (ค่าเฉลี่ยเลขคณิต, มัธยฐาน และ ฐานนิยม)
2. ค่าเบี่ยงเบนมาตรฐาน ( Standard deviation )
3. ค่าความแปรปรวน ( Variance )

เป็นต้น

ในสมัยที่ผมเรียนสถิติสิ่งที่ทำให้เกิดปัญหาก็คือผมเรียนไม่รู้เรื่องเลย แต่นั่นคืออดีต ปัจจุบันเลยต้องมานั่งเรียนเองด้วยความจำเป็นที่จะต้องใช้ แล้วตอนนี้ ก็สุดยอด และเมื่อรู้แล้วก็อยากเล่าสู่กันฟัง เพื่อให้คนที่ไม่รู้เรื่องเลยพอจะมีพื้นฐานกันบ้าง เริ่มกันเลย เอาแต่ที่ใช้นะ

1. ค่าเฉลี่ยเลขคณิต ( Arithmetic Mean )
ค่าเฉลี่ยหมายถึงค่าที่อยู่ตรงกลางของชุดข้อมูล ดังนั้นค่าเฉลี่ยเลขคณิตก็คือการหาค่ากลางของข้อมูลโดยการคำนวณนั่นเอง โดยการนำข้อมูลทั้งหมดมารวมกันแล้วหารด้วยจำนวนทั้งหมดของข้อมูล

ตัวอย่างที่ 1 จงหาค่าเฉลี่ยเลขคณิตของข้อมูลต่อไปนี้
10 20 30 40 50
วิธีทำ
x ( ปกติต้องมีขีดอยู่ข้างบนและอ่านว่า x บาร์แต่หาวิธีพิมพ์ไม่ได้ ) = ค่าเฉลี่ยเลขคณิต

x = (10 + 20 + 30 +40 +50)/5 = 30

เมื่อ 5 คือจำนวนของข้อมูล

ในกรณีที่ข้อมูลมีการจัดกลุ่ม ( ภาษาอังกฤษใช้ "Grouped data" แต่บ้านเราใช้คำว่า"แจกแจง" นี่แหละที่ทำให้งงไม่รู้ใครเป็นคนแปล เอาเป็นว่าเขาใช้กันมานานแล้วผมก็จะทนใช้ด้วย )
ในกรณีที่มีการแจกแจง เช่น ข้อมูลชุดเดิม 10 20 30 40 50 ถ้าเราทำการแจกแจง (จัดกลุ่ม) จะได้ ค่าที่อยู่ระหว่าง 10 ถึง 30 มี 3 ค่า ( 10, 20, 30 ) และค่าที่อยู่ระหว่าง 31 ถึง 50 มี 2 ค่า (40, 50) กกรหาค่าเฉลี่ยเลขคณิตโดยวิธีนี้ จะใช้วิธีการที่ดัดแปลงนิดหน่อยคือค่าที่นำมารวมกันจะเป็นค่าที่เกิดจากค่ากลางของแต่ละกลุ่มคูณกับความถี่ของแต่ละกลุ่ม ในที่นี้จะได้ค่าเเฉลี่ยคือ

ค่ากลางของแต่ละชั้นคือ ( ค่ามากสุด + ค่าน้อยสุด ) / 2
ค่ากลางที่อยู่ระหว่าง 10 ถึง 30 คือ (30 + 10)/2 = 35
ค่ากลางที่อยู่ระหว่าง 31 ถึง 50 คือ (50 + 31)/2 = 40.5

นำไปคูณกับความถี่ ของแต่ละกลุ่มจะได้ 35*3 = 105 และ 40.5*2 = 81

ดังนั้นค่าเฉลี่ยคือ x บาร์ = ( 105 + 81 ) / 5 = 37.2

จะเห็นว่าค่าเฉลี่ยที่ได้จากการจัดกลุ่ม (แจกแจง) กับ ค่าที่ได้โดยไม่แจกแจงมีค่าไม่เท่ากัน เนื่องจกาการแจกแจงเราใช้ค่าเฉลี่ยของแต่ละกลุ่มมาทำการคำนวนหาค่าเฉลี่ยเลขคณิตนั่นเอง

2. การเบี่ยงเบน ( deviations )
2.1 การกระจายตัวของข้อมูล ลองดูตังอย่างต่อไปนี้

10 20 30 40 50
และ
28 29 30 31 32
ข้อมูลทั้ง 2 ชุดมีค่าเฉลี่ยคือ 30 เท่ากัน แต่จะเห็นว่าข้อมูลชุดแรกมีการกระจายของข้อมูลมากกว่า

2.2 ค่าเฉลี่ยของการเบี่ยงเบน
ถ้าเราพูดถึง ค่าเบี่ยงเบน ให้รู้ไว้เสมอว่ามันคือค่าที่ แตกต่างจากค่าเฉลี่ยนั่นเอง นั่นคือค่าของข้อมูลแต่ละตัวลบด้วยค่าเฉลี่ยเลขคณิต เช่น

การเบี่ยงเบนของ 10 20 30 40 50 คือ [10-30, 20-30, 30-30, 40-30 ,50-30]
จะได้ -20 -10 0 10 20 ซึ่งถ้าเราหาค่าเฉลี่ยจะได้ค่าเท่ากับ 0
และ การเบี่ยงเบนของ 28 29 30 31 32 คือ -1 -2 0 1 2 ซึ่งถ้าเราหาค่าเฉลี่ยจะได้ค่าเท่ากับ 0 เช่นกัน จะเห็นว่าค่าเฉลี่ยเลขคณิตที่ได้จากการหาจากการเบี่ยงของข้อมูลจากค่าเฉลี่ยเลขคณิตของข้อมูลนี้ไม่มีประโยชน์

แต่ถ้าเราลองนำเครื่องหมายลบออกหละ จะเกิดอะไรขึ้น จะได้ว่าค่าเฉลี่ยของการเบี่ยงเบนของข้อมูลชุดแรกคือ 60/5 = 12 และค่าเฉลี่ยของการเบี่ยงเบนของข้อมูลชุดที่ 2 คือ 6/5 = 1.2 จะเห็นว่ามีความสัมพันธ์กับการกระจายตัวของข้อมูล และวิธีที่เราจะนำเอาเครื่องหมายลบออกจากตัวเลขได้มี 2 วิธีคือ

2.2.1 การใส่ค่าสัมบูรณ์ของการเบี่ยงเบนแทน ( วิธีนี้ไม่ค่อยใช้จะไม่อธิบายนะครับ )
2.2.2 การยกกำลังสองให้กับการเบี่ยงเบน
เราจะเรียกค่าเฉลี่ยเลขคณิตแบบนี้ว่า Variance ( ค่าแปรปรวน ) ดูตัวอย่าง

2.3 ค่าความแปรปรวน
ค่าความแปรปรวนของ 10 20 30 40 50 ( ค่าเฉลี่ยเท่ากับ 30 )

คือ ((10-30)^2 + (20 - 30)^2 + (30 - 30)^2 +(40 -30)^2 + (50-30)^2)/5 = 1000/5 = 200

และ ค่าความแปรปรวนของ 28 29 30 31 32 ( ค่าเฉลี่ยเท่ากับ 30 )

คือ ((28-30)^2 + (29 - 30)^2 + (30 - 30)^2 +(31 -30)^2 + (32-30)^2)/5 = 10/5 = 2

หน่วยของ variance ก็คือหน่วยของข้อมูลยกกำลังสอง และ ถ้าเราหาค่ารากที่ 2 ของ ค่าความแปรปรวนค่าที่ได้เราจะเรียกว่า "ค่าเบี่ยงเบนมาตรฐาน" ในกรณีนี้ค่าเบี่ยงเบนมาตรฐานของทั้ง 2 ชุดข้อมูลคือ รากที่สองของ 200 และ 2 นั่นคือ 14.14 และ 1.41

-----------------------------------------------------------------------------------------------

เป็นอย่างไรบ้างครับพอจะเข้าใจความหมายของ ค่าต่างๆ ในทางสถิติขึ้นมาบ้างไหมครับ สำหรับสิ่งที่ผมอธิบายมาทั้งหมดจะใช้ในกรณีที่ข้อมูลเป็นข้อมูลประชากร แต่ถ้าเป็นข้อมูลที่ได้จากการสุ่มเราจะใช้ตัวหารของความแปรปรวนเป็น จำนวนวข้อมูล - 1 แทน เช่นถ้าเรามีข้อมูล 5 ตัวที่ได้จากการสุ่มเราจะใช้ 5-1 = 4 หารแทน ส่วนเหตุผลนั้นผมขี้เกียจพิมพ์แล้ว ไว้คราวหน้าถ้านึกขยันขึ้นมาแบบนี้อีกแล้วจะเล่าให้ฟัง

ปล. แล้วผมจะหาเรื่องสนุกๆ มาเล่าใฟงอีกนะครับ

gon
11 พฤษภาคม 2005, 22:29
ดีครับ. เป็นประโยชน์มากเลยครับ. :D

tana
12 พฤษภาคม 2005, 12:21
ผิดนิดนึงครับ

ค่ากลางที่อยู่ระหว่าง 10 ถึง 30 คือ (30 + 10)/2 = 35 ( อันนี้ต้องเป็น 20 ครับ รวมถึงการคำนวณบรรทัดต่อไปด้วยอ่ะนะครับ )

อีกอย่างนี่ ผมชอบประวัติที่คุณ Nay กรอกครับ ฮาดี ถ้ามีโอกาสจานำไปใช้บ้างนะครับ ;)

Nay
12 พฤษภาคม 2005, 16:04
ขอโทษทีครับ พอดีใช้เครื่องคอมหา คือผมใช้ 30+ 10/2 มันเลยเข้าใจว่า เป็น 30 + 5 ขอบคุณ คุณ tana มากครับ แล้วผมขอแก้ไขหน่อยครับ

ค่ากลางที่อยู่ระหว่าง 10 ถึง 30 คือ (30 + 10)/2 = 20
ค่ากลางที่อยู่ระหว่าง 31 ถึง 50 คือ (50 + 31)/2 = 40.5

นำไปคูณกับความถี่ ของแต่ละกลุ่มจะได้ 20*3 = 60 และ 40.5*2 = 81

ดังนั้นค่าเฉลี่ยคือ x บาร์ = ( 60 + 81 ) / 5 = 28.2

R-Tummykung de Lamar
13 พฤษภาคม 2005, 17:46
ข้อความเดิมของคุณ Nay:

x ( ปกติต้องมีขีดอยู่ข้างบนและอ่านว่า x บาร์แต่หาวิธีพิมพ์ไม่ได้ ) = ค่าเฉลี่ยเลขคณิต

ตรงส่วนนี่ บอร์ดของ Mathcenter สามารถพิมพ์ได้นะครับ ถ้าจะเป็น UBB Code ก็เป็นคำสั่ง [ o] [/o] (พิมพ์จริงไม่ต้องมีเว้นวรรคหน้าตัว o) ครับ เช่น x
ถ้าเป็น Latex ก็ใช้คำสั่ง \overline{} ครับผม :D
ข้อความเดิมของคุณ Nay:

แต่ถ้าเราลองนำเครื่องหมายลบออกหละ จะเกิดอะไรขึ้น

ตรงนี้ผมชอบจังเลยครับ เป็นการเอาความหมายจริงมาอธิบายได้เป้นกันเองดีครับ
ข้อความเดิมของคุณ Nay:
((10-30)^2 + (20 - 30)^2 + (30 - 30)^2 +(40 -30)^2 + (50-30)^2)/5 = 1000/5 = 200

อันนี้ สามารถทำเป็น Latex ได้ครับ จะสวยงามและอ่านง่ายครับ (ทั้งเศษส่วนและเลขยกกำลัง)

แล้วก็ควรมีการยกตัวอย่างที่เกิดขึ้นในชีวิตประจำวันด้วยนะครับ ว่าค่าต่างๆที่กล่าวมานั้น เอาไปใช้จริงๆได้อย่างไรครับ ... :D :D

ส่วนอื่นๆก็ดีแล้วครับ มีประโยชน์มากเลยครับ :p

m_Innocent
04 พฤษภาคม 2008, 21:48
เสียดายไม่เห็นก่อนสอบคับ

ไม่งั้นเข้าใจกว่านี่เเน่เลย

เหอะๆ

RETRORIAN_MATH_PHYSICS
09 พฤษภาคม 2008, 01:48
หุหุ สวยงามครับ แล้วเอาไปใช้กับการเบี่ยงเบนอย่างอื่นได้ไหม ฮ่าๆ

คusักคณิm
09 พฤษภาคม 2008, 08:11
ขอบคุณมากนะ