|
สมัครสมาชิก | คู่มือการใช้ | รายชื่อสมาชิก | ปฏิทิน | ข้อความวันนี้ | ค้นหา |
|
เครื่องมือของหัวข้อ | ค้นหาในหัวข้อนี้ |
#1
|
||||
|
||||
มารู้จักการเบี่ยงเบนกันดีกว่า
ในวิชาสถิติค่าที่เราต้องการหาจากข้อมูลชุดหนึ่ง นั้นมีหลายค่า เช่น
1. ค่าเฉลี่ย (ค่าเฉลี่ยเลขคณิต, มัธยฐาน และ ฐานนิยม) 2. ค่าเบี่ยงเบนมาตรฐาน ( Standard deviation ) 3. ค่าความแปรปรวน ( Variance ) เป็นต้น ในสมัยที่ผมเรียนสถิติสิ่งที่ทำให้เกิดปัญหาก็คือผมเรียนไม่รู้เรื่องเลย แต่นั่นคืออดีต ปัจจุบันเลยต้องมานั่งเรียนเองด้วยความจำเป็นที่จะต้องใช้ แล้วตอนนี้ ก็สุดยอด และเมื่อรู้แล้วก็อยากเล่าสู่กันฟัง เพื่อให้คนที่ไม่รู้เรื่องเลยพอจะมีพื้นฐานกันบ้าง เริ่มกันเลย เอาแต่ที่ใช้นะ 1. ค่าเฉลี่ยเลขคณิต ( Arithmetic Mean ) ค่าเฉลี่ยหมายถึงค่าที่อยู่ตรงกลางของชุดข้อมูล ดังนั้นค่าเฉลี่ยเลขคณิตก็คือการหาค่ากลางของข้อมูลโดยการคำนวณนั่นเอง โดยการนำข้อมูลทั้งหมดมารวมกันแล้วหารด้วยจำนวนทั้งหมดของข้อมูล ตัวอย่างที่ 1 จงหาค่าเฉลี่ยเลขคณิตของข้อมูลต่อไปนี้ 10 20 30 40 50 วิธีทำ x ( ปกติต้องมีขีดอยู่ข้างบนและอ่านว่า x บาร์แต่หาวิธีพิมพ์ไม่ได้ ) = ค่าเฉลี่ยเลขคณิต x = (10 + 20 + 30 +40 +50)/5 = 30 เมื่อ 5 คือจำนวนของข้อมูล ในกรณีที่ข้อมูลมีการจัดกลุ่ม ( ภาษาอังกฤษใช้ "Grouped data" แต่บ้านเราใช้คำว่า"แจกแจง" นี่แหละที่ทำให้งงไม่รู้ใครเป็นคนแปล เอาเป็นว่าเขาใช้กันมานานแล้วผมก็จะทนใช้ด้วย ) ในกรณีที่มีการแจกแจง เช่น ข้อมูลชุดเดิม 10 20 30 40 50 ถ้าเราทำการแจกแจง (จัดกลุ่ม) จะได้ ค่าที่อยู่ระหว่าง 10 ถึง 30 มี 3 ค่า ( 10, 20, 30 ) และค่าที่อยู่ระหว่าง 31 ถึง 50 มี 2 ค่า (40, 50) กกรหาค่าเฉลี่ยเลขคณิตโดยวิธีนี้ จะใช้วิธีการที่ดัดแปลงนิดหน่อยคือค่าที่นำมารวมกันจะเป็นค่าที่เกิดจากค่ากลางของแต่ละกลุ่มคูณกับความถี่ของแต่ละกลุ่ม ในที่นี้จะได้ค่าเเฉลี่ยคือ ค่ากลางของแต่ละชั้นคือ ( ค่ามากสุด + ค่าน้อยสุด ) / 2 ค่ากลางที่อยู่ระหว่าง 10 ถึง 30 คือ (30 + 10)/2 = 35 ค่ากลางที่อยู่ระหว่าง 31 ถึง 50 คือ (50 + 31)/2 = 40.5 นำไปคูณกับความถี่ ของแต่ละกลุ่มจะได้ 35*3 = 105 และ 40.5*2 = 81 ดังนั้นค่าเฉลี่ยคือ x บาร์ = ( 105 + 81 ) / 5 = 37.2 จะเห็นว่าค่าเฉลี่ยที่ได้จากการจัดกลุ่ม (แจกแจง) กับ ค่าที่ได้โดยไม่แจกแจงมีค่าไม่เท่ากัน เนื่องจกาการแจกแจงเราใช้ค่าเฉลี่ยของแต่ละกลุ่มมาทำการคำนวนหาค่าเฉลี่ยเลขคณิตนั่นเอง 2. การเบี่ยงเบน ( deviations ) 2.1 การกระจายตัวของข้อมูล ลองดูตังอย่างต่อไปนี้ 10 20 30 40 50 และ 28 29 30 31 32 ข้อมูลทั้ง 2 ชุดมีค่าเฉลี่ยคือ 30 เท่ากัน แต่จะเห็นว่าข้อมูลชุดแรกมีการกระจายของข้อมูลมากกว่า 2.2 ค่าเฉลี่ยของการเบี่ยงเบน ถ้าเราพูดถึง ค่าเบี่ยงเบน ให้รู้ไว้เสมอว่ามันคือค่าที่ แตกต่างจากค่าเฉลี่ยนั่นเอง นั่นคือค่าของข้อมูลแต่ละตัวลบด้วยค่าเฉลี่ยเลขคณิต เช่น การเบี่ยงเบนของ 10 20 30 40 50 คือ [10-30, 20-30, 30-30, 40-30 ,50-30] จะได้ -20 -10 0 10 20 ซึ่งถ้าเราหาค่าเฉลี่ยจะได้ค่าเท่ากับ 0 และ การเบี่ยงเบนของ 28 29 30 31 32 คือ -1 -2 0 1 2 ซึ่งถ้าเราหาค่าเฉลี่ยจะได้ค่าเท่ากับ 0 เช่นกัน จะเห็นว่าค่าเฉลี่ยเลขคณิตที่ได้จากการหาจากการเบี่ยงของข้อมูลจากค่าเฉลี่ยเลขคณิตของข้อมูลนี้ไม่มีประโยชน์ แต่ถ้าเราลองนำเครื่องหมายลบออกหละ จะเกิดอะไรขึ้น จะได้ว่าค่าเฉลี่ยของการเบี่ยงเบนของข้อมูลชุดแรกคือ 60/5 = 12 และค่าเฉลี่ยของการเบี่ยงเบนของข้อมูลชุดที่ 2 คือ 6/5 = 1.2 จะเห็นว่ามีความสัมพันธ์กับการกระจายตัวของข้อมูล และวิธีที่เราจะนำเอาเครื่องหมายลบออกจากตัวเลขได้มี 2 วิธีคือ 2.2.1 การใส่ค่าสัมบูรณ์ของการเบี่ยงเบนแทน ( วิธีนี้ไม่ค่อยใช้จะไม่อธิบายนะครับ ) 2.2.2 การยกกำลังสองให้กับการเบี่ยงเบน เราจะเรียกค่าเฉลี่ยเลขคณิตแบบนี้ว่า Variance ( ค่าแปรปรวน ) ดูตัวอย่าง 2.3 ค่าความแปรปรวน ค่าความแปรปรวนของ 10 20 30 40 50 ( ค่าเฉลี่ยเท่ากับ 30 ) คือ ((10-30)^2 + (20 - 30)^2 + (30 - 30)^2 +(40 -30)^2 + (50-30)^2)/5 = 1000/5 = 200 และ ค่าความแปรปรวนของ 28 29 30 31 32 ( ค่าเฉลี่ยเท่ากับ 30 ) คือ ((28-30)^2 + (29 - 30)^2 + (30 - 30)^2 +(31 -30)^2 + (32-30)^2)/5 = 10/5 = 2 หน่วยของ variance ก็คือหน่วยของข้อมูลยกกำลังสอง และ ถ้าเราหาค่ารากที่ 2 ของ ค่าความแปรปรวนค่าที่ได้เราจะเรียกว่า "ค่าเบี่ยงเบนมาตรฐาน" ในกรณีนี้ค่าเบี่ยงเบนมาตรฐานของทั้ง 2 ชุดข้อมูลคือ รากที่สองของ 200 และ 2 นั่นคือ 14.14 และ 1.41 ----------------------------------------------------------------------------------------------- เป็นอย่างไรบ้างครับพอจะเข้าใจความหมายของ ค่าต่างๆ ในทางสถิติขึ้นมาบ้างไหมครับ สำหรับสิ่งที่ผมอธิบายมาทั้งหมดจะใช้ในกรณีที่ข้อมูลเป็นข้อมูลประชากร แต่ถ้าเป็นข้อมูลที่ได้จากการสุ่มเราจะใช้ตัวหารของความแปรปรวนเป็น จำนวนวข้อมูล - 1 แทน เช่นถ้าเรามีข้อมูล 5 ตัวที่ได้จากการสุ่มเราจะใช้ 5-1 = 4 หารแทน ส่วนเหตุผลนั้นผมขี้เกียจพิมพ์แล้ว ไว้คราวหน้าถ้านึกขยันขึ้นมาแบบนี้อีกแล้วจะเล่าให้ฟัง ปล. แล้วผมจะหาเรื่องสนุกๆ มาเล่าใฟงอีกนะครับ
__________________
กลับมาแล้วจ้า |
#2
|
||||
|
||||
ดีครับ. เป็นประโยชน์มากเลยครับ.
|
#3
|
||||
|
||||
ผิดนิดนึงครับ
ค่ากลางที่อยู่ระหว่าง 10 ถึง 30 คือ (30 + 10)/2 = 35 ( อันนี้ต้องเป็น 20 ครับ รวมถึงการคำนวณบรรทัดต่อไปด้วยอ่ะนะครับ ) อีกอย่างนี่ ผมชอบประวัติที่คุณ Nay กรอกครับ ฮาดี ถ้ามีโอกาสจานำไปใช้บ้างนะครับ
__________________
" จุดสูงสุด คือ เบื้องล่างที่ผ่านมา จุดสูงค่า คือ สิ่งใดหนอชีวี " |
#4
|
||||
|
||||
ขอโทษทีครับ พอดีใช้เครื่องคอมหา คือผมใช้ 30+ 10/2 มันเลยเข้าใจว่า เป็น 30 + 5 ขอบคุณ คุณ tana มากครับ แล้วผมขอแก้ไขหน่อยครับ
ค่ากลางที่อยู่ระหว่าง 10 ถึง 30 คือ (30 + 10)/2 = 20 ค่ากลางที่อยู่ระหว่าง 31 ถึง 50 คือ (50 + 31)/2 = 40.5 นำไปคูณกับความถี่ ของแต่ละกลุ่มจะได้ 20*3 = 60 และ 40.5*2 = 81 ดังนั้นค่าเฉลี่ยคือ x บาร์ = ( 60 + 81 ) / 5 = 28.2
__________________
กลับมาแล้วจ้า |
#5
|
|||
|
|||
อ้างอิง:
ถ้าเป็น Latex ก็ใช้คำสั่ง \overline{} ครับผม อ้างอิง:
อ้างอิง:
แล้วก็ควรมีการยกตัวอย่างที่เกิดขึ้นในชีวิตประจำวันด้วยนะครับ ว่าค่าต่างๆที่กล่าวมานั้น เอาไปใช้จริงๆได้อย่างไรครับ ... ส่วนอื่นๆก็ดีแล้วครับ มีประโยชน์มากเลยครับ
__________________
[[:://R-Tummykung de Lamar\\::]] || (a,b,c > 0,a+b+c=3) $$\sqrt a+\sqrt b+\sqrt c\geq ab+ac+bc$$ 13 พฤษภาคม 2005 17:47 : ข้อความนี้ถูกแก้ไขแล้ว 1 ครั้ง, ครั้งล่าสุดโดยคุณ R-Tummykung de Lamar |
#6
|
||||
|
||||
เสียดายไม่เห็นก่อนสอบคับ
ไม่งั้นเข้าใจกว่านี่เเน่เลย เหอะๆ |
#7
|
||||
|
||||
หุหุ สวยงามครับ แล้วเอาไปใช้กับการเบี่ยงเบนอย่างอื่นได้ไหม ฮ่าๆ
__________________
I think you're better than you think you are. |
#8
|
||||
|
||||
ขอบคุณมากนะ
__________________
|
|
|