|
สมัครสมาชิก | คู่มือการใช้ | รายชื่อสมาชิก | ปฏิทิน | ข้อความวันนี้ | ค้นหา |
|
เครื่องมือของหัวข้อ | ค้นหาในหัวข้อนี้ |
#1
|
||||
|
||||
เกี่ยวกับสถิติ (พวกนี้พิสูจน์ยังไง)
$\sum_{i=1}^n |x-x_i|$ จะมีค่าต่ำสุดเมื่อ x เป็นค่ามัธยฐานของ $x_i$
$\sum_{i=1}^n (x-x_i)^2$ จะมีค่าต่ำสุดเมื่อ x เป็นค่าเฉลี่ยของ $x_i$ 09 กรกฎาคม 2014 22:53 : ข้อความนี้ถูกแก้ไขแล้ว 1 ครั้ง, ครั้งล่าสุดโดยคุณ polsk133 |
#2
|
|||
|
|||
อ้างอิง:
คิดว่าพหุนามกำลังสองในตัวแปร $x$ จะมีค่าต่ำสุดที่ $x$ เท่ากับเท่าไหร่ล่ะครับ
__________________
site:mathcenter.net คำค้น |
#3
|
||||
|
||||
ขอเสนอ intuitive proof ของ $\sum_{i = 1}^{n} |x-x_i|$
เนื่องจาก median สนใจแค่ลำดับ ดังนั้น เริ่มจากเรียงลำดับ ข้อมูล $x_1,...,x_n$ บนเส้นจำนวนก่อน ไอเดียหลักคือมอง absolute $|x-x_i|$ เป็น length ระหว่างจุด x กับจุด $x_i$ บนเส้นจำนวน (วาดรูปตามด้วยก็ดี) เพื่อความง่าย สมมติมีข้อมูล 3 ตัว $x_1\leqslant x_2\leqslant x_3 $ ลองดูบนเส้นว่ามีเหตุผลอะไร ที่ทำให้ $\sum_{i = 1}^{3} |x-x_i|$=ผลรวม length มีค่าต่ำสุดเมื่อ $x=x_2$ ? ถ้าลองวาดรูปดูจะเห็นว่า บนช่วง $[x_1,x_3]$ ที่มี $x_2$ อยู่ตรงกลาง ถ้าเลือก $x$ ไปอยู่ตรงไหนก็ตามในช่วงนั้นก็จะมีระยะห่างจาก $x\rightarrow x_1$ กับ $x\rightarrow x_3$ รวมเป็น $|x-x_1|+|x-x_3|=length ของช่วง [x_1,x_3] = x_3-x_1=$คงที่ ตลอด ยิ่งไม่ต้องพูดถึงกรณี $x$ หลุดจากช่วง $[x_1,x_3]$ ไป จะได้ length ยิ่งกว่าความยาวช่วงสะอีก ดังนั้น เวลาเราจับคู่เป็นช่วงได้แบบ $[x_1,x_3]$, เลือก $x$ ให้อยู่ตรงไหนในช่วงก็ได้ไม่สำคัญเพราะเอา length รวมเท่าเดิมตลอด แต่พอมี $x_2$ เข้ามาในระหว่างช่วง ทำให้มี length $|x-x_2|$ โผ่ลมา ดังนั้น ถ้าอยากให้ต่ำสุด เราก็ต้องกำจัดพจน์นี้ โดยเลือก $x=x_2$ (ซึ่งไม่เปลี่ยนผลรวม $|x-x_1|+|x-x_3|$ เพราะคงที่ตลอดไม่ว่าเลือก x อะไรในช่วงนี้) Generalize idea นี้ไป n ข้อมูล เรียงจากน้อยไปมาก -ถ้าข้อมูล มีคี่ตัว เราก็จับคู่หน้าหลัง ข้อมูลไปเรื่อยๆ จนเหลือตัวตรงกลาง แล้วก็ใช้หลักการด้านบนว่า length ที่เป็นคู่ๆคงที่ตลอดไม่ว่าจะเลือกอะไรใน length (และเลือกนอก ช่วงของแต่ละคู่ก็ไม่ดีเพราะยิ่งทำให้ length เพิ่ม) เนื่องจาก n เป็นคี่ตัว มันจะเหลือตัวไม่มีคู่ตรงกลาง ดังนั้น อยากให้ sum length ต่ำสุด ก็เลือก x=ตัวตรงกลางนั้น=median นั่นเอง -ถ้าข้อมูล มีคู่ตัว เราก็ต้องเลือก x ในช่วงที่เป็น nested ตรงกลางสุด เพราะถ้า หลุดออกช่วงยังไง length ก็เพิ่ม สมมติช่วงตรงกลางสุด(ช่วงแคบสุดที่โดนครอบด้วยช่วงของคู่อื่น) เป็น $[x_k,x_{k+1}]$ สังเกตว่าไม่ว่าเลือกค่าอะไรในระหว่างช่วงนี้ก็ได้ค่าต่ำสุดเสมอ ดังนั้น กรณีนี้ $x\in [x_k,x_{k+1}]$ อะไรก็ได้ในช่วง ได้ค่าต่ำสุดหมด ∎ ส่วนข้อสอง $\sum_{i = 1}^{n} (x-x_i)^2$ ใช้ calculus ดิฟหาจุด critical point จะได้ $x=\frac{\sum_{i = 1}^{n} x_i}{n} $ และเนื่องจาก $\sum_{i = 1}^{n} (x-x_i)^2\geqslant 0$ ตลอด จุด critical point จึงเป็นจุดต่ำสุด (เพราะว่าฟังชันนี้ bounded from below) ∎
__________________
I am _ _ _ _ locked 10 กรกฎาคม 2014 17:04 : ข้อความนี้ถูกแก้ไขแล้ว 8 ครั้ง, ครั้งล่าสุดโดยคุณ t.B. |
#4
|
||||
|
||||
ขอบพระคุณมากครับ
|
|
|