Mathcenter Forum

Mathcenter Forum (https://www.mathcenter.net/forum/index.php)
-   ปัญหาคณิตศาสตร์ ม.ปลาย (https://www.mathcenter.net/forum/forumdisplay.php?f=3)
-   -   เกี่ยวกับสถิติ (พวกนี้พิสูจน์ยังไง) (https://www.mathcenter.net/forum/showthread.php?t=21299)

polsk133 09 กรกฎาคม 2014 22:53

เกี่ยวกับสถิติ (พวกนี้พิสูจน์ยังไง)
 
$\sum_{i=1}^n |x-x_i|$ จะมีค่าต่ำสุดเมื่อ x เป็นค่ามัธยฐานของ $x_i$

$\sum_{i=1}^n (x-x_i)^2$ จะมีค่าต่ำสุดเมื่อ x เป็นค่าเฉลี่ยของ $x_i$

nooonuii 10 กรกฎาคม 2014 09:31

อ้างอิง:

ข้อความเดิมเขียนโดยคุณ polsk133 (ข้อความที่ 172092)

$\sum_{i=1}^n |x-x_i|$ จะมีค่าต่ำสุดเมื่อ x เป็นค่ามัธยฐานของ $x_i$

สมมติโดยไม่เสียนัยทั่วไปว่า $x_1\leq x_2\leq\cdots\leq x_n$ แล้วก็แตกค่าสัมบูรณ์เอาครับ

อ้างอิง:

ข้อความเดิมเขียนโดยคุณ polsk133 (ข้อความที่ 172092)
$\sum_{i=1}^n (x-x_i)^2$ จะมีค่าต่ำสุดเมื่อ x เป็นค่าเฉลี่ยของ $x_i$

คิดว่าพหุนามกำลังสองในตัวแปร $x$ จะมีค่าต่ำสุดที่ $x$ เท่ากับเท่าไหร่ล่ะครับ

t.B. 10 กรกฎาคม 2014 16:50

ขอเสนอ intuitive proof ของ $\sum_{i = 1}^{n} |x-x_i|$

เนื่องจาก median สนใจแค่ลำดับ ดังนั้น เริ่มจากเรียงลำดับ ข้อมูล $x_1,...,x_n$ บนเส้นจำนวนก่อน
ไอเดียหลักคือมอง absolute $|x-x_i|$ เป็น length ระหว่างจุด x กับจุด $x_i$ บนเส้นจำนวน (วาดรูปตามด้วยก็ดี)

เพื่อความง่าย สมมติมีข้อมูล 3 ตัว $x_1\leqslant x_2\leqslant x_3 $ ลองดูบนเส้นว่ามีเหตุผลอะไร ที่ทำให้ $\sum_{i = 1}^{3} |x-x_i|$=ผลรวม length มีค่าต่ำสุดเมื่อ $x=x_2$ ?

ถ้าลองวาดรูปดูจะเห็นว่า บนช่วง $[x_1,x_3]$ ที่มี $x_2$ อยู่ตรงกลาง ถ้าเลือก $x$ ไปอยู่ตรงไหนก็ตามในช่วงนั้นก็จะมีระยะห่างจาก $x\rightarrow x_1$ กับ $x\rightarrow x_3$ รวมเป็น $|x-x_1|+|x-x_3|=length ของช่วง [x_1,x_3] = x_3-x_1=$คงที่ ตลอด ยิ่งไม่ต้องพูดถึงกรณี $x$ หลุดจากช่วง $[x_1,x_3]$ ไป จะได้ length ยิ่งกว่าความยาวช่วงสะอีก ดังนั้น เวลาเราจับคู่เป็นช่วงได้แบบ $[x_1,x_3]$, เลือก $x$ ให้อยู่ตรงไหนในช่วงก็ได้ไม่สำคัญเพราะเอา length รวมเท่าเดิมตลอด แต่พอมี $x_2$ เข้ามาในระหว่างช่วง ทำให้มี length $|x-x_2|$ โผ่ลมา ดังนั้น ถ้าอยากให้ต่ำสุด เราก็ต้องกำจัดพจน์นี้ โดยเลือก $x=x_2$ (ซึ่งไม่เปลี่ยนผลรวม $|x-x_1|+|x-x_3|$ เพราะคงที่ตลอดไม่ว่าเลือก x อะไรในช่วงนี้)

Generalize idea นี้ไป n ข้อมูล เรียงจากน้อยไปมาก
-ถ้าข้อมูล มีคี่ตัว เราก็จับคู่หน้าหลัง ข้อมูลไปเรื่อยๆ จนเหลือตัวตรงกลาง แล้วก็ใช้หลักการด้านบนว่า length ที่เป็นคู่ๆคงที่ตลอดไม่ว่าจะเลือกอะไรใน length (และเลือกนอก ช่วงของแต่ละคู่ก็ไม่ดีเพราะยิ่งทำให้ length เพิ่ม) เนื่องจาก n เป็นคี่ตัว มันจะเหลือตัวไม่มีคู่ตรงกลาง ดังนั้น อยากให้ sum length ต่ำสุด ก็เลือก x=ตัวตรงกลางนั้น=median นั่นเอง
-ถ้าข้อมูล มีคู่ตัว เราก็ต้องเลือก x ในช่วงที่เป็น nested ตรงกลางสุด เพราะถ้า หลุดออกช่วงยังไง length ก็เพิ่ม สมมติช่วงตรงกลางสุด(ช่วงแคบสุดที่โดนครอบด้วยช่วงของคู่อื่น) เป็น $[x_k,x_{k+1}]$ สังเกตว่าไม่ว่าเลือกค่าอะไรในระหว่างช่วงนี้ก็ได้ค่าต่ำสุดเสมอ ดังนั้น กรณีนี้ $x\in [x_k,x_{k+1}]$ อะไรก็ได้ในช่วง ได้ค่าต่ำสุดหมด ∎

ส่วนข้อสอง $\sum_{i = 1}^{n} (x-x_i)^2$ ใช้ calculus ดิฟหาจุด critical point จะได้ $x=\frac{\sum_{i = 1}^{n} x_i}{n} $
และเนื่องจาก $\sum_{i = 1}^{n} (x-x_i)^2\geqslant 0$ ตลอด จุด critical point จึงเป็นจุดต่ำสุด (เพราะว่าฟังชันนี้ bounded from below) ∎

polsk133 10 กรกฎาคม 2014 18:52

ขอบพระคุณมากครับ :)


เวลาที่แสดงทั้งหมด เป็นเวลาที่ประเทศไทย (GMT +7) ขณะนี้เป็นเวลา 00:25

Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Modified by Jetsada Karnpracha