ดูหนึ่งข้อความ
  #3  
Old 10 กรกฎาคม 2014, 16:50
t.B.'s Avatar
t.B. t.B. ไม่อยู่ในระบบ
กระบี่ประสานใจ
 
วันที่สมัครสมาชิก: 17 มิถุนายน 2007
ข้อความ: 634
t.B. is on a distinguished road
Default

ขอเสนอ intuitive proof ของ $\sum_{i = 1}^{n} |x-x_i|$

เนื่องจาก median สนใจแค่ลำดับ ดังนั้น เริ่มจากเรียงลำดับ ข้อมูล $x_1,...,x_n$ บนเส้นจำนวนก่อน
ไอเดียหลักคือมอง absolute $|x-x_i|$ เป็น length ระหว่างจุด x กับจุด $x_i$ บนเส้นจำนวน (วาดรูปตามด้วยก็ดี)

เพื่อความง่าย สมมติมีข้อมูล 3 ตัว $x_1\leqslant x_2\leqslant x_3 $ ลองดูบนเส้นว่ามีเหตุผลอะไร ที่ทำให้ $\sum_{i = 1}^{3} |x-x_i|$=ผลรวม length มีค่าต่ำสุดเมื่อ $x=x_2$ ?

ถ้าลองวาดรูปดูจะเห็นว่า บนช่วง $[x_1,x_3]$ ที่มี $x_2$ อยู่ตรงกลาง ถ้าเลือก $x$ ไปอยู่ตรงไหนก็ตามในช่วงนั้นก็จะมีระยะห่างจาก $x\rightarrow x_1$ กับ $x\rightarrow x_3$ รวมเป็น $|x-x_1|+|x-x_3|=length ของช่วง [x_1,x_3] = x_3-x_1=$คงที่ ตลอด ยิ่งไม่ต้องพูดถึงกรณี $x$ หลุดจากช่วง $[x_1,x_3]$ ไป จะได้ length ยิ่งกว่าความยาวช่วงสะอีก ดังนั้น เวลาเราจับคู่เป็นช่วงได้แบบ $[x_1,x_3]$, เลือก $x$ ให้อยู่ตรงไหนในช่วงก็ได้ไม่สำคัญเพราะเอา length รวมเท่าเดิมตลอด แต่พอมี $x_2$ เข้ามาในระหว่างช่วง ทำให้มี length $|x-x_2|$ โผ่ลมา ดังนั้น ถ้าอยากให้ต่ำสุด เราก็ต้องกำจัดพจน์นี้ โดยเลือก $x=x_2$ (ซึ่งไม่เปลี่ยนผลรวม $|x-x_1|+|x-x_3|$ เพราะคงที่ตลอดไม่ว่าเลือก x อะไรในช่วงนี้)

Generalize idea นี้ไป n ข้อมูล เรียงจากน้อยไปมาก
-ถ้าข้อมูล มีคี่ตัว เราก็จับคู่หน้าหลัง ข้อมูลไปเรื่อยๆ จนเหลือตัวตรงกลาง แล้วก็ใช้หลักการด้านบนว่า length ที่เป็นคู่ๆคงที่ตลอดไม่ว่าจะเลือกอะไรใน length (และเลือกนอก ช่วงของแต่ละคู่ก็ไม่ดีเพราะยิ่งทำให้ length เพิ่ม) เนื่องจาก n เป็นคี่ตัว มันจะเหลือตัวไม่มีคู่ตรงกลาง ดังนั้น อยากให้ sum length ต่ำสุด ก็เลือก x=ตัวตรงกลางนั้น=median นั่นเอง
-ถ้าข้อมูล มีคู่ตัว เราก็ต้องเลือก x ในช่วงที่เป็น nested ตรงกลางสุด เพราะถ้า หลุดออกช่วงยังไง length ก็เพิ่ม สมมติช่วงตรงกลางสุด(ช่วงแคบสุดที่โดนครอบด้วยช่วงของคู่อื่น) เป็น $[x_k,x_{k+1}]$ สังเกตว่าไม่ว่าเลือกค่าอะไรในระหว่างช่วงนี้ก็ได้ค่าต่ำสุดเสมอ ดังนั้น กรณีนี้ $x\in [x_k,x_{k+1}]$ อะไรก็ได้ในช่วง ได้ค่าต่ำสุดหมด ∎

ส่วนข้อสอง $\sum_{i = 1}^{n} (x-x_i)^2$ ใช้ calculus ดิฟหาจุด critical point จะได้ $x=\frac{\sum_{i = 1}^{n} x_i}{n} $
และเนื่องจาก $\sum_{i = 1}^{n} (x-x_i)^2\geqslant 0$ ตลอด จุด critical point จึงเป็นจุดต่ำสุด (เพราะว่าฟังชันนี้ bounded from below) ∎
__________________
I am _ _ _ _ locked

10 กรกฎาคม 2014 17:04 : ข้อความนี้ถูกแก้ไขแล้ว 8 ครั้ง, ครั้งล่าสุดโดยคุณ t.B.
ตอบพร้อมอ้างอิงข้อความนี้