ชนิดของ Residual ในการวิเคราะห์การถดถอย

Residual สามารถคำนวณได้หลายวิธี ในกรณีที่เรามีตัวแปรมากกว่าหนึ่งตัวแปร และพยายามที่จะค้นหาค่าผิดพลาดของตัวแปรเหล่านั้น มี Residual หลายชนิดที่ควรพิจารณาดังนี้

1. Unstandardised residuals or Raw residuals (RESID)

เป็น residuals คะแนนดิบที่ตรวจพบได้ในเบื้องต้น เช่น ความแตกต่างระหว่างคะแนนทำนายและคะแนนที่ได้จริงของบุคคลที่สนใจ

2. Standardised residuals (ZRESID)

ถ้าไม่รู้สเกลการของตัวแปร ก็ยากที่จะแปลความหมายของ residuals ที่พบ สามารถแก้ไขได้โดยทำให้เป็นคะแนนมาตรฐานที่มีค่าเฉลี่ย 0 และส่วนเบี่ยงเบนมาตรฐาน 1

3. Studentised residuals (SRESID)

residuals สองชนิดแรกเป็น residuals ที่สมมติว่ามีความแปรปรวนเท่ากันในทุกค่าของตัวแปรทำนาย SRESID จะทำการปรับแก้การประมาณค่าความแปรปรวนของ residuals

4. Deleted residuals (DRESID) and Studentised deleted residuals (SDRESID)

ในการวิเคราะห์การถดถอย เราสนใจในความแตกต่างระหว่าคะแนนทำนายกับคะแนนจริงที่ได้ ซึ่งผลต่างก็คือ residual ในการคำนวณเพื่อหาคะแนนทำนายนั้น ได้รวมค่าผิดปกติ (outlier) เข้าไปด้วย ซึ่งค่าผิดปกตินี้มีผลต่อคะแนนทำนายที่คำนวณได้ แต่ถ้าหากคำนวณโดยปราศจากค่าผิดปกติแล้ว ผลต่างระหว่างคะแนนทำนายกับคะแนนจริงจะลดลง deleted residual และ studentised deleted residual จะคำนวณอยู่บนพื้นฐานของคะแนนทำนายที่ไม่รวมบุคคลที่มีค่าผิดปกติ (outlier) ในการวิเคราะห์

5. เปรียบเทียบ residuals แต่ละชนิด

จากตาราง 2 แสดงชนิดของ residual ของกลุ่มตัวอย่างคนที่ 3 จากข้อมูลในตาราง 1 ซึ่ง raw residual จะมีค่ามาก แต่ยากในการแปลความหมาย เพราะมีผลมาจากสเกลการวัดของตัวแปรตาม deleted residual มีค่ามากกว่า raw residual ซึ่งบ่งชี้ว่า ค่าผิดปกติส่งผลต่อตำแหน่งของเส้นถดถอย ถ้าหากข้อมูลปราศจากค่าผิดปกติ (outlier) แล้ว deleted residual และ raw residual จะต้องมีค่าเท่ากัน ส่วนค่าสัมบูรณ์ของ 2.6 standardised (ZRESID) และ 2.8 studentised (SRESID) มีค่าสูงใกล้เคียงกันทั้งคู่ แต่ studentise deleted (SDRESID) มีค่าสูงกว่า studentised (SRESID) แสดงว่าข้อมูลมีค่าผิดปกติ (outlier) ซึ่งมีผลต่อตำแหน่งของเส้นถดถอย

ตาราง 1 ชุดข้อมูล

Caseeventshass suppdep
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
120
185
150
110
94
156
55
132
141
157
202
107
148
180
88
108
111
122
162
150
148
103
155
134
116
159
122
149
86
100
127
130
95
52
91
148
150
143
129
179
46
48
60
55
41
54
31
33
31
59
53
51
39
43
43
43
40
46
55
51
45
50
57
46
36
60
46
36
42
36
50
54
56
33
45
43
39
45
37
55
10
33
10
23
47
40
48
41
32
38
13
39
37
13
51
30
5
64
60
28
47
18
19
45
46
18
32
39
39
44
15
49
33
49
41
20
21
24
39
10
150
160
70
150
90
130
120
120
150
160
180
120
140
120
100
110
120
80
140
120
90
130
140
130
90
120
90
90
80
110
150
100
90
110
110
110
90
160
140
150

ตาราง 2 เปรียบเทียบ residuals แต่ละชนิดของกลุ่มตัวอย่างคนที่ 3

Residualค่า
Raw (RESID)-63.9
Deleted (DRESID)-73.9
Standardised (ZRESID)-2.6
Studentised (SRESID)-2.8
Studentised deleted (SDRESID)-3.1

6. การวิเคราะห์ residuals ด้วยโปรแกรม SPSS 10.0 for Windows

จากข้อมูลในตาราง 1 สามารถวิเคราะห์หาค่า residuals ชนิดต่าง ๆ ได้ด้วยเมนู Analyze -> Regression -> Linear... จะปรากฎหน้าต่าง "Linear Regression" เลือกตัวแปรตามซึ่งก็คือ dep ใส่ในช่อง Dependent : อีก 3 ตัวแปรที่เหลือก็คือตัวแปรทำนาย ใส่ในช่อง Independent(s) :

คลิกที่ปุ่ม Save... จะปรากฏหน้าต่าง "Linear Regression : Save" ตรงช่อง Residuals คลิกเลือกชนิดของ Residuals ที่ต้องการคำนวณ

คลิกปุ่ม Continue และคลิกปุ่ม OK โปรแกรมจะคำนวณค่าต่าง ๆ ที่เกี่ยวข้อง และคำนวณค่า Residuals ชนิดต่าง ๆ ของกลุ่มตัวอย่างแต่ละคน
คำย่อของ residuals ชนิดต่าง ๆ ที่วิเคราะห์ด้วยโปรแกรม SPSS มีดังนี้

ชนิดของ Residualคำย่อในโปรแกรม SPSS
Raw (RESID)res
Deleted (DRESID)dre
Standardised (ZRESID)zre
Studentised (SRESID)sre
Studentised deleted (SDRESID)sdr


บรรณานุกรม
Miles, Jeremy and Shevlin, Mark. Applying Regression & Correlation : A Guide for Student and Researchers. London : SAGE Publications, 2001.

เอกสารชุดนี้จัดทำโดย : ฉัตรศิริ ปิยะพิมลสิทธิ์. ตุลาคม ๒๕๔๕