Bài giảng Kinh tế lượng - Chương 2: Đa cộng tuyến

Tóm tắt Bài giảng Kinh tế lượng - Chương 2: Đa cộng tuyến: ...các giá trị trên   5/13/2015 3:38 PM 8 Hậu quả của đa cộng tuyến 2. Khoảng tin cậy rộng hơn. khoảng tin cậy của 2 và 3 (với độ tin cậy 1 – ) là: 2:  t /2 se ( ); 3:  t /2 se ( ); Trong đó: se ( ) = se ( ) = ^ 2 ^ 2 ^ 3 ^ 2 ^ 3  22223)1( ixr  ^ 3 ...ng. 5/13/2015 3:38 PM 12 2.2. Phát hiện đa cộng tuyến 1. Hệ số R2 lớn nhưng tỷ số t nhỏ 2. Tương quan cặp giữa các biến giải thích cao 3. Sử dụng mô hình hồi quy phụ 4. Sử dụng yếu tố phóng đại phương sai (VIF) 5/13/2015 3:38 PM 13 Hệ số R2 lớn nhưng tỷ số t nhỏ Đây là triệu chứng ...vượt quá 10 (điều này xảy ra nếu Rj 2 > 0,9) thì biến này được coi là có cộng tuyến cao. )1( 1 2 23r 5/13/2015 3:38 PM 17 2.3. Các biện pháp khắc phục 1. Sử dụng thông tin tiên nghiệm: Dựa vào kinh nghiệm khi làm việc với các mô hình Ví dụ hàm sản xuất Cobb-Douglas: Qt là s...

pdf21 trang | Chia sẻ: havih72 | Lượt xem: 174 | Lượt tải: 0download
Nội dung tài liệu Bài giảng Kinh tế lượng - Chương 2: Đa cộng tuyến, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
5/13/2015 3:38 PM 1 
Chương 2: ĐA CỘNG TUYẾN 
Y 
Y Y 
Y 
X1 
X1 
X1 X1 
X2 X2 
X2 
X2 
Hình 2.1. Biểu đồ Venn mô tả hiện tượng cộng tuyến 
Đa cộng tuyến cao 
Đa cộng tuyến thấp 
Không có đa cộng tuyến 
Đa cộng tuyến vừa 
Xét mô hình: Yi = 1 + 2X2i + 3X3i +  + kXki + Ui 
5/13/2015 3:38 PM 2 
2.1. TỔNG QUAN VỀ ĐA CỘNG TUYẾN 
Đa cộng tuyến là gì ? 
 Ragnar Frisch: Đa cộng tuyến có nghĩa là sự tồn 
tại mối quan hệ tuyến tính “hoàn hảo” hoặc chính 
xác giữa một số hoặc tất cả các biến giải thích 
trong một mô hình hồi quy. 
5/13/2015 3:38 PM 3 
Xét hàm hồi quy tuyến tính k-1 biến độc lập: 
 Yi = 1 + 2X2i + 3X3i +  + kXki + Ui 
Nếu tồn tại các số thực 2, 3,  k sao cho: 
 2X2i + 3X3i +  + kXki = 0 
Với i ( i = 2, 3, k) không đồng thời bằng không 
thì giữa các biến Xi (i = 2, 3, k) xảy ra hiện 
tượng đa cộng tuyến hoàn hảo. Nói cách khác là 
xảy ra trường hợp một biến giải thích nào đó được 
biểu diễn dưới dạng một tổ hợp tuyến tính của các 
biến còn lại. 
2.1. TỔNG QUAN VỀ ĐA CỘNG TUYẾN 
5/13/2015 3:38 PM 4 
Nếu 2X2i + 3X3i +  + kXki + vi = 0, 
Với vi là sai số ngẫu nhiên thì ta có hiện tượng đa 
cộng tuyến không hoàn hảo giữa các biến giải 
thích. Nói cách khác là một biến giải thích nào đó 
có tương quan với một số biến giải thích khác. 
2.1. TỔNG QUAN VỀ ĐA CỘNG TUYẾN 
5/13/2015 3:38 PM 5 
Ví dụ 
X3i = 5X2i, vì vậy có cộng tuyến hoàn hảo giữa X2 và 
X3 ; r23 = 1 
X2 và X3* không có cộng tuyến hoàn hảo, nhưng hai 
biến này có tương quan chặt chẽ. 
X2 10 15 18 24 30 
X3 50 75 90 120 150 
X*3 52 75 97 129 152 
5/13/2015 3:38 PM 6 
Lưu ý 
Giả định về sự đa cộng tuyến liên quan đến mối quan hệ 
tuyến tính giữa các biến Xi, và không đề cập đến các mối 
quan hệ phi tuyến tính. 
Xem xét mô hình: 
 Yi = 0 + 1Xi + 2Xi
2 + 3Xi
3 + ui, 
Rõ ràng Xi
2 và Xi
3 có mối quan hệ hàm số với Xi nhưng phi tuyến 
tính nên không vi phạm giả định về đa cộng tuyến. 
5/13/2015 3:38 PM 7 
Hậu quả của đa cộng tuyến 
1. Phương sai và hiệp phương sai của các ước lượng 
OLS lớn. 
r23 là hệ số tương quan giữa X2 và X3. 
Khi r23  1, các giá trị trên   
5/13/2015 3:38 PM 8 
Hậu quả của đa cộng tuyến 
2. Khoảng tin cậy rộng hơn. 
 khoảng tin cậy của 2 và 3 (với độ tin cậy 1 – ) là: 
 2:  t /2 se ( ); 
 3:  t /2 se ( ); 
Trong đó: 
se ( ) = se ( ) = 
^
2
^
2
^
3
^
2
^
3
 22223)1( ixr

^
3
 23223)1( ixr

5/13/2015 3:38 PM 9 
Hậu quả của đa cộng tuyến 
3. Tỉ số t "không có ý nghĩa". Khi kiểm định giả thuyết 
 H0: 2 = 0, chúng ta sử dụng tỷ số t. 
 và so sánh giá trị ước lượng của t với giá trị tra bảng (tới 
hạn) của t. 
 Trong trường hợp cộng tuyến cao thì sai số chuẩn sẽ rất 
lớn và do đó làm cho giá trị t sẽ nhỏ đi, kết quả là sẽ làm 
tăng chấp nhận giả thuyết H0. 
)ˆ(se
ˆ
t
2
2



5/13/2015 3:38 PM 10 
Hậu quả của đa cộng tuyến 
4. R2 cao nhưng tỉ số t ít có ý nghĩa. 
 Đa cộng tuyến cao: Một hoặc một số tham số 
tương quan (hệ số góc riêng) không có ý nghĩa về 
mặt thống kê. Trong những trường hợp này, R2 lại 
rất cao (> 0,9). Kiểm định F thì có thể bác bỏ giả 
thuyết cho rằng 2 = 3 =  = k = 0. 
5/13/2015 3:38 PM 11 
Hậu quả của đa cộng tuyến 
5. Các ước lượng OLS và sai số chuẩn của chúng trở 
nên rất nhạy với những thay đổi nhỏ trong dữ liệu. 
6. Dấu của các ước lượng của các hệ số hồi quy có 
thể sai. 
7. Thêm vào hay bớt đi các biến cộng tuyến với các 
biến khác, mô hình sẽ thay đổi về dấu hoặc thay 
đổi về độ lớn của các ước lượng. 
5/13/2015 3:38 PM 12 
2.2. Phát hiện đa cộng tuyến 
1. Hệ số R2 lớn nhưng tỷ số t nhỏ 
2. Tương quan cặp giữa các biến giải thích cao 
3. Sử dụng mô hình hồi quy phụ 
4. Sử dụng yếu tố phóng đại phương sai (VIF) 
5/13/2015 3:38 PM 13 
Hệ số R2 lớn nhưng tỷ số t nhỏ 
Đây là triệu chứng “kinh điển” của đa cộng tuyến, 
Nếu R2 cao, chẳng hạn, >0,8 và F test bác bỏ giả 
thuyết 2 = 3 =  = k = 0, nhưng t test cho từng 
i lại chấp nhận H0. 
5/13/2015 3:38 PM 14 
Tương quan giữa các cặp biến giải thích cao 
 Nếu tương quan cặp giữa các biến giải thích cao 
(lớn hơn 0, 8) thì có thể xảy ra hiện tượng đa cộng 
tuyến. 
Trong đó: X và Z là 2 biến giải thích nào đó trong mô hình 
5/13/2015 3:38 PM 15 
Sử dụng mô hình hồi quy phụ 
 Hồi quy một biến giải thích X nào đó theo các biến 
còn lại. 
 Tính R2 và F cho mỗi mô hình theo công thức: 
 F = 
 Kiểm định giả thuyết H0: R
2 = 0, tức giả thuyết biến 
X tương ứng không tương quan tuyến tính với các 
biến còn lại. Nếu giả thuyết H0 được chấp nhận, thì 
không có cộng tuyến. 
)1)(R1(
)(
2
2


k
knR
5/13/2015 3:38 PM 16 
 Sử dụng nhân tố phóng đại phương sai (VIF) 
 Đối với hàm hồi quy có hai biến giải thích X2 và X3, 
VIF được định nghĩa như sau: 
 VIF = 
 Khi có đa cộng tuyến. Khi r23 = 1 thì VIF tiến đến vô 
hạn. Nếu không có cộng tuyến giữa X2 và X3 thì VIF 
bằng 1. 
 Kinh nghiệm: Nếu VIF của 1 biến vượt quá 10 (điều 
này xảy ra nếu Rj
2 > 0,9) thì biến này được coi là có 
cộng tuyến cao. 
)1(
1
2
23r
5/13/2015 3:38 PM 17 
2.3. Các biện pháp khắc phục 
1. Sử dụng thông tin tiên nghiệm: 
 Dựa vào kinh nghiệm khi làm việc với các mô hình 
Ví dụ hàm sản xuất Cobb-Douglas: 
Qt là sản lượng sản phẩm được sản xuất ở thời kỳ t 
Lt là lao động ở thời kỳ t; Kt là vốn ở thời kỳ t; Ut là 
sai số ngẫu nhiên 
A, ,  là các tham số chúng ta cần ước lượng 
tu
ttt eKALQ

5/13/2015 3:38 PM 18 
Lấy Lôgarit tự nhiên: 
 lnQt = ln A + ln Lt + ln Kt + Ut 
Đặt ẩn số ta được: 
Giả sử K và L có tương quan rất cao, điều này dẫn đến 
phương sai của các ước lượng sẽ lớn. Giả sử, từ một 
nguồn thông tin nào đó, ta biết được hàm sản xuất mà 
ta đang xét thuộc ngành có kỳ vọng sinh lợi không đổi 
theo quy mô, nghĩa là  +  = 1. 
tttt UKLAQ 
**** 
2.3. Các biện pháp khắc phục 
5/13/2015 3:38 PM 19 
thay  = 1 - , ta được: 
Như vậy, thông tin tiên nghiệm đã giúp chúng ta giảm 
số biến độc lập của mô hình xuống chỉ còn một biến. 
******** )( tttttttt YUXAUKLAKQ  
2.3. Các biện pháp khắc phục 
5/13/2015 3:38 PM 20 
2.3. Các biện pháp khắc phục 
2. Loại trừ biến giải thích ra khỏi mô hình, định lại 
dạng mô hình: 
Bước 1: Xem cặp biến giải thích nào có quan hệ chặt 
chẽ. Giả sử X2, X3Xk là các biến độc lập, Y là biến 
phụ thuộc và X2, X3 có tương quan chặt chẽ với nhau. 
Bước 2: Tính R2 đối với các hàm hồi quy: Có mặt cả 
hai biến; không có mặt một trong hai biến. 
Bước 3: Ta loại biến mà giá trị R2 tính được khi không 
có mặt biến đó là lớn hơn. 
5/13/2015 3:38 PM 21 
2.3. Các biện pháp khắc phục 
3. Thu thập thêm số liệu hoặc lấy mẫu mới 
4. Sử dụng sai phân cấp một 
Ví dụ từ hàm hồi quy: yt = 1 + 1x1t + 2x2t + ut, 
ta suy ra yt-1 = 1 + 1x1,t-1 + 2x2,t-1 + ut-1, 
Trừ hai vế cho nhau, ta được: 
 yt – yt – 1 = 1(x1,t – x1,t – 1) + 2(x2,t – x2,t – 1) + (ut – ut – 1) Hay: 
 yt = 1  x1,t + 2  x2,t + et, 
Mặc dù, x1 và x2 có quan hệ tuyến tính, nhưng không 
có nghĩa sai phân của chúng cũng như vậy. 
Và một số biện pháp khác... 

File đính kèm:

  • pdfbai_giang_kinh_te_luong_chuong_2_da_cong_tuyen.pdf