Bài giảng Kinh tế lượng - Chương 6: Kiểm định mô hình
Tóm tắt Bài giảng Kinh tế lượng - Chương 6: Kiểm định mô hình: ...h 10 Phương sai sai số thay đổi (Heteroscedasticity) Hậu quả của phương sai sai số thay đổi Hậu quả của phương sai sai số thay đổi 3 Các ước lượng vẫn ước lượng tuyến tính không chệch tức là E(βˆj) = βj nhưng không tốt nhất, vì các ước lượng này không hiệu quả. 3 Phương sai của các hệ số ước l...ề phương sai sai số không đổi. 16 Phương sai sai số thay đổi (Heteroscedasticity) Phát hiện phương sai sai số thay đổi (c) Mô hình hồi quy (d) Kiểm định White 17 Phương sai sai số thay đổi (Heteroscedasticity) Khắc phục hiện tượng phương sai sai số thay đổi Khắc phục hiện tượng phương sai sai... ≈ ∞ −→ se(βˆj) rất lớn G Khoảng tin cậy cho βj sẽ rộng −→ ước lượng trở nên kém chính xác. G Hệ số ước lượng βj dễ mất ý nghĩa thống kê. G Dấu của hệ số ước lượng của biến Xj có thể ngược với kỳ vọng G Giá trị của ước lượng của βˆj và se(βˆj) rất nhạy đối với việc tăng hoặc bớt đi một quan sá...
Chương 6: KIỂM ĐỊNH MÔ HÌNH Th.S NGUYỄN PHƯƠNG Bộ môn Toán kinh tế Trường Đại học Ngân hàng TPHCM Blog: https://nguyenphuongblog.wordpress.com Email: nguyenphuong0122@gmail.com Ngày 18 tháng 9 năm 2016 1 NỘI DUNG 1 Kỳ vọng của sai số ngẫu nhiên khác không Nguyên nhân Hậu quả của kỳ vọng sai số ngẫu nhiên khác không Phát hiện về sự khác không của kỳ vọng sai số ngẫu nhiên Một số biện pháp khắc phục 2 Phương sai sai số thay đổi (Heteroscedasticity) Nguyên nhân Hậu quả của phương sai sai số thay đổi Phát hiện phương sai sai số thay đổi Khắc phục hiện tượng phương sai sai số thay đổi 3 Đa cộng tuyến (Multicollinearity) Bản chất đa cộng tuyến Nguyên nhân và hậu quả Cách phát hiện đa cộng tuyến cao Khắc phục hiện tượng đa cộng tuyến 4 Sai số ngẫu nhiên không tuân theo quy luật chuẩn 2 Kỳ vọng của sai số ngẫu nhiên khác không Nguyên nhân Giả thiết 2 của mô hình hồi quy tuyến tính là E(u|X2, . . . ,Xk) = 0. Nếu giả thiết này thỏa mãn thì có E(u) = 0 và cov(Xj, u) = 0,∀j = 2, . . . , k. Nguyên nhân ä Mô hình "thiếu biến quan trọng" (omit variable). Mô hình được cho là thiếu biến quan trọng Z nếu: Biến Z có tác động đến biến phụ thuộc Y. Biến Z có tương quan với Xj, j = 2, 3, . . . , k Khi đó cov(Xj, u) , 0. ä Dạng hàm sai (functional form misspecification) ä Tính tác động đồng thời của số liệu ä Sai số đo lường của các biến độc lập. 3 Kỳ vọng của sai số ngẫu nhiên khác không Hậu quả của kỳ vọng sai số ngẫu nhiên khác không Hậu quả của kỳ vọng sai số ngẫu nhiên khác không ä Ước lượng OLS sẽ là ước lượng chệch, tức là E(βˆj) , βj. ä Nếu mô hình thiếu biến quan trọng Z thì UL OLS không vững. ä Các suy diễn thống kê không còn đáng tin cậy 4 Kỳ vọng của sai số ngẫu nhiên khác không Phát hiện về sự khác không của kỳ vọng sai số ngẫu nhiên Nếu mô hình bỏ sót biến quan trọng: Giả sử muốn biết mô hình Y = β1 + β2X2 + . . .+ βkXk + u có bỏ sót "biến quan trọng Z" hay không ta hồi quy mô hình Y = β1 + β2X2 + . . .+ βkXk + αk+1Z+ u. Sau đó kiểm định cặp giả thuyết: H0 : αk+1 = 0; H1 : αk+1 , 0. Nếu bác bỏ H0 thì chấp nhận biến Z có tác động đến Y và mô hình đã thiếu "biến quan trọng Z". Nếu mô hình có dạng hàm sai - Sử dụng Kiểm định Ramsey (để phát hiện mô hình có dạng hàm sai do thiếu biến là hàm mũ của các biến có sẵn trong mô hình) - Sử dụng Kiểm định Davidson-MacKinnon (Kiểm định J) 5 Kỳ vọng của sai số ngẫu nhiên khác không Phát hiện về sự khác không của kỳ vọng sai số ngẫu nhiên Ví dụ 1.1 Sử dụng bộ số liệu ch5vd3.wf1 thu được kết quả ước lượng sau: CT = 42, 73+ 0, 85TN+ e Để kiểm định xem mô hình có khuyến tật bỏ sót biến TS hay không, ta thực hiện kiểm định. Hình: Kiểm định thiếu biến 6 Kỳ vọng của sai số ngẫu nhiên khác không Phát hiện về sự khác không của kỳ vọng sai số ngẫu nhiên Ví dụ 1.2 Trong ví dụ trước, ta thấy mô hình bỏ sót biến tài sản (TS). Khi thêm biến TS vào mô hình: CT = β1 + β2TN+ β3TS+ u Câu hỏi: có vấn đề về dạng hàm sai hay không? Hình: Kiểm định Ramsy RESET 7 Kỳ vọng của sai số ngẫu nhiên khác không Một số biện pháp khắc phục Một số biện pháp khắc phục khi mô hình có kỳ vọng của sai số ngẫu nhiên khác 0 Nếu mô hình thiếu biến quan trọng Z (đã biết) được phát hiện từ kiểm định t thì ta thêm biến Z vào mô hình. Nếu mô hình có dạng hàm sai được phát hiện từ kiểm định Ramsey thì xét các mô hình thay thế. Nếu mô hình thiếu biến không quan sát được thì có thể sử dụng hai phương pháp: - Sử dụng biến đại diện (proxy varable) - Sử dụng biến công cụ (instrumental variable) 8 Phương sai sai số thay đổi (Heteroscedasticity) Xét mô hình hồi quy: Y = β1 + β2X2 + · · ·+ βkXk + u. Định lý Gause-Markov khẳng định rằng để ước lượng OLS là tốt nhất thì phương sai sai số trong mô hình hồi quy phải bằng nhau tại mọi quan sát. Khi giả thiết này không thỏa mãn thì mô hình có hiện tượng phương sai sai số thay đổi, tức là: var(uj|X2i,X3i, . . . ,Xki) = σ2i , i = 1, 2, . . . ,n; nghĩa là tại các bộ giá trị (X2i,X3i, . . . ,Xki) khác nhau thì phương sai của sai số ngẫu nhiên ui nhận các giá trị khác nhau, kí hiệu là σ2. 9 Phương sai sai số thay đổi (Heteroscedasticity) Nguyên nhân Nguyên nhân ä Do bản chất của các hiện tượng kinh tế 3 Số liệu theo không gian có quy mô khác nhau −→ quan sát các doanh nghiệp có quy mô quá lớn - quá nhỏ 3 Số liệu theo thời gian qua các giai đoạn có mức biến động khác nhau −→ giai đoạn kinh tế ổn định - giai đoạn khủng hoảng 3 Mối quan hệ sẵn có hiện tượng PSSS thay đổi −→ mối quan hệ của thu nhập – chi tiêu, chỉ số thị trường chứng khoán ä Do số liệu không phản ảnh đúng bản chất của hiện tượng kinh tế ä Do kỹ thuật thu thập, xử lý dữ liệu ngày càng được hoàn thiện nên sai số ngày càng ít ä Do hành vi của con người có sự tiếp thu từ quá khứ ä Do định dạng không đúng dạng hàm của mô hình 10 Phương sai sai số thay đổi (Heteroscedasticity) Hậu quả của phương sai sai số thay đổi Hậu quả của phương sai sai số thay đổi 3 Các ước lượng vẫn ước lượng tuyến tính không chệch tức là E(βˆj) = βj nhưng không tốt nhất, vì các ước lượng này không hiệu quả. 3 Phương sai của các hệ số ước lượng là chệch 3 Khoảng tin cậy và kiểm định giả thuyết về các hệ số không còn giá trị sử dụng do var(βˆj) bị chệch. 11 Phương sai sai số thay đổi (Heteroscedasticity) Phát hiện phương sai sai số thay đổi Dựa vào bản chất của vấn đề nghiên cứu. Trong thực tế thường thì số liệu chéo liên quan đến những đơn vị không thuần nhất −→ xảy ra hiện tượng phương sai thay đổi. Ví dụ: Nghiên cứu mối quan hệ giữa chi phí sản xuất và lượng sản phẩm được sản xuất ra dựa vào mẫu gồm nhưng doanh nghiệp có qui mô khác nhau −→ xảy ra hiện tượng phương sai thay đổi. Sử dụng đồ thị phần dư 12 Phương sai sai số thay đổi (Heteroscedasticity) Phát hiện phương sai sai số thay đổi Phương pháp phân tích định lượng Ý tưởng: Var(Ui) = σ2i −→ σ2i có phụ thuộc vào X2i,X3i, . . . ,Xki ? −→ u2i , |ui| có phụ thuộc vào X2i,X3i, . . . ,Xki ?−→ u2i , |ui| = f (X2i,X3i, . . . ,Xki)? −→ Mô hình hồi quy mẫu: e2i , |ei| = f̂ (X2i,X3i, . . . ,Xki) −→ Kiểm định giả thiết H1 : u2i , |ui|phụ thuộc vào X2i,X3i, . . . ,Xki Kiểm định Breusch-Pagan (BP): u2i = α1 + α2X2i + . . .+ αkXki + vi−→ Kđgt: H0 : α1 = α2 = . . . = αk = 0;H1 : α21 + α22 + . . .+ α2k > 0 Kiểm định White (3 biến): u2i = α1 + α2X2i + α3X3i + α4X 2 2i + α5X 2 3i + α6X2iX3i + vi −→ Kđgt: H0 : α1 = α2 = . . . = α6 = 0;H1 : α21 + α22 + . . .+ α26 > 0 13 Phương sai sai số thay đổi (Heteroscedasticity) Phát hiện phương sai sai số thay đổi Kiểm định Breusch-Pagan (Kiểm định BP) ä Bước 1: Hồi quy mô hình Y = β1 + β2X2 + · · ·+ βkXk + u −→ thu được phần dư ei. ä Bước 2: Hồi quy e2i theo các biến độc lập trong mô hình e2i = α1 + α2X2i + · · ·+ αkXki + vi thu được hệ số xác định R2e . ä Bước 3: Kiểm định cặp giả thuyết H0 : α2 = . . . = αk = 0 H1 : α22 + · · ·+ α2k , 0. Kết luận dựa vào p − value Ví dụ 2.1 Với số liệu trong ch4bt8.wf1, hãy ước lượng mô hình hồi quy sau: wage = β1 + β2.age+ β3.edu+ u trong đó wage, age và edu lần lượt là lương, tuổi và số năm đi học của người lao động. Sau đó dùng kiểm định BP để kiểm định giả thuyết về phương sai sai số không đổi. 14 Phương sai sai số thay đổi (Heteroscedasticity) Phát hiện phương sai sai số thay đổi (a) Mô hình hồi quy (b) Kiểm định BP 15 Phương sai sai số thay đổi (Heteroscedasticity) Phát hiện phương sai sai số thay đổi Kiểm định White ä Bước 1: Hồi quy mô hình: Y=β1 + β2X2 + β3X3 + u −→ thu được phần dư ei và Yˆ. ä Bước 2: Hồi quy e2i theo các biến độc lập trong mô hình e2i = α1 + α2X2i + α3X3i + α4X 2 2i + α5X 2 3i + α6X2iX3i + vi thu được hệ số xác định R2e . ä Bước 3: Kiểm định cặp giả thuyết H0 : α2 = . . . = α6 = 0 H1 : α22 + · · ·+ α26 , 0. Kết luận dựa vào p − value Ví dụ 2.2 Với số liệu trong ch4bt8.wf1, hãy ước lượng mô hình hồi quy sau: wage = β1 + β2.age+ β3.edu+ u trong đó wage, age và edu lần lượt là lương, tuổi và số năm đi học của người lao động. Sau đó dùng kiểm định BP để kiểm định giả thuyết về phương sai sai số không đổi. 16 Phương sai sai số thay đổi (Heteroscedasticity) Phát hiện phương sai sai số thay đổi (c) Mô hình hồi quy (d) Kiểm định White 17 Phương sai sai số thay đổi (Heteroscedasticity) Khắc phục hiện tượng phương sai sai số thay đổi Khắc phục hiện tượng phương sai sai số thay đổi ä Do mô hình thiếu biến hoặc dạng hàm sai −→ cần xem xét vấn đề thiếu biến hoặc dạng hàm sai. ä Dùng phương pháp bình phương bé nhất tổng quát (GLS-Generalized least squares) Xét mô hình hồi quy: Y = β1 + β2X2 + · · ·+ βkXk + u Giả sử phương sai thay đổi theo dạng: σ2i = σ 2X22i Chia hai vế của phương trình hồi quy cho X2i, ta được: Yi X2i = β1 X2i + β2 + . . .+ βk Xki X2i + ui X2i Y∗i = α1 + α2X ∗ 2i + · · ·+ αkX∗ki + u∗i với Y∗i = Yi X2i ,X∗2i = 1 X2i , . . . ,X∗ ki = XkiX2i , u ∗ i = ui X2i . 3 Thực chất là gán trọng số X2i cho quan sát thứ i −→ phương pháp này còn được gọi là phương pháp ước lượng bình phương bé nhất có trọng số. 3 Nhược điểm: Khi mô hình có nhiều biến, xác định dạng thức của phương sai rất khó −→ không khả khi. 3 Áp dụng kỹ thuật ước lượng sai số chuẩn vững (robust standard error).18 Phương sai sai số thay đổi (Heteroscedasticity) Khắc phục hiện tượng phương sai sai số thay đổi ä Phương pháp sai số chuẩn vững: Vẫn sử dụng UL OLS vì ước lượng chỉ mất hiệu quả nhưng không mất tính vững, nhưng ta sẽ làm cho kiểm định hệ số đáng tin cậy hơn bằng cách tính lại sai số chuẩn của các hệ số hồi quy. Xét mô hình hồi quy đơn: Yi = β1 + β2X2i + ui Ước lượng OLS của β2 là: β̂2 = ∑ xiyi∑ x2 i Khi phương sai của ui thay đổi thì var ( β̂2 ) = ∑ x2i σ 2 i∑ x2 i White đề xuất thay bằng công thức var ( β̂2 ) = ∑ x2i e 2 i∑ x2 i 19 Đa cộng tuyến (Multicollinearity) Bản chất đa cộng tuyến Xét mô hình hồi quy bội Y = β1 + β2X2 + · · ·+ βkXk + αk+1Z+ u. Để có thể thực hiện được các ước lượng OLS, ta cần Giả thiết 4: không có hiện tượng đa cộng tuyến giữa các biến độc lập. Nếu giả thiết này bị vi phạm ta nói mô hình bị đa cộng tuyến. Khi mô hình bị đa cộng tuyến có hai trường hợp: ä Mô hình bị đa cộng tuyến hoàn hảo khi các biến độc lập trong mô hình phụ thuộc tuyến tính lẫn nhau, tức là α1 + α2X2 + α3X3 + · · ·+ αkXk = 0. ä Mô hình bị đa cộng tuyến không hoàn hảo nếu tồn tại λj, j = 1, 2, . . . , k không đồng thời bằng 0, sao cho α1+α2X2+α3X3+ · · ·+αkXk+ v = 0, trong đó v là sai số ngẫu nhiên. Nếu βj , 0 thì hồi quy mô hình Xj theo các biến độc lập còn lại ta có hệ số xác định R2j , khi đó nếu R 2 j ≈ 1 thì mô hình có hiện tượng đa cộng tuyến cao. 20 Đa cộng tuyến (Multicollinearity) Nguyên nhân và hậu quả Nguyên nhân gây ra đa cộng tuyến: 3 Do bản chất mối quan hệ giữa các biến độc lập 3 Tồn tại biến độc lập ít biến thiên 3 Số biến giải thích k khá lớn so với kích thước mẫu 3 Mô hình có dạng đa thức, gồm các biến độc lập X,X2 hay X3 thường có quan hệ tuyến tính khá chặt. Đặc biệt, khi X nhận giá trị trong khoảng nhỏ. 3 Mẫu không mang tính đại diện. Hậu quả của đa cộng tuyến cao ä Mô hình có đa cộng tuyến hoàn hảo −→ không ước lượng được mô hình. ä Mô hình có đa cộng tuyến cao: R2j ≈ 1 −→ var(βˆj) = σ 2 (1−R2j ) n∑ i=1 x2ji ≈ ∞ −→ se(βˆj) rất lớn G Khoảng tin cậy cho βj sẽ rộng −→ ước lượng trở nên kém chính xác. G Hệ số ước lượng βj dễ mất ý nghĩa thống kê. G Dấu của hệ số ước lượng của biến Xj có thể ngược với kỳ vọng G Giá trị của ước lượng của βˆj và se(βˆj) rất nhạy đối với việc tăng hoặc bớt đi một quan sát hay loại bỏ biến có mức ý nghĩa thấp21 Đa cộng tuyến (Multicollinearity) Cách phát hiện đa cộng tuyến cao Cách phát hiện đa cộng tuyến cao ä Căn cứ vào các kết luận của kiểm định t và F: Nếu các kết luận mâu thuẫn với nhau thì đó có thể là dấu hiệu của đa cộng tuyến. ä Căn cứ vào hệ số tương quan của các biến độc lập: Nếu hệ số tương quan cặp giữa hai biến độc lập nào đó lớn (có trị tuyệt đối lớn hơn 0.8) thì có thể xem như mô hình có ĐCT cao. ä Dùng hồi quy phụ 3 Bước 1: Xác định mô hình hồi quy phụ giữa các biến độc lập trong mô hình hồi quy gốc: Hồi quy biến Xj với các biến độc lập còn lại 3 Bước 2: Kiểm định cặp giả thiếtH0 : mô hình không có đa cộng tuyếnH1 : mô hình có đa cộng tuyến 22 Đa cộng tuyến (Multicollinearity) Cách phát hiện đa cộng tuyến cao ä Dùng nhân tử phóng đại phương sai VIF (variance inflation factor) 3 Bước 1: Xác định mô hình hồi quy phụ giữa các biến độc lập trong mô hình hồi quy gốc: Hồi quy biến Xj với các biến độc lập còn lại −→ tìm được R2j . 3 Bước 2: Xác định đại lượng VIF(Xj) = 1 1 − R2 j (j = 2 ÷ k) 3 Nếu VIF(Xj) > 10 thì Xj có thể cộng tuyến với các biến độc lập còn lại. Ví dụ 3.1 Tệp số liệu baitap6_4.wf1 là số liệu về nhập khẩu, GNP và chỉ số giá tiêu dùng (CPI) của Mỹ trong thời kỳ 1970 - 1983: 23 Đa cộng tuyến (Multicollinearity) Cách phát hiện đa cộng tuyến cao Năm Nhập khẩu GNP CPI 1970 39866 992,7 116,3 1971 45579 1077,6 121,3 1972 55797 1185,9 125,3 1973 70499 1326,4 133,1 1974 103811 1434,2 147,7 1975 98185 1549,2 161,2 1976 124228 1718 170,5 1977 151907 1918,3 181,5 1978 176010 2163,9 195,4 1979 212028 2417,8 217,4 1980 249781 2631,7 246,8 1981 265086 2,958 272,4 1982 247667 3,069 289,1 1983 261312 3304,8 298,4 a) Dùng số liệu cho trong bảng để ước lượng mô hình: ln (nhập khẩu)t = β1 + β2 ln (GNP)t + β3 ln (CPI)t + ut 24 Đa cộng tuyến (Multicollinearity) Cách phát hiện đa cộng tuyến cao b) Bạn có nghi ngờ có đa cộng tuyến trong số liệu hay không? c) Ước lượng các hàm hồi quy: ln (nhập khẩu)t = α1 + α2 ln (GNP)t + ut ln (nhập khẩu)t = λ1 + λ2 ln (CPI)t + ut ln (GNP)t = γ1 + γ2 ln (CPI)t + ut Dựa vào các hàm hồi quy này, bạn có thể nói gì về bản chất của đa cộng tuyến trong số liệu? 25 Đa cộng tuyến (Multicollinearity) Cách phát hiện đa cộng tuyến cao 26 Đa cộng tuyến (Multicollinearity) Cách phát hiện đa cộng tuyến cao (e) Chỉ tác động lên hệ số chặn (f) Chỉ tác động lên lên hệ số góc (g) Tác động lên cả hai hệ số 27 Đa cộng tuyến (Multicollinearity) Cách phát hiện đa cộng tuyến cao (h) (i) 28 Đa cộng tuyến (Multicollinearity) Khắc phục hiện tượng đa cộng tuyến 3 Nếu mục đích của phân tích hồi quy là dự báo thì trong một số trường hợp ta không cần khắc phục đa cộng tuyến. 3 Nếu biến bị đa cộng tuyến cao βˆj có se(βˆj) là không quá lớn so với βj làm cho Xj có ý nghĩa thống kê và không bị đổi dấu, các hậu quả trên không xảy ra thì ta không bận tâm đến đa cộng tuyến nữa. 3 Nếu mô hình với 3 biến độc lập X2,X3,X4 có X2, và X3 tương quan tuyến tính chặt với nhau, X4 không có quan hệ tuyến tính chặt với X2,X3. Mặt khác mối quan tâm chính trong phân tích hồi quy là đánh giá tác động của X4 lên biến phụ thuộc thì việc có đa cộng tuyến cao cũng không làm ảnh hưởng đến chất lượng phân tích của mô hình. Khắc phục đa cộng tuyến ä Thu thập thêm số liệu hoặc lấy mẫu mới. ä Bỏ bớt biến độc lập ra khỏi mô hình nếu có thể. ä Sử dụng thông tin tiên nghiệm. ä Đổi dạng hàm: hồi quy đa thức, sử dụng sai phân cấp 1, phân tích nhân tố,. . . 29 Sai số ngẫu nhiên không tuân theo quy luật chuẩn Hậu quả 3 Các thống kê t và F không tuân theo quy luật Student và quy luật Fisher. 3 Nếu kích thước mẫu nhỏ thì các suy diễn thống kê không đáng tin cậy. ä Xem xét đồ thị phần dư. ä Kiểm định Jacque - Bera (JB) Xét mô hình Y = β1 + β2X2 + · · ·+ βkXk + u. Kiểm định cặp giả thuyết H0 : ui có phân phối chuẩn;H1 : ui không có phân phối chuẩn 3 Ước lượng mô hình hồi quy −→ thu được ei. 3 Tìm hệ số bất đối xứng (Skewness) S = ∑ e3i /n ( ∑ e2i /n) 3/2 và hệ số nhọn (Kurtoris) K = ∑ e4i /n ( ∑ e2i /n) 2 của các phần dư ei. 3 Tính giá trị quan sát của tiêu chuẩn kiểm định JB = χ2 = n[ S2 6 + K2 24 ]. 3 Nếu JB > χ2α(2) thì bác bỏ H0. 30 Sai số ngẫu nhiên không tuân theo quy luật chuẩn Ví dụ 4.1 Sử dụng số liệu trong workfile ch1-5vidu/salary để hồi quy mô hình sau: TN = β1 + β2KN+ u Hướng dẫn: Trên cửa sổ màn hình Equation, ta chọn: View/Residual Diagnostics/Histogram - Normality Test31
File đính kèm:
- bai_giang_kinh_te_luong_chuong_6_kiem_dinh_mo_hinh.pdf