Xử lý dữ liệu với SPSS - Hồ Thanh Trí
Tóm tắt Xử lý dữ liệu với SPSS - Hồ Thanh Trí: ...2007), đã nhận diện có tám yếu tố ảnh hưởng đến nghèo. Nghề nghiệp, tình trạng việc làm Trình độ học vấn Giới tình chủ hộ Quy mô hộ Số người sống phụ thuộc Quy mô diện tích đất của hộ gia đình Quy mô vốn vay từ định chế chính thức Khả năng tiếp cận cơ sở hạ tầng CƠ SỞ LÝ TH...ng là 86%. Còn 50 hộ nghèo, mô hình dự đoán sai 18 hộ, tỷ lệ đúng là 60,4%. Do đó tỷ lệ dự báo đúng của toàn bộ mô hình là 78,6%. - Mức độ phù hợp của mô hình Kiểm định Omnibus đối với các hệ số của mô hình (Omnibus Tests of Model Coefficients) Omnibus Tests of Model Coefficients Chi-...2LL 67.96% 74.69% McFadden R-squared 38.64% 17.51% Likelihood ratio 33.98% 37.35% Nhận xét chung Cả hai mô hình đều có độ phù hợp tổng quát với mức ý nghĩa quan sát (Sig. OB = 0.00 < α). Độ chính xác của kết quả dự báo của hai mô hình rất cao lần lượt là: 94.40%, 90.60%. Giá trị “...
82 hộ gia đình ở An Giang trong năm 2008, hàm hồi quy Binary Logistic về các yếu tố ảnh hưởng đến nghèo như sau: Mô hình định lượng Bảng 1: Giải thích các biến trong mô hình Biến phụ thuộc Tên biến Giải thích nội dung biến Nguồn số liệu Kỳ vọng dấu hệ số hồi quy DANGHO Biến giả (dummy), nhận giá trị 1 nếu hộ thuộc diện nghèo và nhận giá trị 0 nếu hộ thuộc diện không nghèo Điều tra BIẾN ĐỘC LẬP Tên biến Giải thích nội dung biến Nguồn số liệu Kỳ vọng dấu hệ số hồi quy DTOC Biến giả, nhận giá trị 1 nếu hộ là người Khmer và nhận giá trị 0 nếu hộ là người Kinh Hoa. Điều tra + GTINH Biến giả, nhận giá trị 1 nếu chủ hộ thuộc giới nam và nhận giá trị 0 cho trường hợp thuộc giới nữ. Điều tra - HOCVAN Số năm đi học của chủ hộ Điều tra - PTHUOC Tổng số người trên 15 tuổi mà không tạo ra được thu nhập trong hộ gia đình. + NGHE Biến giả, nhận giá trị 0 nếu chủ hộ làm việc liên quan tới nghề nông hay nhận giá trị 1 nếu chủ hộ làm việc trong các ngành phi nông nghiệp. - KCACH Số Km từ nhà hộ gia đình đến chợ mà người dân có thể mua bán. + DUONGOTO Biến giả, nhận giá trị 1 nếu hộ có đường ô tô đến tận nhà và nhận giá trị 0 nếu hộ không có đường ô tô đến nhà. - LAMXA Biến giả, nhận giá trị 1 nếu hộ có người đi làm xa và nhận giá trị 0 nếu hộ không có người đi làm xa. - DTICH Diện tích đất mà hộ gia đình canh tác (1000 m2) - COVAY Biến giả, nhận giá trị 1 nếu hộ có vay và nhận giá trị 0 nếu hộ không có vay từ các tổ chức tín dụng chính thức - PHÂN TÍCH MÔ HÌNH DỰA TRÊN CHƯƠNG TRÌNH SPSS Dữ liệu và nhập vào SPSS Số liệu điều tra 182 hộ gia đình ở An Giang năm 2008 (Phụ lục 3.1.1) Sử dụng chương trình SPSS 18.0 Vào giao diện SPSS/Nhập dữ liệu vào SPSS. Kết quả như sau: Nhập dự liệu vào mô hình hồi quy Binary Logistic Analyze/ Regression/ Binary Logistic, sẽ xuất hiện hộp thoại Đưa biến DANGHO vào hộp thoại Dependent (biến phụ thuộc). Đưa các biến còn lại vào Covariates (biến độc lập). Chọn hộp thoại Save. Kết quả như sau: Chọn các bảng số liệu cần thiết, Copy và Paste qua giao diện Excel hoặc World để phân tích 1. Phân tích các kiểm định. Kiểm định hệ số hồi quy Phân tích hồi quy Binary Logistic Các biến trong mô hình (Variables in the Equation) B S.E. Wald df Sig. Exp(B) 95% C.I.for EXP(B) Lower Upper Step 1a DANTOC 1.528 .580 6.952 1 .008 4.609 1.480 14.352 GIOITINH -.558 .492 1.286 1 .257 .572 .218 1.502 HOCVAN -.326 .099 10.739 1 .001 .722 .594 .877 PHUTHUOC .227 .241 .888 1 .346 1.255 .783 2.012 NGHE -1.951 .669 8.493 1 .004 .142 .038 .528 KCACH .188 .166 1.276 1 .259 1.206 .871 1.670 DUONG -1.368 .516 7.025 1 .008 .255 .093 .700 LAMXA -1.689 1.019 2.746 1 .097 .185 .025 1.361 DIENTICH .015 .028 .275 1 .600 1.015 .961 1.071 COVAY -2.238 .594 14.195 1 .000 .107 .033 .342 Constant .798 .644 1.536 1 .215 2.222 a. Variable(s) entered on step 1: DANTOC, GIOITINH, HOCVAN, PHUTHUOC, NGHE, KCACH, DUONG, LAMXA, DIENTICH, COVAY. Biến DANTOC có Sig = 0,008 < 0,01. Do đó, biến DANTOC tương quan có ý nghĩa với biến DANGHO với độ tin cậy 99%. Biến GIOITINH có Sig = 0,257 > 0,05. Do đó, biến GIOITINH tương quan không có ý nghĩa với biến DANGHO với độ tin cậy 95%. . Kiểm định mức độ phù hợp của mô hình. Phân loại dự báo (Classification Table) Classification Table a Observed Predicted Hộ nghèo và không nghèo Percentage Correct không nghèo nghèo Step 1 Hộ nghèo và không nghèo không nghèo 111 18 86.0 nghèo 21 32 60.4 Overall Percentage 78.6 Với 132 hộ không nghèo (xem theo cột) mô hình dự đoán đúng 111 hộ (xem theo hàng), vậy tỷ lệ đúng là 86%. Còn 50 hộ nghèo, mô hình dự đoán sai 18 hộ, tỷ lệ đúng là 60,4%. Do đó tỷ lệ dự báo đúng của toàn bộ mô hình là 78,6%. - Mức độ phù hợp của mô hình Kiểm định Omnibus đối với các hệ số của mô hình (Omnibus Tests of Model Coefficients) Omnibus Tests of Model Coefficients Chi-square df Sig. Step 1 Step 86.154 10 .000 Block 86.154 10 .000 Model 86.154 10 .000 Kiểm định Omnibus cho thấy Sig < 0,01 (độ tin cậy 99%). Như vậy các biến độc lập có quan hệ tuyến tính với biến phụ thuộc trong tổng thể. Nói cách khác, mô hình lựa chọn là phù hợp tốt. Thông qua các kiểm định, có thể khẳng định: Các yếu tố ảnh hưởng đến nghèo theo thứ tự tầm quan trọng là thành phần dân tộc, vay tiền từ định chế tín dụng chính thức, nhà gần đường ô tô, làm việc ở khu vực phi nông nghiệp và trình độ văn hóa của chủ hộ. Gợi ý chính sách: Cần có chính sách giảm nghèo riêng cho người dân tộc thiểu số. Phát triển ngành nghề dịch vụ ở nông thôn. Mở rộng hoạt động tín dụng cho người nghèo. Phát triển cơ sở hạ tầng nông thôn, nhất là đường nông thôn. Nâng cao trình độ văn hóa cho người dân nông thôn. Kết luận: Vận dụng mô hình hồi quy Binary Logistic phân tích các nhân tố ảnh hưởng đến quyết định cho vay của ngân hàng thương mại cổ phần.chi nhánh Đề tài gợi ý 1. Lựa chọn biến số Với mô hình hồi quy Binary Logistic cần phải xác định biến nào là biến độc lập và biến phụ thuộc. Các biến được lựa chọn như sau: a)Biến phụ thuộc Trong nghiên cứu này biến phụ thuộc (Y) được lựa chọn như sau Y = 1 nếu KH có khả năng đảm bảo trả nợ Y = 0 nếu KH không có khả năng trả được toàn bộ nợ b)Biến độc lập Đề tài: Xây dựng mô hình logistic về khả năng trả nợ của khách hàng. NC trường hợp ngân hàng. Bảng 2.10: Biến độc lập sử dụng trong nghiên cứu STT Chỉ tiêu Thang đo Giả thiết Ký hiệu 1 Giới tính 1: Nam – 0: Nữ +/- Gioitinh 2 Tuổi Tuổi - Tuoi 3 Trình độ học vấn 1: Dưới TH 2: TH 3: ĐH 4: Trên ĐH +/- TĐHV 4 Tính chất công việc 1: Cấp quản lý 2: Cấp chuyên viên, kinh doanh có đăng ký 3: Lao động được đào tạo, công nhân, kinh doanh tự do 4: Lao động thời vụ, thất nghiệp, nghỉ hưu +/- TCCV 5 Tình trạng hôn nhân 1: Kết hôn – 0: độc thân - Honnhan 6 Tình trạng nhà ở 1: Sở hữu riêng 2: Sống chung với cha mẹ 3: Thuê - TTNO 7 Thời gian làm công việc hiện tại Tháng + Thoigianlamviec 8 Số người phụ thuộc Người - Songuoiphuthuoc 9 Lịch sử tín dụng 1: Có nợ – 0: Không có thông tin - LichsuTD 10 Số dịch vụ sử dụng Số dịch vụ + Sodichvu 11 Thu nhập hàng tháng Triệu đồng + Thunhap 12 Tiết kiệm hàng tháng Triệu đồng + Tietkiem 13 Số tiền vay Triệu đồng - Tienvay 14 Giá trị tài sản đảm bảo Triệu đồng + Taisan 2. Phân tích thống kê mô tả (Nguồn: Số liệu tính toán từ dữ liệu của Ngân hàng TMCP Sài Gòn) Với bảng 2.11, số liệu khách hàng không có khả năng trả nợ là 19,38% và 80,62% khách hàng có đủ khả năng trả nợ. Ngoài ra, đề tài cũng thống kê mô tả toàn bộ dữ liệu và cho ra các thông số sau: Bảng 2.11: Phân loại khách hàng theo khả năng trả nợ Nhóm (Y) Số lượng Tỷ trọng 0 31 19,38% 1 129 80,62% Tổng 160 100% Bảng 2.12: Số liệu thống kê mô tả mẫu nghiên cứu Biến độc lập Trung bình Mode Độ lệch Maximum Minimum Giới tính 0.49 0.00 0.50 0.00 1.00 Tuổi 44.99 43a 10.65 24.00 77.00 Trình độ học vấn 2.24 2.00 0.69 1.00 4.00 Tính chất công việc 2.33 2.00 0.78 1.00 4.00 Tình trạng hôn nhân 0.86 1.00 0.35 0.00 1.00 Tình trạng nhà ở 1.18 1.00 0.50 1.00 3.00 Thời gian làm việc 70.66 61.00 44.75 6.00 395.00 Số người phụ thuộc 1.06 0.00 0.99 0.00 3.00 Lịch sử tín dụng 0.49 0.00 0.50 0.00 1.00 Số dịch vụ đang sử dụng 0.77 1.00 0.55 0.00 2.00 Thu nhập hàng tháng 21.48 8.00 27.60 4.00 225.00 Tiết kiệm hàng tháng 15.80 4.00 26.13 1.50 215.00 Số tiền vay 473.97 100.00 865.73 30.00 6000.00 Giá trị tài sản 1343.91 160.00 1709.50 82.98 9446.08 Tỷ lệ nợ trên tổng tài sản 0.36 0.5000a 0.20 0.03 0.70 3. Phân tích tương quan Xem xét mối tương quan của các biến (định lượng) đưa vào mô hình. Nếu hệ số tương quan cặp > 0.8 thì sẽ dẫn đến hiện tượng đa cộng tuyến nếu đưa các biến này vào mô hình. Bảng 2.13: Hệ số tương quan cặp các biến định lượng đưa vào mô hình Tuổi Thời gian làm việc Thu nhập hàng tháng Tiết kiệm hàng tháng Số tiền vay Giá trị tài sản Tỷ lệ nợ trên tổng tài sản Tuổi Hệ số tương quan cặp 1 Sig. (2-tailed) Thời gian làm việc Hệ số tương quan cặp 0.324** 1 Sig. (2-tailed) 0.000 Thu nhập hàng tháng Hệ số tương quan cặp -0.003 0.050 1 Sig. (2-tailed) 0.973 0.528 Tiết kiệm hàng tháng Hệ số tương quan cặp -0.015 0.037 0.994** 1 Sig. (2-tailed) 0.854 0.643 0.000 Số tiền vay Hệ số tương quan cặp -0.055 0.052 0.498** 0.461** 1 Sig. (2-tailed) 0.487 0.515 0.000 0.000 Giá trị tài sản Hệ số tương quan cặp 0.064 -0.038 0.409** 0.382** 0.751** 1 Sig. (2-tailed) 0.424 0.636 0.000 0.000 0.000 Tỷ lệ nợ trên tổng tài sản Hệ số tương quan cặp -0.238** 0.119 0.373** 0.351** 0.428** 0.013 1 Sig. (2-tailed) 0.002 0.133 0.000 0.000 0.000 0.874 Theo kết quả bảng 2.13 thể hiện 2 biến thu nhập hàng tháng và tiết kiệm có sự tương quan chặt với nhau (hệ số tương quan = 0.994 > 0.8). Điều này cho thấy nếu cùng đưa 2 biến này vào mô hình thì sẽ xảy ra hiện tượng đa cộng tuyến. Tuy nhiên, theo Ramanathan (2003), đa cộng tuyến có thể không ảnh hưởng đến khả năng dự báo của mô hình và thậm chí có thể cải thiện khả năng dự báo. Có 2 cách xử lý vấn đề này là vẫn đưa biến vào mô hình để tăng khả năng dự báo hoặc loại bỏ 1 trong 2 biến trên. 4. Ước lượng mô hình hồi quy Mô hình 1: Sử dụng phần mềm thống kê SPSS với phương pháp Enter, đưa tất cả 15 biến vào mô hình, ta được mô hình 1. Mô hình 2: được ước lượng bằng cách loại bỏ những biến có mức ý nghĩa Sig > 0.25 (mức ý nghĩa dành cho mô hình dự báo) từ mô hình 1. Bảng 2.14: Kết quả ước lượng hồi quy Binary Logistic của các mô hình Biến Giả thiết Mô hình 1 Mô hình 2 β Sig. β Sig. Gioitinh +/- 0.704 0.348 Tuoi - 0.084 0.079 0.097 0.020 TĐHV +/- -1.277 0.089 TCCV +/- -1.993 0.008 -1.259 0.017 Honnhan - 2.683 0.024 1.909 0.032 TTNO - -0.260 0.740 Thoigianlamviec + -0.023 0.065 -0.020 0.047 Songuoiphuthuoc - -0.690 0.129 LichsuTD - -0.483 0.526 Sodichvu + 1.449 0.018 1.138 0.033 Thunhap + 0.672 0.050 0.585 0.000 Tietkiem + -0.141 0.744 Tienvay - -0.014 0.000 -0.013 0.000 Taisan + 0.004 0.002 0.003 0.007 TLNTTS - 10.727 0.002 8.193 0.006 Constant -4.568 0.217 -8.739 0.001 OB 0.000 0.000 Độ chính xác 94.40% 90.60% - 2LL 67.96% 74.69% McFadden R-squared 38.64% 17.51% Likelihood ratio 33.98% 37.35% Nhận xét chung Cả hai mô hình đều có độ phù hợp tổng quát với mức ý nghĩa quan sát (Sig. OB = 0.00 < α). Độ chính xác của kết quả dự báo của hai mô hình rất cao lần lượt là: 94.40%, 90.60%. Giá trị “McFadden R-squared” từ ước lượng hồi quy Binary Logistic của hai mô hình lần lượt là: 38.64%, 17.51% sự biến động của xác suất trả được nợ của khách hàng. Về kiểm định -2LL không cao lắm, điều này thể hiện một độ phù hợp khá tốt của mô hình tổng thể. 5. Đề xuất mô hình xếp hạng tín dụng cá nhân cho Ngân hàng TMCP Sài Gòn Mô hình 2 đảm bảo tất cả các hệ số hồi quy tìm được trong mô hình đều có ý nghĩa. Trong mô hình cũng không có hiện tượng đa cộng tuyến giữa biến thunhap và tietkiem (đã loại này ra khỏi mô hình 1 do biến tietkiem không có ý nghĩa thống kê vì có số Sig lớn 0.744). Ta có thể nhận thấy về chỉ tiêu thống kê về mức độ phù hợp mô hình, mức độ chính xác của dự báo thì mô hình 2 là vượt trội nhất, thích hợp cho mô hình XHTD. Vì vậy, tác giả xin đề xuất mô hình 2 là mô hình XHTD cá nhân cho Ngân hàng TMCP Sài Gòn. Tiến hành phân tích và nhận xét mô hình 2: Độ phù hợp mô hình 2: Kết quả kiểm định giả thuyết về độ phù hợp tổng quát ở Bảng 2.15 có mức ý nghĩa quan sát (Sig. OB = 0.00 < α) nên an toàn ta có thể bác bỏ giả thuyết: H0: β2 = β2 = β4 = β5 = β7 = β10 = β11 = β12 = β13 = β14 = β15 = 0 Bảng 2.15: Omnibus Tests of Model Coefficients Chi-square df Sig. Step 1 Step 82.629 9 0.000 Block 82.629 9 0.000 Model 82.629 9 0.000 Bảng 2.16 cho thấy giá trị của – 2LL = 74.668 không cao lắm, như vậy nó thể hiện một độ phù hợp khá tốt của mô hình tổng thể. Bảng 2.16: Model Summary Step -2 Log likelihood Cox & Snell R Square Nagelkerke R Square 1 74.688a 0.403 0.644 a. Estimation terminated at iteration number 9 because parameter estimates changed by less than .001. Mức độ chính xác của dự báo Mức độ chính xác của dự báo được thể hiện qua bảng Classification Table (Bảng 2.17) Bảng này cho thấy trong 26 trường hợp thực tế là không trả được nợ mô hình đã dự đoán trúng 21 trường hợp, tỷ lệ trúng là 67.7%. Còn 134 trường hợp thưc tế có trả được nợ mô hình dự đoán sai 10 trường hợp, tỷ lệ trúng là 96.1%. Từ đó ta tính được tỷ lệ dự đoán đúng toàn bộ mô hình là 90.6% Bảng 2.17: Classification Tablea Observed Predicted Khả năng trả nợ Percentage CorrectKhông có khả năng trả nợ Có khả năng trả nợ Step 1 Khả năng trả nợ Không có khả năng trả nợ 21 10 67.7 Có khả năng trả nợ 5 124 96.1 Overall Percentage 90.6 a. The cut value is .500 Kiểm định ý nghĩa của các hệ số hồi quy tổng thể Bảng 2.18: Variables in the Equation B S.E. Wald df Sig. Step 1a Gioitinh .704 .750 .880 1 .348 Tuoi .084 .048 3.084 1 .079 TĐHV -1.277 .751 2.890 1 .089 TCCV -1.993 .745 7.149 1 .008 Honnhan 2.683 1.189 5.095 1 .024 TTNO -.260 .786 .110 1 .740 Thoigianlamviec -.023 .013 3.407 1 .065 Songuoiphuthuoc -.690 .455 2.302 1 .129 LichsuTD -.483 .762 .402 1 .526 Sodichvu 1.449 .610 5.641 1 .018 Thunhap .672 .343 3.834 1 .050 Tietkiem -.141 .431 .106 1 .744 Tienvay -.014 .003 17.191 1 .000 Taisan .004 .001 9.589 1 .002 TLNTTS 10.727 3.540 9.181 1 .002 Kiểm định Wald về ý nghĩa cũa hệ số hồi quy tổng thể của các biến tuổi, tính chất công việc, hôn nhân, thời gian làm việc, số dịch vụ, thu nhập, tiền vay, tài sản, tỷ lệ dư nợ vay trên tổng giá trị tài sản đều có mức ý nghĩa sig. nhỏ hơn 0.05 nên ta an toàn bác bỏ giả thuyết H0: β2 = β2 = β4 = β5 = β7 = β10 = β11 = β12 = β13 = β14 = β15 = 0 Như vậy, các hệ số hồi quy tìm được có ý nghĩa và mô hình đưa ra sử dụng tốt. Từ các hệ số hồi quy này ta viết được phương trình Log e [ 𝑃 ( 𝑌 = 1) 𝑃 ( 𝑌=0 ) ] = - 8.793 + 0.097 tuoi – 1.259 TCCV + 1.259 honnhan – 0.020 thoigianlamviec + 1.138 sodichvu + 0.585 thunhap – 0.013 tienvay + 0.003 taisan + 8.193 TLNTTS. (1.1) Có thể diễn dịch ý nghĩa của các hệ số hồi quy Binary Logistic là: Hệ số hồi quy Tuổi (Tuoi): khi hệ số Tuổi làm tăng khả năng trả nợ của khách hàng. Điều này có thể lý giải trong thực tế là các ngân hàng e ngại cho những khách hàng trẻ vay sợ rủi ro, cho các khách hàng lớn tuổi vay ít rủi ro hơn. Tính chất công việc (TCCV): khi hệ số tính chất công việc càng lớn (khách hàng không có khả năng trả nợ càng cao. Trên thực tế, biến tính chất công việc tác giả phân loại thành 4 nhóm: Cấp quản lý; cấp chuyên viên hay kinh doanh có đăng ký; lao động được đào tạo, công nhân, kinh doanh tự do; lao động thời vụ, thất nghiệp, nghỉ hưu. Điều này cho thấy rằng những khách hàng càng có địa vị, chức vụ hay những khách hàng kinh doanh có đăng ký thì thường có một công việc cũng như mức thu nhập ổn định và có khả năng trả nợ cao hơn hai nhóm tính chất công việc còn lại. Tình trạng hôn nhân (Honnhan): kết quả kiểm định mô hình cho thấy các khách hàng đã lập gia đình có ít rủi ro và có nhiều uy tín tín dụng, vì họ có trách nhiệm hơn người độc thân. Một yếu tố khác có thể làm cho những người đã lập gia đình có nhiều uy tín tín dụng hơn là thu nhập gấp đôi. Thời gian làm công việc hiện tại (Thoigianlamviec): hệ số thời gian làm việc càng cao càng có khả năng trả nợ. Khi có thâm niên công việc hiện tại, thì thường có thu nhập cao hơn. Số dịch vụ đang sử dụng (Sodichvu): khách hàng càng sử dụng nhiều dịch vụ của ngân hàng chứng tỏ khách hàng có mối quan hệ thân thiết và uy tín với ngân hàng. Thu nhập hàng tháng (Thunhap): hệ số thu nhập càng cao khả năng trả nợ càng cao và tăng theo tỷ lệ tương ứng với mức thu nhập. Thu nhập thường được sử dụng đại diện cho sự giàu có về tài chính và khả năng trả nợ của người vay (Đinh & Kleimeier, 2007). Số tiền vay (Tienvay): khi khoản vay càng tăng, khả năng trả nợ của khách sẽ giảm. Giá trị tài sản (Taisan): tài sản thế chấp là một hình thức đảm bảo cho khoản vay của khách hàng. Đặc biệt, đối với các khoản vay sử dụng tài sản thế chấp là nhà ở, xác suất không trả nợ là rất thấp vì do người đi vay không muốn mất nhà của họ và đồng thời tài sản thế chấp này cũng làm giảm rủi ro của ngân hàng. Giá trị tài sản thế chấp cũng có thể nói lên sự giàu có về tài chính của khách hàng vì nó có mối tương quan đáng kể với thu nhập của khách hàng vay (Đinh & Kleimeier, 2007). Tỷ lệ nợ trên tổng tài sản (TLNTTS): kết quả kiểm định mô hình cho thấy tỷ lệ nợ trên tổng tài sản càng cao khả năng trả nợ càng cao (trái dấu với giả thuyết). Điều này có thể giải thích, giá trị tài sản thế chấp có thể nói lên sự giàu có về tài chính của khách hàng vì nó có mối tương quan đáng kể với thu nhập của khách hàng vay (Đinh & Kleimeier, 2007) nên những khách hàng có giá trị tài sản thế chấp và mức thu nhập càng cao thì nhu cầu chi tiêu tiêu dùng trong đời sống xã hội càng cao nên họ thường vay ngân hàng với số tiền vay lớn cho các mục đích tiêu dùng khác nhau (sửa chữa, mua nhà, mua ôtô, bổ sung vốn kinh doanh.), làm cho tỷ lệ nợ trên tổng tài sản càng cao. Tổng giá trị tài sản càng cao thì người vay càng có trách nhiệm với khoản vay của mình và thiện chí trả nợ cũng sẽ cao hơn. Ta có thể hoàn thiện hệ thống đánh giá xếp hạng tín dụng cá nhân dựa trên dự đoán xác suất được thực hiện thông qua hàm hồi quy Binary Logistic ước lượng từ mẫu trên. Năm hạng mức tín nhiệm cũng được đưa ra A, A1, B, B1, C dựa trên 5 loại khách hàng mà ngân hàng TMCP Sài Gòn đang áp dụng, tương ứng với xác suất trả nợ theo bảng sau: Bảng 2.19: Tiêu chuẩn phân bổ cá thể theo mức rủi ro Loại hiện tại Xếp hạng tín nhiệm Xác suất trả nợ (%) Mức độ rủi ro 1 A 91 – 100 Rất thấp 2 A1 90 – 75 Thấp 3 B 74 – 65 Trung Bình 4 B1 64 – 35 Cao 5 C 34 – 0 Rất cao Ví dụ: Chấm điểm xếp hạng tín dụng cá nhân Khách hàng Nguyễn Văn A (Kết quả xếp hạng A1, điểm tín dụng 315 điểm) Vận dụng mô hình Binary Logistic cho mục đích dự báo Bảng 2.20: Thông tin xếp hạng khách hàng Nguyễn Văn A Chỉ tiêu Thông tin Hệ số Hằng số Tuổi 42 0.097 -8.739 Tính chất công việc 2 -1.259 Hôn nhân 1 1.909 Thời gian làm việc 125 -0.02 Số dịch vụ 1 1.138 Thu nhập 11 0.585 Tiền vay 173 -0.013 Tài sản 709 0.003 Tỷ lệ nợ trên tổng tài sản 0.2434 8.193 Xác suất trả nợ của khách hàng Nguyễn Văn A là: E(Y/X)= 𝑒−8.739+0.097∗42−1.259∗2+1.909∗1−0.02∗125+1.138∗1+0.585∗11−0.013∗173+0.003∗709+8.193∗0.2434 1+𝑒−8.739+0.097∗42−1.259∗2+1.909∗1−0.02∗125+1.138∗1+0.585∗11−0.013∗173+0.003∗709+8.193∗0.2434 = 5.318 1+5.318 = 0.8417 Như vậy, mô hình Binary Logistic dự đoán khả năng trả nợ của khách hàng Nguyễn Văn A là 84.17%. Theo quy định trong bảng 2.18 thì xác suất trả nợ của khách hàng tương ứng với mức rủi ro A1 phù hợp với mức xếp hạng trong dữ liệu. Như vậy, khi ngân hàng cho khách hàng Nguyễn Văn A vay thì khả năng thu hồi nợ cao. Khách hàng Nguyễn Thị B (Kết quả xếp hạng B, điểm tín dụng 285 điểm) Xác suất trả nợ của khách hàng Nguyễn Thị B là: E(Y/X) = 𝑒−8.739+0.097∗48−1.259∗3+1.909∗1−0.02∗128+1.138∗1+0.585∗8−0.013∗60+0.003∗130+8.193∗0.4604 1+𝑒−8.739+0.097∗48−1.259∗3+1.909∗1−0.02∗128+1.138∗1+0.585∗8−0.013∗60+0.003∗130+8.193∗0.4604 = 1.992 1+1.992 = 0.6658 Bảng 2.21: Thông tin xếp hạng khách hàng Nguyễn Thị B Chỉ tiêu Thông tin Hệ số Hằng số Tuổi 48 0.097 -8.739 Tính chất công việc 3 -1.259 Hôn nhân 1 1.909 Thời gian làm việc 128 -0.02 Số dịch vụ 1 1.138 Thu nhập 8 0.585 Tiền vay 60 -0.013 Tài sản 130 0.003 Tỷ lệ nợ trên tổng tài sản 0.4604 8.193 Như vậy, mô hình Binary Logistic dự đoán khả năng trả nợ của khách hàng Nguyễn Văn A là 66.58%. Theo quy định trong bảng 2.18 thì xác suất trả nợ của khách hàng tương ứng với mức rủi ro B phù hợp với mức xếp hạng trong dữ liệu. Như vậy, khi ngân hàng cho khách hàng Nguyễn Văn A vay thì khả năng thu hồi nợ cao. THANKS
File đính kèm:
- xu_ly_du_lieu_voi_spss_ho_thanh_tri.pdf