Bài giảng Thống kê thực hành - Chương 1: Những vấn đề cơ bản của thống kê thực hành
Tóm tắt Bài giảng Thống kê thực hành - Chương 1: Những vấn đề cơ bản của thống kê thực hành: ... quát tiếp cận kiểm định sự phù hợp của các phân phối thực nghiệm với công cụ kiểm định Khi bình phương. Cùng một số biến dạng của kiểm định nàyKỹ năng sử dụng các kiểm định dấu và lớp các bài toán sử dụng kiểm định dấu.Một số tiêu chuẩn kiểm định các qui luật phân phối...ng ngôn ngữ ma trận là cơ sở cho việc thiết lập mô hình phân tích thành phần chính qua phép chiếu trong không gian tuyến tínhBài toán phân tích thành phần chính có mục đích rút gọn số liệu và trực giao hóa các thông tin về các cá thể trong tổng thể. Việc lựa chọn ma trận phân tích (ma trận tương qua... hỗ trợ bài toán cũng như mô tả kết quả thuận lợi cho phân tích.CHƯƠNG 10 PHÂN TÍCH TƯƠNG QUAN CHÍNH TẮC10.1. Phân tích tương quan chính tắc với hai nhóm biến10.1.1. Bài toán phân tích chính tắc với hai nhóm biến10.1.2. Mô tả ma trận và lời giải của bài toán10.1.3. Giải thích hình học lời giải của b...
CHƯƠNG 1NHỮNG VẤN ĐỀ CƠ BẢN CỦA THỐNG KÊ THỰC HÀNH1.1. Khoa học thống kê và các phương pháp toán học1.2. Những vấn đề cơ bản của thống kê thực hành1.3. Mô hình hoá toán học và lựa chọn phương pháp phân tíchCHƯƠNG 2 PHƯƠNG PHÁP MẪU VÀ LÝ THUYẾT ĐIỀU TRA CHỌN MẪU2.1. Sơ lược về phương pháp mẫu2.2. Những vấn đề cơ bản của điều tra chọn mẫu2.3. Các phương pháp chọn mẫu2.4.Các phương pháp chọn mẫu khác2.5. Sơ lược về lý thuyết bảng hỏiTóm tắt chươngNội dung và kỹ năng - Cơ sở nào để có thể sử dụng các số liệu quan sát về một đại lượng biến đổi để suy đoán về các đặc trưng của đại lượng đó. - Các đặc trưng mẫu của các biến trong tổng thể hữu hạn khác gì với trường hợp tổng thể vô hạn. Khi thực hành việc ước lượng, kiểm định giả thuyết có thể hiệu chỉnh như thế nào? - Đối với mẫu phân cấp việc ước lượng các đặc trưng có thể tiến hành như thế nào? ý nghĩa của ước lượng theo tỷ lệ bộ phận tối ưu là gì? - Các phương pháp chọn mẫu đòi hỏi tuân theo nguyên tắc nào? tại sao? - Các cách lấy mẫu khác nhau được sử dụng trong các trường hợp khác nhau như thế nào? - Làm thế nào để tính toán được các kích thước mẫu, kích thước mẫu bộ phận và cơ cấu của mẫu khi đã xác định mẫu toàn bộ? - Một số cách xác định kích thước mẫu thông dụng - Bảng hỏi và phân loại bảng hỏi. Những nguyên tắc cơ bản thiết lập bảng hỏi - Các loại câu hỏi và thang đo các biến tương ứng.CHƯƠNG 3. THỐNG KÊ MÔ TẢ3.1. Mô tả thống kê với 1 biến3.2. Mô tả đồng thời và mô tả nhóm3.3. Mô tả thống kê nhờ các biểu đồ và đồ thị3.4. Kiểm tra, đánh giá và làm sạch số liệu mẫuPhụ lục 1: Sơ lược về SPSS và STATA1. Stata với mô tả thống kê2. SPSS với mô tả thống kêTóm tắt chươngVới các đặc trưng thống kê từ mẫu có thể tiến hành các phân tích sơ bộ để phát hiện tình trạng của biến. Kết hợp mô tả các đặc trưng trong nghiên cứu thống kê.Mô tả thống kê cho phép kiểm tra tính chất của dữ liệu cũng như các quan hệ của các biến thể hiện qua dữ liệu quan sát được.Kỹ thuật sử dụng các mô tả phân nhóm trong phân tích thống kê bao hàm cả việc mô tả gộp và chi tiết có thể được hỗ trợ bởi các phần mềm chuyên dụng.Lựa chọn công cụ mô tả phù hợp nhất là các dạng biểu đồ sẽ làm cho hiệu quả mô tả tốt hơn.Mô tả thống kê với các đặc trưng hiệu chỉnh.Chuẩn hóa số liệu có thể thực hiện thông qua phân tích biểu đồ phổ.Các kỹ thuật làm sạch dữ liệuĐánh giá độ tin cậy của dữ liệu là công việc không thể thiếu khi xử lý, phân tích các dữ liệu mẫu.Nội dung chính của đánh giá dữ liệuSử dụng đường cong ROC lựa chọn biến tính hiệu dự đoán và ngưỡng tín hiệu tốt nhất.CHƯƠNG 4 PHÂN TÍCH PHƯƠNG SAI4.1. Mô hình phân tích phương sai, nhân tố phân tích4.2. Phân tích phương sai một nhân tố hiệu quả xác định4.3. Phân tích phương sai một nhân tố hiệu quả ngẫu nhiên4.4. Phân tích phương sai hai nhân tố hiệu quả xác định4.5. SPSS và STATA với Phân tích phương saiTóm tắt chươngNội dung và kỹ năngMô hình phân tích phương sai cố điển như một cách tiếp cận giải quyết bài toán so sánh các trung bình.Nhận biết nhân tố tác động cố định và ngẫu nhiênCơ sở lý thuyết giải quyết các bài toán phân tích thống kê có thể qui về mô hình phân tích phương saiPhân tích nguồn sai số giữa giá trị các biệt với giá trị chung bình chungVấn đề so sánh cặp trong phân tích phương sai và sử dụng trong phân tích thống kêPhân tích phương sai khi phương sai các nhóm không đồng nhất.Giải thích kỹ thuật phân tích phương sai trong phân tích sự phù hợp của hàm hồi qui.Phân tích phương sai nhiều nhân tố áp dụng cho so sánh hồi quiNhững kỹ năng cơ bản thực hiện phân tích phương sai trên SPSS và Stata. Phân tích kết quả trên output của các phần mềm SPSS và Stata.CHƯƠNG 5 KIỂM ĐỊNH PHI THAM SỐ5.1. Kiểm định khi bình phương5.2. Các kiểm định dạng phân phối thông dụng5.3. Các kiểm định trên cơ sở tương quan hạng5.4. Stata với các kiểm định phi tham số5.5. SPSS với kiểm định phi tham sốTóm tắt chươngNội dung cơ bảnPhân biệt kiểm định phi tham số và kiểm định giá trị các tham số của các biến ngẫu nhiên.Lý thuyết tổng quát tiếp cận kiểm định sự phù hợp của các phân phối thực nghiệm với công cụ kiểm định Khi bình phương. Cùng một số biến dạng của kiểm định nàyKỹ năng sử dụng các kiểm định dấu và lớp các bài toán sử dụng kiểm định dấu.Một số tiêu chuẩn kiểm định các qui luật phân phối xác suất. Cách thức sử dụng các kỹ thuật này trên SPSS.Cách hình thành các hệ số tương quan hạng và sử dụng các hệ số này trong từng bài toán kiểm địnhCác kiểm định tương quan hạng và ứng dụng.Kỹ năng sử dụng các tiêu chuẩn kiểm định trên Stata và SPSS.CHƯƠNG 6PHÂN TÍCH HỒI QUI VÀ TƯƠNG QUAN6.1. Mô hình hồi qui6.2. Phân tích tương quan6.3. Phân tích hồi qui và tương quan với SPSS và StataTóm tắt chươngKhái niệm quan hệ phụ thuộc tương quan, hàm hồi qui thực nghiệmMô hình hồi qui tổng thể, hệ số hồi qui, sai số ngẫu nhiên, dạng tuyến tính của mô hình hồi quiDò tìm quan hệ phụ thuộc tương quan phi tuyếnPhân tích hồi qui và dự báoHồi qui đơn và hồi qui bội sự khác nhau trong phân tích, dự báoCác hệ số tương quan tuyến tính trong mô hình hồi quiHồi qui với biến định tính, vấn đề phân tích kết quả ước lượngHồi qui biến định tính với biến kiểm soát (định tính)Ứng dụng hồi qui Logistics trong phân lớp, xếp hạng cá thểHồi qui logit nhiều mức, cách tính toán và phân tích kết quảHồi qui Probit, cách tính toán và dự báo xác suất trên cơ sở kết quả hồi qui cụ thể.Hồi qui thứ bậc và phân tíchCác kiểm định đối với hồi qui thứ bậc.Kỹ năng ước lượng hồi qui và phân tích trên stata và spss.Hệ số tương quan tuyến tính, hệ số tương quan tuyến tính mẫu và kiểm định, ước lượng đối với hệ số tương quan tuyến tínhHệ số tương quan tuyến tính riêng phần, kiểm định và ước lượngÝ nghĩa của các kết quả kiểm định sự bằng nhau của hệ số tương quan tuyến tính và hệ số tương quan tuyến tính riêng phần. Phân tích cụ thể các trường hợp kết luận từ kiểm định để đánh giá vai trò của biến điều kiện đối với quan hệ của hai biến nghiên cứuCHƯƠNG 7PHÂN TÍCH NHÂN TỐ - PHƯƠNG PHÁP THÀNH PHẦN CHÍNH7.1. Bài toán phân tích nhân tố7.2. Bài toán cà các ý tưởng cơ bản7.3. Mô tả, tóm tắt số liệu7.4. Tạo biến và phép chiếu trong không gian tuyến tính7.5. Phân tích thành phần chính7.6. Trường hợp sử dụng độ đo từ ma trận hiệp phương sai7.7. Phân tích kết quả phân tích thành phần chính 7.8. Tỷ lệ giải thích trên các siêu phẳng chiếu7.9. Tiêu chuẩn chọn số thành phần chính cho một phân tích7.10. Mô hình hồi qui thành phần chính7.11. Stata và SPSS với phân tích thành phần chínhTóm tắt chươngCác nội dung và kỹ năng chínhChương này chỉ tập trung trình bày phân tích thành phần chính.Mô tả dữ liệu cho bài toán phân tích thành phần chính bằng ngôn ngữ ma trận là cơ sở cho việc thiết lập mô hình phân tích thành phần chính qua phép chiếu trong không gian tuyến tínhBài toán phân tích thành phần chính có mục đích rút gọn số liệu và trực giao hóa các thông tin về các cá thể trong tổng thể. Việc lựa chọn ma trận phân tích (ma trận tương quan hay ma trận hiệp phương sai) sẽ ảnh hưởng đến cách sử dụng kết quả phân tích thành phần chính. Các tiêu chuẩn khác nhau để đánh giá sự phù hợp của số liệu phân tíchCác đặc trưng phản ảnh quan hệ của đám mây số liệu ban đầu và ảnh của nó. Các đặc trưng này thành hai nhóm: nhóm các đặc trưng đánh giá vai trò của các biến ban đầu và nhóm các đặc trưng phản ánh của các thành phần chính.Chỉnh sửa mô hình, lựa chọn biến cũng như định danh các biến mới .SPSS có thể xem là một trong các phần mềm tiện dụng.Sử dụng kết quả phân tích cho các dự báo nhờ phân tích bổ sung với các cá thể cũng như các biến.Hồi qui thành phần chínhCHƯƠNG 8 PHÂN TÍCH NHÂN TỐ TƯƠNG ỨNG8.1. Bảng tiếp liên và các độ đo đối với đám mây số liệu8.2. Khoảng cách Khi bình phương8.3. Phân tích thành phần chính trong các không gian chiếu8.4. Biểu diễn đồng thời8.5. Áp dụng phân tích tương ứng cho phân tích chính tắc đối với hai biến định tính8.6. Phân tích tương ứng trên SPSS 8.7. Phân tích tương ứng trên Stata Tóm tắt chươngNội dung chínhPhân tích tương ứng các dấu hiệu của hai biến định tính trên tập hợp các cá thể Phân tích tương ứng giữa tập hợp chỉ số trên hai biến định tính. Tiếp cận qua phân tích nhân tố́. Đối với hai dấu hiệu nhị phân: một mở rộng của bài toán kiểm định sự độc lập của hai biến định tính. Sự khác biệt: ngoài kiểm định sự độc lập mô hình cho phép tìm kiếm sự tương ứng của các dấu hiệu trên hai biến.Cần mô hình hóa với sự trợ giúp của các ma trận cấu trúc tần số dòng, tần số cột. Nhờ các mô tả này qui bài toán về phân tích nhân tố cho các dấu hiệu (cá thể) dòng và các dấu hiệu (cá thể cột). Ưu điểm chính của cách tiếp cận này là số chiều của không gian chiếu phụ thuộc vào số dấu hiệu của biến có ít dấu hiệu hơn. Việc ứng dụng mô hình này cho hai biến biểu hiện như hai tập chỉ số là một mở rộng của Phân tích tương quan chính tắc. CHƯƠNG 9 PHÂN TÍCH NHÂN TỐ TƯƠNG ỨNG NHIỀU BIẾN9.1. Cách thức mô tả và mã hoá số liệu9.2. Phân tích tương ứng nhiều biến9.3. Phân tích tương ứng nhiều biến trên SPSSNội dung chínhMô hình hóa và mã hóa dữ liệu để có thể thiết lập các ma trận thông tin mô hình hóa.Xây dựng các công thức để có thể chuyển bài toán thành các bài toán phân tích nhân tố đã xét trong chương 7.Phân tích lời giải để có thể tìm kiếm các tọa độ của các cá thể. Các biến trên các không gian chiếu.Cách thức sử dụng phần mềm hỗ trợ bài toán cũng như mô tả kết quả thuận lợi cho phân tích.CHƯƠNG 10 PHÂN TÍCH TƯƠNG QUAN CHÍNH TẮC10.1. Phân tích tương quan chính tắc với hai nhóm biến10.1.1. Bài toán phân tích chính tắc với hai nhóm biến10.1.2. Mô tả ma trận và lời giải của bài toán10.1.3. Giải thích hình học lời giải của bài toán10.1.4. Tìm tất cả các cặp biến chính tắc10.1.5. Các kiểm định10.1.6. Mô tả hình học kết quả phân tích chính tắc10.1.7. Phân tích chính tắc trên SPSS và Stata10.2. Phân tích tương quan chính tắc tổng quátTóm tắt chươngNội dung chínhVới 2 tập biến: độc lập với nhau ? hoặc ngược lại: xác định tầm quan trọng của các mối quan hệ có thể tồn tại giữa hai tập biến này .Tính toán được một tập hợp các trọng số cho mỗi tập hợp các biến phụ thuộc và độc lập để các cặp tổ hợp tuyến tính của mỗi bộ được tương quan tối đa. Giải thích bản chất của mối quan hệ tồn tại giữa các bộ biến phụ thuộc và độc lập, thường bằng cách đo sự đóng góp tương đối của mỗi biến đến các hàm chính tắc đã được được chiết xuất. Mô tả, kiểm định các quan hệ của mỗi biến (độc lập hoặc phụ thuộc) đối với mỗi biến chính tắc tương ứng.Xác định số cặp biến chính tắc có hệ số tương quan khác 0 có ý nghĩa thống kê.Xác nhận các quan hệ tuyến tính của các nhóm biến trong các mô hình thống kê đa biến có liên quan.Mở rộng phân tích tương quan chính tắc đối với nhiều cặp nhóm biến (Kỹ năng trên SPSS).CHƯƠNG 11CÁC PHƯƠNG PHÁP PHÂN LỚP11.1. Một số khái niệm cơ sở11.2. Các phương pháp phân lớp11.3. Phân lớp theo thứ bậc11.4. Phân lớp đối với các biến11.5. Bài toán phân lớp trên SPSS và StataTóm tắt chươngNội dung chínhCác khái niệm cơ bản được sử dụng trong các bài toán phân lớp.Các phương pháp phân lớp dựa trên cơ sở các chỉ số quan hệ hay các chỉ số khác biệt (khoảng cách), tính chất của các chỉ số này đối với các biến nhị phân.Các phương pháp tính khoảng cách của các lớpBài toán phân lớp tối ưu đối với các biến nhị phânCơ sở lý thuyết chung của phương pháp kiểu đám mây di động, sự khác nhau của hai phương pháp cụ thể. Chọn số lớp nhờ mức sai lầm loại 1 của kiểm định FTư tưởng chung của phân lớp theo thứ bậc và các khái niệm, định nghĩa có liên quan.Chọn số lớp trong phân lớp thứ bậcTiêu chuẩn quán tính và phương pháp Ward. Thuật toán.Phân lớp các cá thể; phân lớp các biến cùng các ứng dụng.Sử dụng SPSS giải quyết bài toán phân lớp và phân tích kết quả.CHƯƠNG 12 PHÂN TÍCH KHÁC BIỆT12.1. Một minh hoạ cụ thể của phân tích khác biệt12.2. Các phương pháp hình học12.3. Các phương pháp xác suất12.4. Phân tích khác biệt với SPSS và StataTóm tắt chươngNội dung chínhMô hình phân tích khác biệt và các khái niệm chính.Một số độ đo và các ma trận cấu thành mô hình.Các kiểm định có liên quan đến sự phù hợp của phân tích khác biệt với một mẫu quan sátCách vận dụng một mô hình phân tích khác biệt để có thể mô hình hóa các bài toán thống kê phù hợp.Vận dụng các phương pháp phân tích khác biệt khác nhau, đặc biệt là trường hợp k=2.Trường hợp sử dụng mô hình tham số và phi tham số, mô hình xác suất BayesỨng dụng phân tích khác biệt với k-2 cho một số bài toán kinh tế-xã hộiPhân tích khác biệt với k>2 (trường hợp tổng quát)Cấu trúc mô hình và cách tính toán các ma trận tương quan, hiệp phương sai các nhóm và phương sai gộpCác tiêu chuẩn chọn biến phân tíchSử dụng được các phần mềm chuyên dụng SPSS, Stata để giải các bài toán và phân tích được kết quả.Phần mềm, dữ liệu hỗ trợ giảng dạy và thực hànhPhần mềm: EXCEL, STATA, SPSSDữ liệu:STTTên tệpDạngDùng cho chương1hhexp98nSav, dta 2; 3; 4; 5; 6; 7; 8; 11; 122GSS93sav3; 4; 5; 6; 7; 8; 9; 10; 11; 123VLHS2002sav34World95sav3; 6; 7; 115Employee datasav3; 66AGFsav37VLHS2006_2adta38autoacidentssav39hivassaysav310bankloansav3; 4; 10; 1211Tv_serveysav312Carsav4; 613Hhexp2004-3sav414Grocery_1monhtsav415Workprosav416GDP_nganh06_12Xls417binarysav618mlogitdta619DN_vonNNsav620Haiphong1sav621SolieuDNsav622Dn2011sav723DHS97sav7; 1124SVTNsav8; 1225didanHN1sav1126hhexp2004sav1127Census1sav1128Dn2010sav1129HCMdissav1230thidu11sav12
File đính kèm:
- bai_giang_thong_ke_thuc_hanh_chuong_1_nhung_van_de_co_ban_cu.ppt