Bài giảng Thống kê học ứng dụng trong quản lý xây dựng - Phần 1: Giới thiệu về thống kê học - Nguyễn Duy Long
Tóm tắt Bài giảng Thống kê học ứng dụng trong quản lý xây dựng - Phần 1: Giới thiệu về thống kê học - Nguyễn Duy Long: ... Sỹ Quần thể Mẫu Tập con 18 Thông số Trị số thống kê Các quần thể có các thông số; các mẫu có các trị số thống kê ©2010, Nguyễn Duy Long, Tiến Sỹ 9/7/2010 10 ©2010, Nguyễn Duy Long, Tiến Sỹ 19 Phương pháp thông kê Thống kê học mô tả Thông kê học suy luận ©2010, Nguyễn Duy Long, Tiến Sỹ ...húng ta có thể thấy những điều chúng ta không mong đợi. 3. Vẽ/tạo hình ảnh — cách tốt nhất để nói với người khác rằng dữ liệu của bạn có hình ảnh trình bày được chọn lựa kỹ. 29©2010, Nguyễn Duy Long, Tiến Sỹ Đếm số lượng của các giá trị dữ liệu cho mỗi loại. Tổ chức chúng vào một bảng ch...ng, Tiến Sỹ Số ng só Sống 203 118 178 212 Chết 122 167 528 673 9/7/2010 19 Mỗi phần tử của bảng cho ra số đếm của sự kết hợp giá trị của hai biến. ◦ Ví dụ phân tử thứ hai ở cột thủy thủ đoàn (crew) chỉ ra, 673 thủy thủ chết khi tàu Titanic bị chìm. Hạng g só t Nhất Nhì Ba Thủy thủ ...
9/7/2010 1 Nguyễn Duy Long, Tiến Sỹ Bộ môn Thi Công và QLXD ©2010, Nguyễn Duy Long, Tiến Sỹ 1 Phần 01 Nguyễn Duy Long, Tiến Sỹ Bộ môn Thi Công và QLXD ©2010, Nguyễn Duy Long, Tiến Sỹ 2 9/7/2010 2 Tư duy thống kê Giới thiệu về thống kê học Trình bày dữ liệu định tính ©2010, Nguyễn Duy Long, Tiến Sỹ 3 ©2010, Nguyễn Duy Long, Tiến Sỹ 4 9/7/2010 3 Thời gian của dự án: ◦ Dự án hoàn thành khi tất cả các công việc của nó hoàn thành ◦ Thời gian hoàn thành các công việc là không chắc chắn. ◦ Hiểu và giảm thiểu sự không chắc chắn này sẽ giúp quản lý tiến độ thành công. ©2010, Nguyễn Duy Long, Tiến Sỹ 5 Nguồn: Glossary oi Statistical Terms, ASQ Quality Press Phần ngầm Phần khung Hoàn thiện Là một triết lý của việc học và hành động dựa trên các nguyên lý cơ bản sau: ◦ Tất cả công việc đều xảy ra trong một hệ thống của các qui trình kết nối nhau ◦ Sự biến thiên (variation) tồn tại trong tất cả các qui trình ◦ Hiểu và giảm thiểu sự biến thiên là chìa khóa để thành công ©2010, Nguyễn Duy Long, Tiến Sỹ 6 Nguồn: Glossary oi Statistical Terms, ASQ Quality Press 9/7/2010 4 Qui trình Tư duy Sự biến đổi Các dữ liệu thống kê Phươ há ©2010, Nguyễn Duy Long, Tiến Sỹ 7 Các công cụ thống kê ng p p thống kê ©2010, Nguyễn Duy Long, Tiến Sỹ 8 9/7/2010 5 Đánh giá các kết luận sau đây: ◦ “Những người có cha mẹ có bằng đại học thì có khả năng (likely) lấy bằng đại học hơn là những người có cha mẹ không có bằng đại học.” ◦ “Lượng xe máy ở Sài Thành có liên hệ với lượng nhà và đất ở ở Hà Thành.” ©2010, Nguyễn Duy Long, Tiến Sỹ 9 ©2010, Nguyễn Duy Long, Tiến Sỹ 10 Nguồn: 9/7/2010 6 Thống kê: Với hô it ng t n trong tay bạn, cái gì trong thùng? Xác suất: Với Nguồn: MIT OCW, dựa trên Gilbert, 1976 11©2010, Nguyễn Duy Long, Tiến Sỹ thông tin trong thùng, cái gì trong tay bạn? Thống kê học (statistics, số ít): Một cách lý luận, cùng với các công cụ và phương pháp đi kèm, được thiết kế để giúp chúng ta hiểu biết về thế giới. Thống kê (satistics, số nhiều): các phép tính cụ thể được thực hiện trên các dữ liệu (data). 12©2010, Nguyễn Duy Long, Tiến Sỹ 9/7/2010 7 Dữ liệu (Data) Thống kê (Statistics) Thông tin (Information) 13©2010, Nguyễn Duy Long, Tiến Sỹ Suy nghĩ (think) Biểu thị (show) Trình bày (tell) ©2010, Nguyễn Duy Long, Tiến Sỹ 14 9/7/2010 8 ©2010, Nguyễn Duy Long, Tiến Sỹ 15 Quần thể (population): một nhóm gồm tất cả các thành phần mà nhà thực hành thống kê quan tâm. ◦ v.d. tất cả các nhà thầu ở Sài Gòn Mẫu (sample): một tập hợp các dữ liệu rút ra từ quần thể ◦ v.d. một mẫu 75 nhà thầu ở Sài Gòn 16©2010, Nguyễn Duy Long, Tiến Sỹ 9/7/2010 9 Thông số (parameter): một đại lượng mô tả quần thể ◦ v.d. doanh thu bình quân của tất các nhà thầu là 100 tỷ đồng. Trị (tham) số thống kê (statistic): một đại lượng mô tả mẫu ◦ v.d. doanh thu bình quân của mẫu 75 nhà thầu là 120 tỷ đồng . 17©2010, Nguyễn Duy Long, Tiến Sỹ Quần thể Mẫu Tập con 18 Thông số Trị số thống kê Các quần thể có các thông số; các mẫu có các trị số thống kê ©2010, Nguyễn Duy Long, Tiến Sỹ 9/7/2010 10 ©2010, Nguyễn Duy Long, Tiến Sỹ 19 Phương pháp thông kê Thống kê học mô tả Thông kê học suy luận ©2010, Nguyễn Duy Long, Tiến Sỹ 20 (descriptive statistics) (inferential statistics) 9/7/2010 11 Thu thập số liệu d khả á á hí◦ v. . o s t, quan s t, t nghiệm Trình bày dữ liệu ◦ v.d. biểu đồ và đồ thị Xác định đặc điểm của dữ liệu ©2010, Nguyễn Duy Long, Tiến Sỹ 21 ◦ v.d. trung bình của mẫu = n xi Quá trình tạo ra một ước lượng, dự đoán, hay quyết định về quần thể dựa trên mẫu. Mẫu Suy luận Quần thể 22 Thông số Trị số thống kê ©2010, Nguyễn Duy Long, Tiến Sỹ 9/7/2010 12 ©2010, Nguyễn Duy Long, Tiến Sỹ 23 Dữ liệu (data): là các đại lượng cùng ngữ cảnh đi kèm. Ngữ cảnh của dữ liệu: “Five W’s”: Who, What, When, Where, and Why. Có thể có cả “How.” Dữ liệu không có ngữ cảnh đi kèm thì hầu như vô nghĩa. 24©2010, Nguyễn Duy Long, Tiến Sỹ 9/7/2010 13 Họ Tên Tuổi Loại lao động Lương ngày Đội Thi Công Bảo hiểm Phan Cam 18 Phổ thông 50,000 1 Không Vũ Phu 35 Nề 90,000 1 Có Cao Giá 28 Nề 95,000 2 Không Trần Ai 45 Sắt 90,000 1 Có Lê La 30 Điện 85,000 2 Có Lâm Tặc 30 Mộc 90 000 1 Không ©2010, Nguyễn Duy Long, Tiến Sỹ 25 , Ngô Khoai 32 Phổ thông 45,000 2 Có Phạm Thượng 22 Phổ thông 50,000 2 Không (Trích từ bảng lương tháng 9/2009, Dự Án “Xây Nhà Từ Nóc”) Định tính Biến của dữ liệu (categorical) Định lượng (quantitative) ©2010, Nguyễn Duy Long, Tiến Sỹ 26 9/7/2010 14 27©2010, Nguyễn Duy Long, Tiến Sỹ Biểu đồ số người mắc bệnh và tử vong do cúm A/H1N1: ©2010, Nguyễn Duy Long, Tiến Sỹ 28 Nguồn: Báo Tuổi Trẻ, 28/09/2009 9/7/2010 15 Ba qui tắc: 1. Vẽ/tạo hình ảnh — có thể lộ ra những điều mà ấchúng ta không th y từ dữ liệu thô. 2. Vẽ/tạo hình ảnh — những đặc điểm quan trọng của dữ liệu sẽ được thể hiện. Chúng ta có thể thấy những điều chúng ta không mong đợi. 3. Vẽ/tạo hình ảnh — cách tốt nhất để nói với người khác rằng dữ liệu của bạn có hình ảnh trình bày được chọn lựa kỹ. 29©2010, Nguyễn Duy Long, Tiến Sỹ Đếm số lượng của các giá trị dữ liệu cho mỗi loại. Tổ chức chúng vào một bảng chỉ số đếm, thể hiện tổng số lượng và loại. Ví dụ hạng vé tàu Titanic: Hạng vé Đếm Hạng nhất 325 30©2010, Nguyễn Duy Long, Tiến Sỹ Hạng nhì 285 Hạng ba 706 Thủy thủ đoàn 885 (Nguồn: De Veaux et al., 2006) 9/7/2010 16 Bảng tần suất tương đối cũng tương tự, nhưng thể hiện dạng phần trăm (thay vì số đế ) h ỗ lm c o m i oại. Hạng vé % Hạnh nhất 14.77 Hạng nhì 12.95 H ng ba 32 08 31©2010, Nguyễn Duy Long, Tiến Sỹ ạ . Thủy thủ đoàn 40.21 Thủy thủ đoàn Hạng ba 32©2010, Nguyễn Duy Long, Tiến Sỹ Hạng hai Hạng nhất 9/7/2010 17 Biểu đồ thanh tần suất tương đối mô tả sự phân phối tương đối của số đếm cho mỗi loại. h “ ê lý d í h ” T ỏa mãn nguy n iện t c . Slide 3- 33©2010, Nguyễn Duy Long, Tiến Sỹ Nhất Nhì Ba Thủy thủ đoàn Hạng Khi quan tâm các phần trong tổng thể, biểu đồ bánh là chọn lựa hay. Hạng Hạng hai Nhất Thủy thủ 34©2010, Nguyễn Duy Long, Tiến Sỹ Hạnn ba 9/7/2010 18 Cho phép trình bày hai biến định tính cùng nhau. Cho phép thể hiện các thành phần được phân phối như thế nào theo mỗi biến và tùy thuộc vào giá trị của biến, khác. ◦ v.d. xem xét hạng vé và sự sống sót của hành khách trên tàu Titanic: Hạng ót Nhất Nhì Ba Thủy thủ Tổng 35©2010, Nguyễn Duy Long, Tiến Sỹ Số ng só Sống 203 118 178 212 711 Chết 122 167 528 673 1490 Tổng 325 285 706 885 2201 Các cột và hàng lề bên phải và bên dưới cho ra tổng số và các phân phối tần suất (frequency distributions) cho mỗi một biến. Mỗi phân phối tần suất gọi là phân phối lề (marginal distribution) của biến tương ứng. ◦ Phân phối lề cho biến sống sót (survival) của tàu Titanic: Hạng ót Nhất Nhì Ba Thủy thủ 36©2010, Nguyễn Duy Long, Tiến Sỹ Số ng só Sống 203 118 178 212 Chết 122 167 528 673 9/7/2010 19 Mỗi phần tử của bảng cho ra số đếm của sự kết hợp giá trị của hai biến. ◦ Ví dụ phân tử thứ hai ở cột thủy thủ đoàn (crew) chỉ ra, 673 thủy thủ chết khi tàu Titanic bị chìm. Hạng g só t Nhất Nhì Ba Thủy thủ Tổng Sống 203 118 178 212 711 ế 37©2010, Nguyễn Duy Long, Tiến Sỹ Số ng Ch t 122 167 528 673 1490 Tổng 325 285 706 885 2201 Phân phối có điều kiện (conditional distribution) cho ra phân phối của một biến chỉ cho các thành phần thỏa mãn một điều kiện nào đó của biến khác. ◦ Phân phối có điều kiện của hạng vé với điều kiện sống: Hạng 38©2010, Nguyễn Duy Long, Tiến Sỹ Nhất Nhì Ba Thủy thủ Tổng Số ng 203 118 178 212 71128.6% 16.6% 25.0% 29.8% 100% 9/7/2010 20 ◦ Phân phối có điều kiện của hạng vé, với điều kiện thiệt mạng: Hạng Nhất Nhì Ba Thủy thủ Tổng Ch ết 122 167 528 673 1490 8.2% 11.2% 35.4% 45.2% 100% 39©2010, Nguyễn Duy Long, Tiến Sỹ Các phân phối có điều kiện cho thấy rằng có sự khác nhau về hạng vé và tỷ lệ sự sống sót. Sống sót Chết 40©2010, Nguyễn Duy Long, Tiến Sỹ Nhất Nhì Ba Thủy thủ 9/7/2010 21 Sự phân phối của hạng vé với người sống sót và sự phân phối của hạng vé với người không sống sót là khác nhau. Hạng vé và sự sống sót là có sự liện hệ, nhưng chúng không độc lập. Các biến được coi là độc lập khi sự phân phối của một biến trong bảng tùy thuộc là giống nhau cho mỗi loại của biến còn lại. 41©2010, Nguyễn Duy Long, Tiến Sỹ Biểu đồ thanh phân đốt (segmented bar charts) trình bày lượng thông tin giống với biểu đồ bánh. Biểu đồ thanh phân đốt giữa hạng vé và tình trạng sống sót: Nhất Nhì Ba Thủy thủ Hạng Ph ần tră m ©2010, Nguyễn Duy Long, Tiến Sỹ 42 ChếtSống sót 9/7/2010 22 43©2010, Nguyễn Duy Long, Tiến Sỹ “Căn hộ giá trung bình bán chạy”: ©2010, Nguyễn Duy Long, Tiến Sỹ 44 Nguồn: Báo Tuổi Trẻ, 24/10/2009 9/7/2010 23 Trình bày thành thật—đảm bảo biểu đồ nói ra những gì đang thể hiện. ◦ Có vấn đề gì trong biểu đồ trên? 45©2010, Nguyễn Duy Long, Tiến Sỹ Đừng cường điệu hóa. Không kết luận những điều chưa thể kết luận Đừng sử dụng trị trung bình không hợp lý— mà có thể dẫn đến cái gọi là nghịch lý Simpson (Simpson’s Paradox). 46©2010, Nguyễn Duy Long, Tiến Sỹ 9/7/2010 24 Hương có điểm TBTL 7.00 ở trường ĐHBK Thủy có điểm TBTL 7.50 ở trường ĐHBK Ai có vẻ học tốt hơn trong các môn học ở ĐHBK? Hương hay Thủy? Theo bạn thì ai có khả năng đạt điểm cao hơn trong môn học này? 47©2010, Nguyễn Duy Long, Tiến Sỹ Chất lượng thi công công trình của hai nhà thầu A và B theo đánh giá của các chủ đầu tư (đạt/tổng số hợp đồng): Loại công trình Dân dụng Công nghiệp Tổng Nhà thầu A 40/60 (66.6%) 13/15 (86.7%) 53/75 (70.7%) Nhà thầu B 5/8 42/50 47/58 Chọn nhà thầu nào để thi công chất lượng hơn? ©2010, Nguyễn Duy Long, Tiến Sỹ 48 (62.5%) (84.0%) (81.0%) 9/7/2010 25 ©2010, Nguyễn Duy Long, Tiến Sỹ 49
File đính kèm:
- bai_giang_thong_ke_hoc_ung_dung_trong_quan_ly_xay_dung_phan.pdf