Bài giảng Lý thuyết xác suất và thống kê toán - Chương 4: Dữ liệu thống kê - Lê Trường Giang

Tóm tắt Bài giảng Lý thuyết xác suất và thống kê toán - Chương 4: Dữ liệu thống kê - Lê Trường Giang: ... 2. Mẫu nghẫu nhiên và mẫu cụ thể VD 2. Đo chiều cao X (cm) của 100n thanh niên. Vì chiều cao khác nhau nên để tiện việc sắp xếp, người ta chia chiều cao thành nhiều khoảng. Các thanh niên có chiều cao trong cùng 1 khoảng được xem là cao như nhau. Khi đó, ta có bảng số liệu ở dạng kho...ột thống kê X được xác định  1 2 1 ... n X X X X n     . Mẫu cụ thể  1 2w , ,...,n nx x x , trung bình thực nghiệm x được cho bởi 11 11 n i i n i i i x n xx n x n      . Một số đặc trưng của trung bình mẫu ngẫu nhiên i.  E X  ii.   2 arV X n ...Moivre – Laplace, từ mẫu ngẫu nhiên  1 2, ,...,n nW X X X được lập từ tổng thể  1;X B p , tỉ lệ mẫu là 1 1 n n i i F X n    , x  ta có      lim . , 0;1 1 n n F p P x P Z x Z N p p n                  . Cụ thể n>30; n.p >5 ...

pdf26 trang | Chia sẻ: havih72 | Lượt xem: 329 | Lượt tải: 0download
Nội dung tài liệu Bài giảng Lý thuyết xác suất và thống kê toán - Chương 4: Dữ liệu thống kê - Lê Trường Giang, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
BÀI GIẢNG 
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TỐN 
Giảng viên 
ThS. Lê Trường Giang 
TRƯỜNG ĐẠI HỌC TÀI CHÍNH-MARKETING 
KHOA CƠ BẢN 
BỘ MƠN TỐN – THỐNG KÊ 
LÝ THUYẾT MẪU 
Bài 1. TỔNG THỂ VÀ MẪU 
1. Khái niệm về tổng thể và mẫu 
2. Mẫu ngẫu nhiên và mẫu cụ thể 
Bài 2. CÁC ĐẶC TRƯNG CỦA MẪU VÀ PHÂN PHỐI XÁC SUẤT. 
1. Thống kê 
2. Trung bình mẫu ngẫu nhiên 
3. Tỉ lệ mẫu ngẫu nhiên 
4. Phương sai mẫu ngẫu nhiên 
5. Phương sai mẫu cĩ điều chỉnh 
3. Hàm phân phối thực nghiệm 
Bài 1. TỔNG THỂ VÀ MẪU 
1. Khái niệm về tổng thể và mẫu 
2. Mẫu ngẫu nhiên và mẫu cụ thể 
Chương 4. DỮ LIỆU THỐNG KÊ 
3. Hàm phân phối thực nghiệm 
Bài 1. TỔNG THỂ VÀ MẪU 
Tổng thể 
X: Biến ngẫu nhiên tổng thể 
N: Kích thước tổng thể. 
: Trung bình tổng thể. 
: Độ lệch chuẩn tổng thể. 
p: tỷ lệ tổng thể. 
Mẫu 
n: Kích thước mẫu. 
 : Trung bình mẫu. 
 : Độ lệch chuẩn mẫu. 
 : tỷ lệ mẫu. 
X
Lấy mẫu ngẫu nhiên 
Ước lượng tham số 
Kiểm định giả thuyết 
nF
S
Bài 1. TỔNG THỂ VÀ MẪU 
2. Mẫu nghẫu nhiên và mẫu cụ thể 
a. Mẫu ngẫu nhiên 
Mẫu ngẫu nhiên kích thước n được lập từ tổng thể X là 
một bộ gồm n biến ngẫu nhiên , 1,2,...,
i
X i n độc lập 
và cùng phân phối với biến ngẫu nhiên X, kí hiệu là 
 1 2, ,...,n nW X X X . 
b. Mẫu cụ thể 
Mẫu ngẫu nhiên này nhận n giá trị cụ thể 
1 1 2 2
, ,...,
n n
X x X x X x   . Khi đĩ một bộ gồm n 
giá trị  1 2w , ,...,n nx x x được gọi là một mẫu cụ 
thể cĩ kích thước n. 
Bài 1. TỔNG THỂ VÀ MẪU 
2. Mẫu nghẫu nhiên và mẫu cụ thể 
c. Ví dụ 
Thu nhập hàng tháng của mỗi gia đình tỉnh A (đơn vị triệu đồng). 
{100,121, 230, 89,197, }. 
Tập giá trị của biến ngẫu nhiên tổng thể X chỉ thu nhập của mỗi 
gia đình tỉnh A. 
Một mẫu ngẫu nhiên gồm 50 hộ gia đình trong tỉnh A. 
{X1, X2,X50 }. 
Một mẫu cụ thể 
{121, 203, 92,120} 
gồm 50 giá trị thu nhập của 50 hộ gia đình. 
Bảng phân phối thực nghiệm của mẫu cụ thể 
Bài 1. TỔNG THỂ VÀ MẪU 
2. Mẫu nghẫu nhiên và mẫu cụ thể 
Mẫu cụ thể  1 2w , ,...,n nx x x , x1 < x2 << xk và 1 2 ... kn n n n    . 
Bảng phân phối tần số thực nghiệm 
xi x1 x2  xk 
ni n1 n2  nk 
Bảng phân phối tần suất thực nghiệm 
xi x1 x2  xk 
fi f1 f2  fk 
Trong đĩ, i
i
n
f
n
 . 
 VD 1. Kiểm tra ngẫu nhiên 50 sinh viên. Ta sắp xếp 
điểm số X thu được theo thứ tự tăng dần và số sinh 
viên n cĩ điểm tương ứng vào bảng như sau: 
X (điểm) 2 4 5 6 7 8 9 10 
n (số SV) 4 6 20 10 5 2 2 1 
Bài 1. TỔNG THỂ VÀ MẪU 
Bảng phân phối thực nghiệm của mẫu cụ thể 
2. Mẫu nghẫu nhiên và mẫu cụ thể 
Giá trị của mẫu cụ thể dạng ghép lớp 
;
i i
x x h   1 1;x x h  
2 2
;x x h  
  ;
k k
x x h  
ni n1 n2  nk 
Trong trường hợp này ta sử dụng giá trị trung bình trên từng khoảng 
i
x 
1
x 
2
x  
k
x 
ni n1 n2  nk 
 với 
2
i i
i
x x h
x
 
  
Bảng phân phối thực nghiệm của mẫu cụ thể 
Bài 1. TỔNG THỂ VÀ MẪU 
2. Mẫu nghẫu nhiên và mẫu cụ thể 
Bài 1. TỔNG THỂ VÀ MẪU 
2. Mẫu nghẫu nhiên và mẫu cụ thể 
 VD 2. Đo chiều cao X (cm) của 100n thanh niên. 
 Vì chiều cao khác nhau nên để tiện việc sắp xếp, người 
ta chia chiều cao thành nhiều khoảng. 
 Các thanh niên cĩ chiều cao trong cùng 1 khoảng được 
xem là cao như nhau. Khi đĩ, ta cĩ bảng số liệu ở dạng 
khoảng như sau: 
X 148-152 152-156 156-160 160-164 164-168 
n 5 20 35 25 15 
 Khi cần tính tốn, người ta chọn số trung bình của mỗi 
khoảng để đưa số liệu trên về dạng bảng: 
X 150 154 158 162 166 
n 5 20 35 25 15 
Giả sử  1 2; ;...; nX X X là một mẫu ngẫu nhiên được xây dựng từ đại 
lượng ngẫu nhiên X với hàm phân phối xác suất  XF x . 
Định nghĩa: Hàm phân phối thực nghiệm ngẫu nhiên tương ứng với 
mẫu  1 2; ;...; nX X X , kí hiệu là  nF x , xác định bởi cơng thức sau 
 
1 2
1 2
0 nếu min( , ,..., ),
nếu có k phần tử trong mẫu < x,
1 nếu max( , ,..., ).
n
n
n
x X X X
k
F x
n
x X X X
 


 


3. Hàm phân phối thực nghiệm 
Bài 1. TỔNG THỂ VÀ MẪU 
Định lí Glivenko:
   lim sup 0 1
  
    
 
n X
n x
P F x F x 
Ý nghĩa: Hàm phân phối thực nghiệm là một xấp xỉ của hàm 
phân phối lý thuyết. Xấp xỉ đĩ càng tốt khi cỡ mẫu n càng lớn. 
3. Hàm phân phối thực nghiệm 
Bài 1. TỔNG THỂ VÀ MẪU 
Bài 2. CÁC ĐẶC TRƯNG CỦA MẪU VÀ PHÂN PHỐI XÁC SUẤT. 
1. Thống kê 
2. Trung bình mẫu ngẫu nhiên 
3. Tỉ lệ mẫu ngẫu nhiên 
4. Phương sai mẫu ngẫu nhiên 
5. Phương sai mẫu cĩ điều chỉnh 
Bài 2. CÁC ĐẶC TRƯNG CỦA MẪU VÀ PHÂN PHỐI XÁC SUẤT. 
1. Thống kê 
Thống kê là một hàm xác định trên các biến ngẫu nhiên của 
mẫu. Một thống kê của mẫu  1 2, ,...,n nW X X X được kí hiệu 
là  1, 2,..., nG G X X X . 
Chẳng hạn,  1 2
1
...
n
X X X X
n
    là một thống kê trên mâu 
ngẫu nhiên  1 2W , ,...,n nX X X . 
Bài 2. CÁC ĐẶC TRƯNG CỦA MẪU VÀ PHÂN PHỐI XÁC SUẤT. 
2. Trung bình mẫu ngẫu nhiên 
Mẫu ngẫu nhiên  1 2, ,...,n nW X X X , trung bình mẫu ngẫu nhiên là một 
thống kê X được xác định 
 1 2
1
...
n
X X X X
n
    . 
Mẫu cụ thể  1 2w , ,...,n nx x x , trung bình thực nghiệm x được cho bởi 
11
11
n
i
i
n
i i
i
x n xx
n
x
n
 
   . 
Một số đặc trưng của trung bình mẫu ngẫu nhiên 
i.  E X  ii.  
2
arV X
n

 
iii. Nếu  2,X N   thì 
2
,X N
n


 
 
 
 
 và 
 
 0;1
X n
N



. 
Bài 2. CÁC ĐẶC TRƯNG CỦA MẪU VÀ PHÂN PHỐI XÁC SUẤT. 
2. Trung bình mẫu ngẫu nhiên 
Ví dụ 1. Chiều cao (cm) của một loại cây cơng nghiệp là 
BNN tuân theo luật phân phối chuẩn với trung bình là 75 
và độ lệch chuẩn là 10. Người ta đo ngẫu nhiên 25 cây loại 
trên, tính xác suất để chiều cao trung bình của 25 cây đĩ 
nằm trong khoảng từ 71cm đến 79cm 
ĐS: 0,9554 
Định lý giới hạn trung tâm. Cho mẫu ngẫu nhiên  1 2, ,...,n nW X X X 
được thành lập từ biến ngẫu nhiên X cĩ kỳ vọng  , phương sai 2 . 
 Khi đĩ x  
   
2
2
1
lim , 0;1
2
tx
n
X
P x e dt P Z x Z N
n

 



 
 

    
 
 
 
 . 
Bài 2. CÁC ĐẶC TRƯNG CỦA MẪU VÀ PHÂN PHỐI XÁC SUẤT. 
2. Trung bình mẫu ngẫu nhiên 
Nhận xét. Khi 30n  ta cĩ thể xem thống kê 
 X n


 cĩ luật phân 
phối chuẩn tắc  0;1N cho dù biến ngẫu nhiên tổng thể X cĩ bất kì phân 
phối nào. 
Bài 2. CÁC ĐẶC TRƯNG CỦA MẪU VÀ PHÂN PHỐI XÁC SUẤT. 
3. Tỉ lệ mẫu ngẫu nhiên 
Mẫu  1 2, ,...,n nW X X X được lập từ tổng thể  1;X B p , khi đĩ trung 
bình 
1
1
n
i
i
X X
n

  được gọi là tỉ lệ mẫu ngẫu nhiên, kí hiệu là nF . 
Ta tính được các đặc trưng sau 
i,  
1
1
.
n
n i
i
E F E X p
n

 
  
 
 
 ii.  
 1
ar
n
p p
V F
n

 . 
Mẫu cụ thể  1 2w , ,...,n nx x x , ta cĩ tỉ lệ phần tử cĩ tính chất A trong mẫu là 
1
1
n
A
i
i
n
f x
n n

  
với 
A
n là số phần tử cĩ tính chất A. 
Bài 2. CÁC ĐẶC TRƯNG CỦA MẪU VÀ PHÂN PHỐI XÁC SUẤT. 
3. Tỉ lệ mẫu ngẫu nhiên 
Định lý De Moivre – Laplace, từ mẫu ngẫu nhiên  1 2, ,...,n nW X X X 
được lập từ tổng thể  1;X B p , tỉ lệ mẫu là 
1
1
n
n i
i
F X
n

  , 
 x  ta cĩ 
 
   lim . , 0;1
1
n
n
F p
P x P Z x Z N
p p
n

 
 
   
 
 
 
 
. 
Cụ thể n>30; n.p >5 và n(p-1) > 5 ta cĩ thể sử dụng xấp xỉ 
trên. 
 
 0;1
1
n
F p
N
p p
n


. 
Bài 2. CÁC ĐẶC TRƯNG CỦA MẪU VÀ PHÂN PHỐI XÁC SUẤT. 
4. Phương sai mẫu ngẫu nhiên 
Cho mẫu ngẫu nhiên  1 2, ,...,n nW X X X được lập từ tổng thể X 
cĩ kỳ vọng  và phương sai 2 , thống kê S 
 
2 2
1
1
n
i
i
S X X
n

  
được gọi là phương sai mẫu. 
Độ lệch chuẩn mẫu được định nghĩa 
2
S S . 
Chú ý. Thống kê S cịn được viết dưới dạng sau 
     
2 2 22 2
1
1
.
n
i i
i
S X X X X
n

    
Bài 2. CÁC ĐẶC TRƯNG CỦA MẪU VÀ PHÂN PHỐI XÁC SUẤT. 
5. Phương sai mẫu cĩ điều chỉnh 
Cho mẫu ngẫu nhiên  1 2, ,...,n nW X X X được lập từ tổng thể X cĩ kỳ 
vọng  và phương sai 2 , thống kê S 
 
22
1
1
.
1
n
i
i
S X X
n

 

 
được gọi là phương sai mẫu điều chỉnh. Độ lệch chuẩn mẫu điều chỉnh 
được định nghĩa 2S S . 
Chú ý. Ta cĩ thể biểu diễn phương sai mẫu điều chỉnh 
 
1
2 221
.
1 1
n
i
i
S
n
X X
n n





 
Bài 2. CÁC ĐẶC TRƯNG CỦA MẪU VÀ PHÂN PHỐI XÁC SUẤT. 
5. Phương sai mẫu cĩ điều chỉnh 
Mẫu cụ thể  1 2w , ,...,n nx x x kích thước n được cho theo bảng tần số sau 
xi x1 x2  xk 
ni n1 n2  nk 
1
k
i
i
n n

 
Khi đĩ, sai sai mẫu điều chỉnh được cho bởi 
 
22 2
1
1
.
1
k
i i
i
s n x n x
n

 
  
   
 
Bài 2. CÁC ĐẶC TRƯNG CỦA MẪU VÀ PHÂN PHỐI XÁC SUẤT. 
25 27,5 22 25 18 16 20 21,5 16 25 
18 17,5 21,5 30 18 25 19,5 20 18,5 21 
Ví dụ 2. Thống kê lượng đường cát trắng bán ra mỗi ngày 
của của hàng A cho trong bảng sau 
Tính trung bình và độ lệch chuẩn mẫu điều chỉnh? 
Mơ tả sự biến thiên của số trung bình: sai số chuẩn 
(Trích bài giảng của GS. Nguyễn Văn Tuấn – Australia) 
• Nếu chúng ta chọn mẫu N lần (mỗi lần với n đối 
tượng), thì chúng ta sẽ cĩ N số trung bình. Độ lệch 
chuẩn của N số trung bình này chính là sai số chuẩn. 
Do đĩ, sai số chuẩn phản ảnh độ dao động hay biến 
thiên của các số trung bình mẫu (sample averages). 
• Cơng thức tính sai số chuẩn (SE – standard error): 
.
s
SE
n
Ý nghĩa của độ lệch chuẩn và sai số chuẩn 
• Gọi số trung bình của một quần thể là μ (nên nhớ rằng 
chúng ta khơng biết giá trị của μ). Gọi số trung bình 
tính từ mẫu là x và độ lệch chuẩn là s. Theo lý thuyết 
xác suất của phân phối chuẩn, chúng ta cĩ thể nĩi rằng: 
 95% cá nhân trong quần thể đĩ cĩ giá trị 
từ 1,96x s đến 1,96x s . 
 95% số trung bình tính từ mẫu cĩ giá trị 
từ 1,96x SE đến 1,96x SE . 
• Như vậy, độ lệch chuẩn phản ảnh độ biến thiên của 
một số cá nhân trong một quần thể. Cịn sai số chuẩn 
phản ảnh độ dao động của các số trung bình chọn từ 
quần thể. 

File đính kèm:

  • pdfbai_giang_ly_thuyet_xac_suat_va_thong_ke_toan_chuong_4_du_li.pdf