Luận văn Ước lượng và kiểm định trong thống kê nhiều chiều

Tóm tắt Luận văn Ước lượng và kiểm định trong thống kê nhiều chiều: ...cách giữa vector η pD∈ và Y đạt cực tiểu khi là hình chiếu trực giao của Y lên . η pD Giả sử là vector sao cho : β  η Xβ= β là ước lượng bình phương bé nhất của . Để tìm ta để ý rằng β β Xβ là hình chiếu trực giao của Y lên , do đó pD ( )( ) ( ) 0 1ξ Y Xβ , , ..., .Ti i p− = = ...ơng trung bình mắc phải khi tính bởi biểu thức ở vế phải được gọi là phương sai phần dư. Nó được tính bởi: 21.23... * 11 det mσ Λ= Λ Hệ số tương quan bội (hệ số tương quan tập hợp) đo mức độ phụ thuộc tuyến tính giữa và tổ hợp tuyến tính ở vế phải của công thức tính là: 1X 2 * 1.23... ... Trong thực tế, nó rất ít an toàn, nhưng điều này rất được ưa chuộng để kiểm định một biến (trong giới hạn nghiên cứu của họ). Họ cũng so sánh các phương pháp này với các kiểm định khác mà không tiên nghiệm 2T test− ( kiểm định không bảo hộ). Trong trường hợp này tổng thể α là quá cao so với ...

pdf165 trang | Chia sẻ: havih72 | Lượt xem: 213 | Lượt tải: 0download
Nội dung tài liệu Luận văn Ước lượng và kiểm định trong thống kê nhiều chiều, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
________________________________________________________ 
 137 Chương 4 
( ) ( )
( )( )
2
1 2
1 2 3
6 1
p p p
c
v p p p
+ −= − + − 4 , 
( )( )
( )
2
2 2 2
1 2
6 4
p p p
c
v p p
− += + − 
( )1 1 1 22 p pγ = + − , 12 22 1
2
c c
γγ += − 
Ta bác bỏ giả thiết ( )20 1: I+H J⎡σ ρ ρ ⎤∑ = − ⎦ 1 2, ,F F nếu ⎣ α γ γ> . 
Ví dụ 4.2: Để minh họa kiểm định này, ta sử dụng các dữ liệu của việc cân nặng 
tĩnh cây bần từ các hướng giữ đông tây nam bắc, dữ liệu về cân nặng 28 cây từ bốn 
hướng giữ cho trong Bảng 4.1 sau; 
. Stt Cây 
Bảng 4.1: dữ liệu cân nặng của 28 cây bần giữ từ bốn hướng 
Một tiêu chuẩn ANOVA tiếp cận lặp lại biện pháp thiết kế sẽ hợp lí nếu 
(4.10) được cố định. Để kiểm tra giả thiết này, ta kiểm định giả thiết 
( )20 1:H I+ Jσ ρ ρ⎡∑ = −⎣ ⎤⎦ . Các ma trận hiệp phương sai mẫu được cho bởi: 
 , 
__________________________________________________________________ 
 138 Chương 4 
từ đó ta thu được 
Từ (4.15) và (4.16), ta có 
Do ta bác bỏ giả thiết H20 05 819 511 15 5. ,. χ> = . 0 và kết luận rằng mô hình ∑ 
không có trong (4.10). 
4. 3 So sánh các kiểm định ma trận phương sai : 
Một giả thiết cho T2 hoặc MANOVA (phân tích phương sai nhiều chiều so 
sánh kiểm định hai hoặc nhiều hơn vectors kì vọng mà tương ứng tổng thể ma trận 
hiệp phương sai là bằng nhau: 1 2 ... k∑ = ∑ = = ∑ . Giả thiết dưới đây, ma trận hiệp 
phương sai mẫu phản ánh một tổng thể và do đó hợp nhất để có được 
một ước lượng của . Nếu
1 2 kS ,S ,...,S
∑ 1 2 ... k∑ = ∑ = = ∑ là sai, sự khác biệt lớn trong 
 có thể dẫn việc bác bỏ 1 2 kS ,S ,...,S 0 1 2: μ μ ... μkH = = = . Tuy nhiên, T2 và các 
kiểm định MANOVA là khá mạnh mẽ để không đồng nhất ma trận hiệp phương sai 
miễn là mẫu kích cỡ lớn và bằng nhau. Đối với các trường hợp khác, nó hữu ích để 
có một kiểm định bằng nhau cho các ma trận hiệp phương sai. Ta sẽ bắt đầu với 
việc nhắc lại trường hợp đơn biến. 
__________________________________________________________________ 
 139 Chương 4 
4. 3. 1 Kiểm đinh phương sai bằng nhau 
Hai mẫu đơn biến với giả thiết 20 1:H
2
2σ σ= đối thiết 21 1 2:H 2σ σ≠ đã được 
kiểm định với 
2
1
2
1
sF
s
= (4.17) 
ở đây 21s và 
2
1s là các phương sai của hai mẫu. Nếu H0 là đúng, f có phân phối như 
, ở đây và là các bậc tự do của 
1 2,v v
F 1v 2v
2
1s và 
2
1s (thường là n1-1 và n2-1). Lưu 
ý rằng 21s và 
2
1s phải được độc lập, trong đó sẽ cố định, nếu hai mẫu được độc lập. 
Đối với trường hợp mẫu tổng quát, các thủ thuật khác nhau đã được đề xuất. 
Để kiểm định 
2 2
0 1 2: ... kH
2σ σ σ= = = 
Ta tính toán 
( ) 1
1
1 1 11
3 1
k
k
i i ii
c
k v v= =
⎡ ⎤⎢ ⎥= + −− ⎢ ⎥⎣ ⎦
∑ ∑ , 
2
2 1
1
k
i ii
k
ii
v s
s
v
=
=
= ∑∑ , 
2 2
1 1
ln ln
k k
i i
i i
m v s v
= =
⎛ ⎞= −⎜ ⎟⎝ ⎠∑ ∑ is , 
ở đây 2 2 21 2, , ..., ks s s là phương sai mẫu độc lập với bậc tự do tương ứng. 
Thì 
1 2, , ..., kv v v
m
c
 được xấp xỉ 2 1kχ − . 
Ta bác bỏ giả thiết H0 nếu 2 1,k
m
c α
χ −> . 
Cho xấp xỉ F, ta sử dụng c và m, tính toán thêm 
1 1a k= − , ( )2 2
1
1
ka
c
+= − , 
2
22 2
ab
c a
= − + 
__________________________________________________________________ 
 140 Chương 4 
Sau đó ( )21
a mF
a b m
= − được xấp xỉ 1 2,a aF
Ta bác bỏ giả thiết H0 nếu F> Fα.Lưu ý rằng giả thiết cho một trong hai dạng 
kiểm định trước là sự độc lập của 2 21 2, , ..., k
2s s s , ta sẽ cố định cho k mẫu ngẫu nhiên 
riêng biệt từ tổng thể. Kiểm định này do đó có thể không thích hợp để so sánh 
11 22, , ..., pps s s trên đường chéo của S, vì vậy các sjj của S là tương quan. 
4. 3. 2 Kiểm định bằng nhau các ma trận hiệp phương sai nhiều chiều : 
Cho tổng thể k chiều, giả thiết các ma trận hiệp phương sai là bằng nhau : 
0 1 2: ... kH ∑ = ∑ = = ∑ 
Kiểm định cho hai nhóm được nghiên cứu như một trường hợp đặc 
biệt với đặt cách k = 2. Không có kiểm định chính xác như có trong 
các trường hợp đơn biến tương tự. Ta giả định rằng các mẫu độc lập về kích cỡ 
 từ phân phối chuẩn nhiều chiều. Để thực hiện kiểm định, ta tính : 
0 1:H ∑ = ∑2
20 1:H ∑ = ∑
1 2, , ..., kn n n
1 22 2
1 2
2
S S ... S
=
S
k
ii
v v v
k
v
pl
M ∑
2
 (4.19) 
Mà trong đó bởi , ma trận hiệp phương sai thứ i của mẫu, và 1i iv n= − Si S pl ma 
trận hiệp phương sai mẫu hợp nhất 
 1
1
S ES
k
i ii
pl k
Eii
v
vv
=
=
= =∑∑ (4.20) 
Ở đây E được cho bởi : 
( )( )
1 1 1 1 1
1' ' 'E y y y y y y
i in nk k
ij ij ij ij i ii i
i j i j i in= = = = =
= − − = −∑∑ ∑∑ ∑ y yk
k−
 và . Rõ ràng là ta phải có mỗi ν
1
k
E i ii i
v v n== =∑ ∑ i> p; hơn nữa 0iS = với 
mỗi i, và M sẽ là 0. Chính xác cả trên tỷ lệ phần trăm kết quả của 
__________________________________________________________________ 
 141 Chương 4 
( )2ln ln S Spl iM v k− = −∑ i v cho trường hợp đặc biệt . Ta 
có thể dễ dàng sửa đổi (4.19) và (4.20) để so sánh các ma trận hiệp phương sai cho 
các thành phần của một mô hình hai chiều bằng cách sử dụng 
1 2 ... kv v v= = = =
1ij ijv n= −
Các thống kê M là sự điều chỉnh tỷ số hợp lí thay đổi giữa 0 và 1, với giá trị 
gần lân cận 1 thiên về H0 trong (4.18) và giá trị gần 0 dẫn đến quyết định bác bỏ giả 
thiết H0. Không phải rõ ràng trực tiếp rằng M trong (4.19) xử lí theo cách này, và ta 
đưa ra tiên nghiệm theo lập luận sau . 
Trước tiên, ta lưu ý rằng (4.19) có thể biểu diễn : 
1 22 2
1 2 k
pl pl pl
S S S
...
S S S
kv v
M
⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎜ ⎟ ⎜ ⎟ ⎜ ⎟= ⎜ ⎟ ⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠ ⎝ ⎠
2v
pl
 (1.21) 
Nếu thì M = 1. Chênh lệch giữa các S1 2S S ... S Sk= = = = 1, S2,. . . , Sk 
tăng lên thì M xấp xỉ 0. Để thấy rõ điều này, ta lưu ý rằng các định thức của ma 
trận hiệp phương sai hợp nhất | Spl |, nằm một nơi nào đó gần giữa các | Si | . Cũng 
như tập hợp các biến tăng lên, tích vô hướng 1 2, , ..., nz z z ( )1z z giảm hơn ( )nz z 
tăng nó, ở đây z(1) và z(n) là giá trị nhỏ nhất và lớn nhất tương ứng. Ta minh họa 
điều này với hai tập số {4, 5, 6} và {1, 5, 9}, có cùng kì vọng nhưng độ lệch khác 
nhau. Nếu ta giả sử , thì thiết lập đầu tiên là 1 2 3v v v= = = v
( )( )( ) ( )
2
2 2
1
4 5 6 0 8 1 1 2 0 96
5 5 5
. . .
v
v vM ⎡ ⎤⎛ ⎞⎛ ⎞⎛ ⎞ ⎡ ⎤= = =⎜ ⎟⎜ ⎟⎜ ⎟⎢ ⎥ ⎣ ⎦⎝ ⎠⎝ ⎠⎝ ⎠⎣ ⎦ 
và thứ hai, 
( )( )( ) ( )
2
2
2
1 5 9 0 2 1 1 8 0 36
5 5 5
. . .
v
v
M ⎡ ⎤⎛ ⎞⎛ ⎞⎛ ⎞ ⎡ ⎤= =⎜ ⎟⎜ ⎟⎜ ⎟⎢ ⎥ ⎣ ⎦⎝ ⎠⎝ ⎠⎝ ⎠⎣ ⎦ = 
Trong M2, giá trị nhỏ nhất 0.2 làm giảm tỉ lệ tích hơn so với giá trị lớn nhất 
1.8 làm tăng nó. 
__________________________________________________________________ 
 142 Chương 4 
Box (1949, 1950) đưa ra χ2 và xấp xỉ F cho phân phối của M. Cũng có nhiều 
kiểm định xấp xỉ như M-test của Box được tham khảo đến. Cho xấp xỉ χ2, ta tính 
 ( )( )
2
1
1
1
1 1 2 3 1
6 1 1
k
k
i i ii
p pc
v pv= =
⎡ ⎤
k
⎡ ⎤+ −⎢ ⎥= − ⎢ ⎥+ −⎢ ⎥ ⎣ ⎦⎣ ⎦
∑ ∑ (4.22) 
Từ đó 
 là xấp xỉ ( )12 1 lnu c= − − M ( ) (2 1 1 12 k p pχ )⎡ ⎤− +⎢ ⎥⎣ ⎦ (4.23) 
 ở đây M được xác định trong (4.19), và 
1 1
1 1
2 2
ln ln S ln S
k k
i i i
i i
M v v
= =
⎛ ⎞= − ⎜ ⎟⎝ ⎠∑ ∑ pl
v
 (4.24) 
Ta bác bỏ H0 nếub u > χ2. Nếu 1 2 ... kv v v= = = = , thì đơn giản thành: 1c
( )( )
( )
2
1
1 2 3 1
6 1
k p p
c
kv p
+ + −= + (4.25) 
Để hiệu chỉnh số bậc tự do của xấp xỉ χ2, lưu ý rằng tổng số của cận dưới các 
tham số ước lượng với H1 là (1 12k p p )⎡ ⎤+⎢ ⎥⎣ ⎦ trong đó với H0 chúng ta ước lượng 
 , nó có ∑ (1 1
22
p
p p p⎛ ⎞+ = +⎜ ⎟⎝ ⎠ ) tham số. Sự khác biệt là ( ) ( )
11 1
2
k p p⎡ ⎤− +⎢ ⎥⎣ ⎦ . 
Lượng (1 1
2
k p p⎡ +⎢⎣ ⎦)
⎤⎥ k phát sinh từ giả thiết rằng tất cả 1 2, , , ...,i i∑ = là khác 
nhau. Về kỹ thuật, H1 có thể bắt đầu i j∑ ≠ ∑ với i j≠ . Tuy nhiên, nói chung hầu 
hết các trường hợp tất cả khác nhau, và phân phối của M được suy ra một cách 
phù hợp. 
i∑
Cho xấp xỉ F, chúng ta sử dụng c1 từ (4.22) và tính toán thêm, 
__________________________________________________________________ 
 143 Chương 4 
( )( )
( ) ( )2 221 1
1 2 1 1
6 1
k
ki i
ii
p p
c
k v v= =
⎡ ⎤⎡ ⎤− + ⎢ ⎥= −⎢ ⎥ ⎢ ⎥−⎣ ⎦ ⎢ ⎥⎣ ⎦
∑ ∑ (4.26) 
 ( ) (1 1 1 12a k p p )= − + , 12 22 1
2aa
c c
+= − , 
 1 11
1
1 c a ab
a
− −= 2 , 1 22
2
1 2c ab
a
− += 
Nếu , 22 1c c>
 được xấp xỉ (4.27) 12 lnF b= − M 1 2,a aF
Nếu , 22 1c c<
 ( )2 21 2
2
1 2
ln
ln
a b MF
a b M
= + được xấp xỉ là (4.28) 1 2,a aF
Trong cả hai trường hợp, ta bác bỏ H0 nếu F > Fα. Nếu , 
thì c
1 2 ... kv v v= = = = v
1 đơn giản hóa như trong (4.25) và c2 được đơn giản hóa thành 
( )( )( )2
2 2 2
1 2
6
p p k k
c
k v
1− + + += 
M-test của Box được tính thường xuyên trong nhiều chương trình máy tính 
cho MANOVA. Tuy nhiên, Olson (1974) cho thấy M-test với các νi bằng nhau có 
thể tìm một vài dạng của sự không đồng nhất mà chỉ có tác động nhỏ trên kiểm định 
MANOVA. Kiểm định này cũng chính xác với vài dạng trực chuẩn. Ví dụ, nó chính 
xác với độ nhọn mà kiểm định MANOVA là khá mạnh mẽ. Do đó, M-test có thể 
báo hiệu sự không đồng nhất hiệp phương sai mà không phải là gây tổn hại đến 
kiểm định MANOVA.Do đó ta có thể không muốn tự động quy định ra tiêu chuẩn 
kiểm định MANOVA nếu M-test dẫn đến bác bỏ H0. Olson cho thấy dộ chệch và độ 
nhọn thống kê b1,p và b2,p có những hạn chế tương tự. 
__________________________________________________________________ 
 144 Chương 4 
Ví dụ 4.3. Ta kiểm định giả thiết 0 1:H 2∑ = ∑ cho các dữ liệu tâm lí trong Bảng 
3.2. Các ma trận hiệp phương sai S1, S2, và Spl đã được đưa ra trong ví dụ 3.3. Sử 
dụng những kết quả này, từ (4. 24) ta có được 
Để kiểm định chính xác, chúng ta so sánh 2 14 5ln . 61M− = với 19.74, giá trị tới 
hạn của nó được tra từ Bảng B3 (Phụ lục B). Cho xấp xỉ χ2, từ (4.25) và (4.23) ta 
tính được: 
Để xấp xỉ F-test, trước tiên ta tính toán: 
Từ ta dùng (4.27) để có được 21 10 005463 0 0048.c c= > = .
1 0 05 102 1 354 1 83. , ,ln . .F b M F ∞= − = < = 
__________________________________________________________________ 
 145 Chương 4 
Vì vậy, cả ba kiểm định đều chấp nhận giả thiết H0. 
4. 4 Kiểm định tính độc lập : 
4. 4. 1 Độc lập của hai vector con : 
Giả sử các véc tơ quan sát được chia thành hai vector con quan sát, trong đó 
chúng ta đặt y và x, như trong mục 1.2.4.1, ở đây y là p×1 và x là q×1. Từ công 
thức (1.30), các phân vùng tương ứng của ma trận hiệp phương sai tổng thể là: 
yy y x
xy x x
∑ ∑⎛ ⎞∑ = ⎜ ⎟⎜ ⎟∑ ∑⎝ ⎠
với phân vùng tương tự của S và R như trong (1.26): 
S S
S
S S
yy y x
xy x x
⎛ ⎞= ⎜ ⎟⎜ ⎟⎝ ⎠
 , 
R R
R
R R
yy y x
xy x x
⎛ ⎞= ⎜ ⎟⎜ ⎟⎝ ⎠
Giả thuyết các độc lập của y và x có thể được diễn tả như 
0
0
:
0
yy
xx
H
∑⎛ ⎞∑ = ⎜ ⎟∑⎝ ⎠
 hoặc là 0 : 0yxH ∑ = 
Do đó, sự độc lập của y và x kì vọng là mọi biến trong y là độc lập của mọi 
biến trong x. Lưu ý là không có giới hạn trên yy∑ hoặc xx∑ 
Các thống kê kiểm định tỉ số hợp lí 0 : yxH 0∑ = cho bởi 
S R
S S R Ryy xx yy xx
Λ = = (4.30) 
có phân phối như 1, ,p q n q− −Λ . Ta bác bỏ giả thiết H0 nếu αΛ ≤ Λ . Như vậy, ta có 
một kiểm định chính xác cho 0 : yxH 0∑ = . Giá trị tới hạn cho của Wilks được 
cho trong Bảng A.9 [TL Rencher - Methods of Multivariate Analysis] bằng cách sử 
dụng và . 
Λ
Hv = q q1Ev n= − −
Do tính đối xứng của 
__________________________________________________________________ 
 146 Chương 4 
S R
S S R Ryy xx yy xx
= 
Λ trong (4.30) cũng được phân phối như 1, ,p q n q− −Λ . 
Lưu ý rằng | Syy | | Sxx | trong (4.30) là một ước lượng của yy∑ xx∑ , từ : 
11
11 22
22
0
A A
0
A
A
= = A 
nên được xác định khi . Do đó ∑ 0yx∑ = Λ của Wilks so sánh một ước lượng của 
 không có hạn chế một ước lượng với giả thiết ∑ 0 : yxH 0∑ = . Ta có thể thấy một 
cách trực giác rằng | S | < | Syy | | Sxx | , chú ý là : 
11 12 1 1
11 22 21 11 12 22 11 12 22 21
21 22
A A
A A A A A A A A A A
A A
− −= − − = − 
Nên 1S S S S S Sxx yy yx xx xy
−= − và là xác định dương, 1S S Syx xx xy−
1S S S S Syy yx xx xy yy
−− < . Điều này có thể được minh họa cho trường hợp p = q = 1: 
( )2 22 2 2 22S y yx y x yx y x
yx x
s s
s s s s
s s
= = − < s 
khi 2yxs tăng, | S | giảm. 
Λ của Wilks trong (4.30) có thể biểu diễn trong điều kiện của vectơ riêng: 
 (4.31) ( )2
1
1
s
i
i
r
=
Λ = −∏
Ở đây s = min (p, q) và là giá trị riêng khác 0 của 2 'ir s
1 1S S S Sxx xy yy yx
− − . Chúng ta 
cũng có thể sử dụng , giá trị riêng (khác 0) của là giống 
như 
1 1S S S Syy yx xx xy
− − 1 1S S S Syy yx xx xy
− −
1 1S S S Sxx xy yy yx
− − Số các giá trị riêng khác 0 là s=min(p,q), vì s là hạng của cả 
 và 1 1S S S Syy yx xx xy
− − 1 1S S S Sxx xy yy yx
− − Các giá trị riêng kí hiệu vì chúng là những bình 2ir
__________________________________________________________________ 
 147 Chương 4 
phương tương quan chính tắc giữa y và x. Trong những trường hợp đặc biệt p = 1, 
(4.31) sẽ trở thành 
2 21 1ir RΛ = − = − 
g quan bội giữa y và ( )1 2, , ..., qx x x . đây R2 là bình phương của tở ươn
Ví dụ 4.4: Xét các dữ liệu bệnh tiểu đường trong Bảng 1.2. Có một phân vùng tự 
nhiên trong các biến, với y1 và y2 của quan sát nhỏ và x1, x2, và x3 của quan sát 
chính. Ta kiểm định độc lập của của y và x, nghĩa là, 0 : yxH 0∑ = . Từ ví dụ 1.2, 
các ma trận hiệp phương sai được phân chia là : 
. 
Để thực hiện kiểm định, ta tính : 
Vì vậy, chúng ta bác bỏ giả thiết của sự độc lập. Lưu ý việc sử dụng số 40 
trong là của n-1-q=46-1-3=42. Đây là một phương pháp tiếp cận bảo 
toàn cho phép sử dụng bảng giá trị mà không có phép nội suy. 
0 05 2 3 40. , , ,Λ
4. 4. 2 Sự độc lập của nhiều vectors con : 
Cho k tập hợp các biến sao cho y và ∑ được chia như sau 
1
2
y
y
y
yk
⎛ ⎞⎜ ⎟⎜= ⎜⎜ ⎟⎜ ⎟⎝ ⎠
#
⎟⎟ và 
11 12 1
21 22 2
1 2
k
k
k k kk
∑ ∑ ∑⎛ ⎞⎜ ⎟∑ ∑ ∑⎜ ⎟∑ = ⎜ ⎟⎜ ⎟⎜ ⎟∑ ∑ ∑⎝ ⎠
"
"
# # #
"
__________________________________________________________________ 
 148 Chương 4 
với pi các biến trong yi, với 1 2 ... kp p p p+ + + = .Lưu ý rằng không 
đại diện phân vùng nào của y, không phải là mẫu vectors ngẫu nhiên độc lập. 
Nhưng giả thuyết rằng nhóm vectors con độc lập nhau và có thể được 
biểu diễn với giả thiết 
1 2y ,y , ,yk
1 2y ,y , ,yk
0 : i jH 0∑ = cho tất cả các i j≠ , hoặc 
 (4.32) 
11
22
0
0 0
0 0
:
0 0 kk
H
∑⎛ ⎞⎜ ⎟∑⎜∑ = ⎜⎜ ⎟⎜ ⎟∑⎝ ⎠
"
"
# # #
"
⎟⎟
Thống kê tỉ số hợp lí là 
11 22
S
S S ... Skk
u = (4.33) 
11 22
R
R R ... Rkk
= (4.34) 
với S và R có được từ mẫu ngẫu nhiên của n quan sát và được phân chia như ∑ ở 
trên, tương ứng . Lưu ý rằng mẫu thức ở (4.33) là định thức của S bị 
thu hẹp bởi H
1 2y ,y ,...,yk
0, có nghĩa là Si j 0= với mọi i j≠ . Các thống kê u không có phân 
phối của Wilks như trong (4.30) khi k = 2, nhưng là xấp xỉ χΛ 2 tốt để phân phối 
của nó được cho bởi 
 ' lnu vc u= − (4.35) 
ở đây 
 ( )3 211 2 312c afv= − + a (4.36) 
 2
1
2
f a= , 2 22
1
k
i
i
a p p
=
= −∑ , 3 33
1
k
i
i
a p p
=
= −∑
__________________________________________________________________ 
 149 Chương 4 
và ν là bậc tự do của S hay R (xem tại phần đầu của mục 4.2). Ta bác bỏ giả thiết 
độc lập, nếu 2' , fu αχ> 
Bậc tự do, 2
1
2
f a= , phát sinh từ suy luận sau. Số tham số trong không bị 
giới hạn bởi các Giả thuyết là 
∑
(1 1
2
p p )+ . Với giả thiết ở (4. 32), số các tham số 
trong mỗi là ii∑ (1 12 i ip p + ) , với tổng số là (1
1 1
2
k
i ii
p p= )+∑ . Sự khác biệt là : 
( ) ( ) 2 21
2 2 2 2 2
1 1 11 1
2 2 2
1 1
2 2 2
k
i i ii
i i
i i
i i
f p p p p p p p p
ap p p p p p
=
⎛ ⎞= + − + = + − −⎜ ⎟⎝ ⎠
⎛ ⎞ ⎛ ⎞= + − − = − =⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠
∑ ∑ ∑
∑ ∑
Ví dụ 4.5: Cho 30 nhãn hiệu sản phẩm của rượu vang Nhật Bản Seishu, Siotani, 
...v.v... (1963) nghiên cứu mối quan hệ giữa y1 = hương vị, y2 = mùi, và : 
 x1 = pH, x5 = trực tiếp giảm đường, 
 x2 = nồng độ axít 1, x6 = tổng số đường, 
 x3 = độ axít 2, x7 = rượu, 
 x4 = độ sake, x8 = formyl-nitơ. 
Ta kiểm định độc lập của bốn tập con của các biến: 
Các ma trận hiệp phương sai mẫu là : 
__________________________________________________________________ 
 150 Chương 4 
Bảng 4.2: Đo lường rượu Seishu 
__________________________________________________________________ 
 151 Chương 4 
với S11 là 2 × 2, S22 là 3 × 3, S33 là 3 × 3, và S44 là 2 × 2. Trước tiên ta thu được : 
Với xấp xỉ χ2, ta tính được : 
Sau đó, u’ =-νc ln u = -(29)(0.838)ln(0.01627) = 100.122, kết quả này vượt quá 
, và ta bác bỏ giả thuyết của độc lập của bốn tập con. 20 001 37 69 35. , .χ =
4. 4. 3 Kiểm định độc lập cho tất cả các biến : 
Nếu tất cả các pi = 1 trong giả thiết (4.32) trong mục 4.4.2, trường hợp đặc 
biệt là tất cả các biến cùng độc lập, 0 0: jkH σ = với i j≠ , hoặc 
11
22
0
0 0
0 0
0 0
:
kk
H
σ
σ
σ
⎛ ⎞⎜ ⎟⎜ ⎟∑ = ⎜ ⎟⎜ ⎟⎜ ⎟⎝ ⎠
"
"
# # #
"
Không có giới hạn trên của các σjj. Với σjk = 0 với mọi i j≠ , tương ứng ρjk cũng là 
0, và một dạng tương đương của giả thiết là: 0 : P IH ρ = , ở đây Pρ là ma trận 
tương quan tổng thể đã được xác định trong (1.24). 
Vì mọi pi = 1, thống kê (4.33) và (4.34) làm giảm 
__________________________________________________________________ 
 152 Chương 4 
11 22
S
R
. ... pp
u
s s s
= = (4.37) 
và (4.35) sẽ trở thành 
 ( )1 2 5
6
' lnu v p⎡= − − +⎢⎣ ⎦ u
⎤⎥ (4.38) 
trong đó có một xấp xỉ phân phối 2fχ , với ν là bậc tự do của S hoặc R (xem một 
nhận xét ở phần đầu của mục 4.2) và (1 1
2
f p p )= − là bậc tự do của χ2. Ta bác bỏ 
giả thiết H0 nếu 2' , fu αχ> . Chính xác cả tỷ lệ phần trăm các điểm của u’ để lựa 
chọn các giá trị của p và n được cho trong Bảng B4 (Mathai và Katiyar 1979). Số 
điểm tỷ lệ phần trăm giới hạn phân phối χ2 cũng được đưa ra để so sánh. 
Lưu ý rằng |R| trong (4.37) chạy từ 0 đến 1. Nếu các biến số không tương 
quan (trong mẫu), chúng ta có R = I và |R| = 1. Mặt khác, nếu hai hoặc nhiều hơn 
các biến có quan hệ tuyến tính, R sẽ không có hạng đầy đủ và chúng ta có |R| = 0. 
Nếu các biến số tương quan cao hơn, |R| sẽ là gần đến 0; nếu tương quan là rất nhỏ, 
|R| sẽ được gần đến 1. Điều này có thể được minh họa khi cho p = 2: 
1
1
R
r
r
= 
Ví dụ 4.6 : Để kiểm tra Giả thuyết 0 0: ,jkH j kσ = ≠ , với bộ dữ liệu thăm dò từ 
Bảng 1.3, ta tính được : 
Sau đó, từ (4.37) và (4.38), ta có 
__________________________________________________________________ 
 153 Chương 4 
Với độ chính xác 0,01 giá trị quyết định cho u’ tra từ Bảng B4 là 23.75 và do đó ta 
bác bỏ giả thiết H0. Giá trị quyết định xấp xỉ χ2 cho u’ là , nên giả 
thiết H
2
0 01 10 23 21. , .χ =
0. bị bác bỏ. 
__________________________________________________________________ 
 Phụ lục A 
TÀI LIỆU THAM KHẢO 
Tiếng Việt 
[1] Đào Hữu Hồ, Nguyễn Văn Hữu, Hoàng Hữu Như (2004), Thống Kê Toán Học, 
NXB. ĐHQG Hà Nội, Hà Nội. 
[2] Đào Hữu Hồ (2001), Xác Suất Thống Kê, NXB. ĐHQG Hà Nội, in lần thứ 6, Hà 
Nội. 
[3] Nguyễn Bác Văn (1998), Xác Suất và Xử Lý Số Liệu Thống Kê; NXB. Giáo 
Dục, TP. Hồ Chí Minh. 
Tiếng Anh 
[4] Rencher, A.C. (2002), Methods of multivariate analysis, John Wiley & Sons, 
Inc., 605 Third Avenue, New York. 
[5] Wolfgang Hardle, Léopold Simar (2007), Applied Multivariate Statistical 
Analysis, Springer Berlin Heidelberg, New York. 
[6] Nigel Da Costa Lewis (2004), Applied Statistical Methods for Risk 
Management, John Wiley & Sons, Inc., Hoboken, New Jersey. 
[7] Rencher, A. C. (1998), Multivariate Statistical Inference and Applications, 
Wiley , New York. 
__________________________________________________________________ 
Bảng giá trị phân phối T2 - Hotelling Bảng B1 Phụ lục B 
B
ậc
 tự
 d
o,
 v
__________________________________________________________________ 
Bảng giá trị phân phối T2 - Hotelling Bảng B1 Phụ lục B 
__________________________________________________________________ 
Bảng giá trị t - Bonferonni - 2 0 05, , .k vtα α = Bảng B2 Phụ lục B2 
__________________________________________________________________ 
Kiểm định sự bằng nhau của hai ma trận hiệp phương sai Bảng B3 Phụ lục B 
( )2ln ln S Spl iiM v k− = −∑ 
__________________________________________________________________ 
Kiểm định cho sự độc lập của p biến Bảng B4 Phụ lục B 
__________________________________________________________________ 

File đính kèm:

  • pdfluan_van_uoc_luong_va_kiem_dinh_trong_thong_ke_nhieu_chieu.pdf
Ebook liên quan