Luận văn Ước lượng và kiểm định trong thống kê nhiều chiều
Tóm tắt Luận văn Ước lượng và kiểm định trong thống kê nhiều chiều: ...cách giữa vector η pD∈ và Y đạt cực tiểu khi là hình chiếu trực giao của Y lên . η pD Giả sử là vector sao cho : β η Xβ= β là ước lượng bình phương bé nhất của . Để tìm ta để ý rằng β β Xβ là hình chiếu trực giao của Y lên , do đó pD ( )( ) ( ) 0 1ξ Y Xβ , , ..., .Ti i p− = = ...ơng trung bình mắc phải khi tính bởi biểu thức ở vế phải được gọi là phương sai phần dư. Nó được tính bởi: 21.23... * 11 det mσ Λ= Λ Hệ số tương quan bội (hệ số tương quan tập hợp) đo mức độ phụ thuộc tuyến tính giữa và tổ hợp tuyến tính ở vế phải của công thức tính là: 1X 2 * 1.23... ... Trong thực tế, nó rất ít an toàn, nhưng điều này rất được ưa chuộng để kiểm định một biến (trong giới hạn nghiên cứu của họ). Họ cũng so sánh các phương pháp này với các kiểm định khác mà không tiên nghiệm 2T test− ( kiểm định không bảo hộ). Trong trường hợp này tổng thể α là quá cao so với ...
________________________________________________________ 137 Chương 4 ( ) ( ) ( )( ) 2 1 2 1 2 3 6 1 p p p c v p p p + −= − + − 4 , ( )( ) ( ) 2 2 2 2 1 2 6 4 p p p c v p p − += + − ( )1 1 1 22 p pγ = + − , 12 22 1 2 c c γγ += − Ta bác bỏ giả thiết ( )20 1: I+H J⎡σ ρ ρ ⎤∑ = − ⎦ 1 2, ,F F nếu ⎣ α γ γ> . Ví dụ 4.2: Để minh họa kiểm định này, ta sử dụng các dữ liệu của việc cân nặng tĩnh cây bần từ các hướng giữ đông tây nam bắc, dữ liệu về cân nặng 28 cây từ bốn hướng giữ cho trong Bảng 4.1 sau; . Stt Cây Bảng 4.1: dữ liệu cân nặng của 28 cây bần giữ từ bốn hướng Một tiêu chuẩn ANOVA tiếp cận lặp lại biện pháp thiết kế sẽ hợp lí nếu (4.10) được cố định. Để kiểm tra giả thiết này, ta kiểm định giả thiết ( )20 1:H I+ Jσ ρ ρ⎡∑ = −⎣ ⎤⎦ . Các ma trận hiệp phương sai mẫu được cho bởi: , __________________________________________________________________ 138 Chương 4 từ đó ta thu được Từ (4.15) và (4.16), ta có Do ta bác bỏ giả thiết H20 05 819 511 15 5. ,. χ> = . 0 và kết luận rằng mô hình ∑ không có trong (4.10). 4. 3 So sánh các kiểm định ma trận phương sai : Một giả thiết cho T2 hoặc MANOVA (phân tích phương sai nhiều chiều so sánh kiểm định hai hoặc nhiều hơn vectors kì vọng mà tương ứng tổng thể ma trận hiệp phương sai là bằng nhau: 1 2 ... k∑ = ∑ = = ∑ . Giả thiết dưới đây, ma trận hiệp phương sai mẫu phản ánh một tổng thể và do đó hợp nhất để có được một ước lượng của . Nếu 1 2 kS ,S ,...,S ∑ 1 2 ... k∑ = ∑ = = ∑ là sai, sự khác biệt lớn trong có thể dẫn việc bác bỏ 1 2 kS ,S ,...,S 0 1 2: μ μ ... μkH = = = . Tuy nhiên, T2 và các kiểm định MANOVA là khá mạnh mẽ để không đồng nhất ma trận hiệp phương sai miễn là mẫu kích cỡ lớn và bằng nhau. Đối với các trường hợp khác, nó hữu ích để có một kiểm định bằng nhau cho các ma trận hiệp phương sai. Ta sẽ bắt đầu với việc nhắc lại trường hợp đơn biến. __________________________________________________________________ 139 Chương 4 4. 3. 1 Kiểm đinh phương sai bằng nhau Hai mẫu đơn biến với giả thiết 20 1:H 2 2σ σ= đối thiết 21 1 2:H 2σ σ≠ đã được kiểm định với 2 1 2 1 sF s = (4.17) ở đây 21s và 2 1s là các phương sai của hai mẫu. Nếu H0 là đúng, f có phân phối như , ở đây và là các bậc tự do của 1 2,v v F 1v 2v 2 1s và 2 1s (thường là n1-1 và n2-1). Lưu ý rằng 21s và 2 1s phải được độc lập, trong đó sẽ cố định, nếu hai mẫu được độc lập. Đối với trường hợp mẫu tổng quát, các thủ thuật khác nhau đã được đề xuất. Để kiểm định 2 2 0 1 2: ... kH 2σ σ σ= = = Ta tính toán ( ) 1 1 1 1 11 3 1 k k i i ii c k v v= = ⎡ ⎤⎢ ⎥= + −− ⎢ ⎥⎣ ⎦ ∑ ∑ , 2 2 1 1 k i ii k ii v s s v = = = ∑∑ , 2 2 1 1 ln ln k k i i i i m v s v = = ⎛ ⎞= −⎜ ⎟⎝ ⎠∑ ∑ is , ở đây 2 2 21 2, , ..., ks s s là phương sai mẫu độc lập với bậc tự do tương ứng. Thì 1 2, , ..., kv v v m c được xấp xỉ 2 1kχ − . Ta bác bỏ giả thiết H0 nếu 2 1,k m c α χ −> . Cho xấp xỉ F, ta sử dụng c và m, tính toán thêm 1 1a k= − , ( )2 2 1 1 ka c += − , 2 22 2 ab c a = − + __________________________________________________________________ 140 Chương 4 Sau đó ( )21 a mF a b m = − được xấp xỉ 1 2,a aF Ta bác bỏ giả thiết H0 nếu F> Fα.Lưu ý rằng giả thiết cho một trong hai dạng kiểm định trước là sự độc lập của 2 21 2, , ..., k 2s s s , ta sẽ cố định cho k mẫu ngẫu nhiên riêng biệt từ tổng thể. Kiểm định này do đó có thể không thích hợp để so sánh 11 22, , ..., pps s s trên đường chéo của S, vì vậy các sjj của S là tương quan. 4. 3. 2 Kiểm định bằng nhau các ma trận hiệp phương sai nhiều chiều : Cho tổng thể k chiều, giả thiết các ma trận hiệp phương sai là bằng nhau : 0 1 2: ... kH ∑ = ∑ = = ∑ Kiểm định cho hai nhóm được nghiên cứu như một trường hợp đặc biệt với đặt cách k = 2. Không có kiểm định chính xác như có trong các trường hợp đơn biến tương tự. Ta giả định rằng các mẫu độc lập về kích cỡ từ phân phối chuẩn nhiều chiều. Để thực hiện kiểm định, ta tính : 0 1:H ∑ = ∑2 20 1:H ∑ = ∑ 1 2, , ..., kn n n 1 22 2 1 2 2 S S ... S = S k ii v v v k v pl M ∑ 2 (4.19) Mà trong đó bởi , ma trận hiệp phương sai thứ i của mẫu, và 1i iv n= − Si S pl ma trận hiệp phương sai mẫu hợp nhất 1 1 S ES k i ii pl k Eii v vv = = = =∑∑ (4.20) Ở đây E được cho bởi : ( )( ) 1 1 1 1 1 1' ' 'E y y y y y y i in nk k ij ij ij ij i ii i i j i j i in= = = = = = − − = −∑∑ ∑∑ ∑ y yk k− và . Rõ ràng là ta phải có mỗi ν 1 k E i ii i v v n== =∑ ∑ i> p; hơn nữa 0iS = với mỗi i, và M sẽ là 0. Chính xác cả trên tỷ lệ phần trăm kết quả của __________________________________________________________________ 141 Chương 4 ( )2ln ln S Spl iM v k− = −∑ i v cho trường hợp đặc biệt . Ta có thể dễ dàng sửa đổi (4.19) và (4.20) để so sánh các ma trận hiệp phương sai cho các thành phần của một mô hình hai chiều bằng cách sử dụng 1 2 ... kv v v= = = = 1ij ijv n= − Các thống kê M là sự điều chỉnh tỷ số hợp lí thay đổi giữa 0 và 1, với giá trị gần lân cận 1 thiên về H0 trong (4.18) và giá trị gần 0 dẫn đến quyết định bác bỏ giả thiết H0. Không phải rõ ràng trực tiếp rằng M trong (4.19) xử lí theo cách này, và ta đưa ra tiên nghiệm theo lập luận sau . Trước tiên, ta lưu ý rằng (4.19) có thể biểu diễn : 1 22 2 1 2 k pl pl pl S S S ... S S S kv v M ⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎜ ⎟ ⎜ ⎟ ⎜ ⎟= ⎜ ⎟ ⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠ ⎝ ⎠ 2v pl (1.21) Nếu thì M = 1. Chênh lệch giữa các S1 2S S ... S Sk= = = = 1, S2,. . . , Sk tăng lên thì M xấp xỉ 0. Để thấy rõ điều này, ta lưu ý rằng các định thức của ma trận hiệp phương sai hợp nhất | Spl |, nằm một nơi nào đó gần giữa các | Si | . Cũng như tập hợp các biến tăng lên, tích vô hướng 1 2, , ..., nz z z ( )1z z giảm hơn ( )nz z tăng nó, ở đây z(1) và z(n) là giá trị nhỏ nhất và lớn nhất tương ứng. Ta minh họa điều này với hai tập số {4, 5, 6} và {1, 5, 9}, có cùng kì vọng nhưng độ lệch khác nhau. Nếu ta giả sử , thì thiết lập đầu tiên là 1 2 3v v v= = = v ( )( )( ) ( ) 2 2 2 1 4 5 6 0 8 1 1 2 0 96 5 5 5 . . . v v vM ⎡ ⎤⎛ ⎞⎛ ⎞⎛ ⎞ ⎡ ⎤= = =⎜ ⎟⎜ ⎟⎜ ⎟⎢ ⎥ ⎣ ⎦⎝ ⎠⎝ ⎠⎝ ⎠⎣ ⎦ và thứ hai, ( )( )( ) ( ) 2 2 2 1 5 9 0 2 1 1 8 0 36 5 5 5 . . . v v M ⎡ ⎤⎛ ⎞⎛ ⎞⎛ ⎞ ⎡ ⎤= =⎜ ⎟⎜ ⎟⎜ ⎟⎢ ⎥ ⎣ ⎦⎝ ⎠⎝ ⎠⎝ ⎠⎣ ⎦ = Trong M2, giá trị nhỏ nhất 0.2 làm giảm tỉ lệ tích hơn so với giá trị lớn nhất 1.8 làm tăng nó. __________________________________________________________________ 142 Chương 4 Box (1949, 1950) đưa ra χ2 và xấp xỉ F cho phân phối của M. Cũng có nhiều kiểm định xấp xỉ như M-test của Box được tham khảo đến. Cho xấp xỉ χ2, ta tính ( )( ) 2 1 1 1 1 1 2 3 1 6 1 1 k k i i ii p pc v pv= = ⎡ ⎤ k ⎡ ⎤+ −⎢ ⎥= − ⎢ ⎥+ −⎢ ⎥ ⎣ ⎦⎣ ⎦ ∑ ∑ (4.22) Từ đó là xấp xỉ ( )12 1 lnu c= − − M ( ) (2 1 1 12 k p pχ )⎡ ⎤− +⎢ ⎥⎣ ⎦ (4.23) ở đây M được xác định trong (4.19), và 1 1 1 1 2 2 ln ln S ln S k k i i i i i M v v = = ⎛ ⎞= − ⎜ ⎟⎝ ⎠∑ ∑ pl v (4.24) Ta bác bỏ H0 nếub u > χ2. Nếu 1 2 ... kv v v= = = = , thì đơn giản thành: 1c ( )( ) ( ) 2 1 1 2 3 1 6 1 k p p c kv p + + −= + (4.25) Để hiệu chỉnh số bậc tự do của xấp xỉ χ2, lưu ý rằng tổng số của cận dưới các tham số ước lượng với H1 là (1 12k p p )⎡ ⎤+⎢ ⎥⎣ ⎦ trong đó với H0 chúng ta ước lượng , nó có ∑ (1 1 22 p p p p⎛ ⎞+ = +⎜ ⎟⎝ ⎠ ) tham số. Sự khác biệt là ( ) ( ) 11 1 2 k p p⎡ ⎤− +⎢ ⎥⎣ ⎦ . Lượng (1 1 2 k p p⎡ +⎢⎣ ⎦) ⎤⎥ k phát sinh từ giả thiết rằng tất cả 1 2, , , ...,i i∑ = là khác nhau. Về kỹ thuật, H1 có thể bắt đầu i j∑ ≠ ∑ với i j≠ . Tuy nhiên, nói chung hầu hết các trường hợp tất cả khác nhau, và phân phối của M được suy ra một cách phù hợp. i∑ Cho xấp xỉ F, chúng ta sử dụng c1 từ (4.22) và tính toán thêm, __________________________________________________________________ 143 Chương 4 ( )( ) ( ) ( )2 221 1 1 2 1 1 6 1 k ki i ii p p c k v v= = ⎡ ⎤⎡ ⎤− + ⎢ ⎥= −⎢ ⎥ ⎢ ⎥−⎣ ⎦ ⎢ ⎥⎣ ⎦ ∑ ∑ (4.26) ( ) (1 1 1 12a k p p )= − + , 12 22 1 2aa c c += − , 1 11 1 1 c a ab a − −= 2 , 1 22 2 1 2c ab a − += Nếu , 22 1c c> được xấp xỉ (4.27) 12 lnF b= − M 1 2,a aF Nếu , 22 1c c< ( )2 21 2 2 1 2 ln ln a b MF a b M = + được xấp xỉ là (4.28) 1 2,a aF Trong cả hai trường hợp, ta bác bỏ H0 nếu F > Fα. Nếu , thì c 1 2 ... kv v v= = = = v 1 đơn giản hóa như trong (4.25) và c2 được đơn giản hóa thành ( )( )( )2 2 2 2 1 2 6 p p k k c k v 1− + + += M-test của Box được tính thường xuyên trong nhiều chương trình máy tính cho MANOVA. Tuy nhiên, Olson (1974) cho thấy M-test với các νi bằng nhau có thể tìm một vài dạng của sự không đồng nhất mà chỉ có tác động nhỏ trên kiểm định MANOVA. Kiểm định này cũng chính xác với vài dạng trực chuẩn. Ví dụ, nó chính xác với độ nhọn mà kiểm định MANOVA là khá mạnh mẽ. Do đó, M-test có thể báo hiệu sự không đồng nhất hiệp phương sai mà không phải là gây tổn hại đến kiểm định MANOVA.Do đó ta có thể không muốn tự động quy định ra tiêu chuẩn kiểm định MANOVA nếu M-test dẫn đến bác bỏ H0. Olson cho thấy dộ chệch và độ nhọn thống kê b1,p và b2,p có những hạn chế tương tự. __________________________________________________________________ 144 Chương 4 Ví dụ 4.3. Ta kiểm định giả thiết 0 1:H 2∑ = ∑ cho các dữ liệu tâm lí trong Bảng 3.2. Các ma trận hiệp phương sai S1, S2, và Spl đã được đưa ra trong ví dụ 3.3. Sử dụng những kết quả này, từ (4. 24) ta có được Để kiểm định chính xác, chúng ta so sánh 2 14 5ln . 61M− = với 19.74, giá trị tới hạn của nó được tra từ Bảng B3 (Phụ lục B). Cho xấp xỉ χ2, từ (4.25) và (4.23) ta tính được: Để xấp xỉ F-test, trước tiên ta tính toán: Từ ta dùng (4.27) để có được 21 10 005463 0 0048.c c= > = . 1 0 05 102 1 354 1 83. , ,ln . .F b M F ∞= − = < = __________________________________________________________________ 145 Chương 4 Vì vậy, cả ba kiểm định đều chấp nhận giả thiết H0. 4. 4 Kiểm định tính độc lập : 4. 4. 1 Độc lập của hai vector con : Giả sử các véc tơ quan sát được chia thành hai vector con quan sát, trong đó chúng ta đặt y và x, như trong mục 1.2.4.1, ở đây y là p×1 và x là q×1. Từ công thức (1.30), các phân vùng tương ứng của ma trận hiệp phương sai tổng thể là: yy y x xy x x ∑ ∑⎛ ⎞∑ = ⎜ ⎟⎜ ⎟∑ ∑⎝ ⎠ với phân vùng tương tự của S và R như trong (1.26): S S S S S yy y x xy x x ⎛ ⎞= ⎜ ⎟⎜ ⎟⎝ ⎠ , R R R R R yy y x xy x x ⎛ ⎞= ⎜ ⎟⎜ ⎟⎝ ⎠ Giả thuyết các độc lập của y và x có thể được diễn tả như 0 0 : 0 yy xx H ∑⎛ ⎞∑ = ⎜ ⎟∑⎝ ⎠ hoặc là 0 : 0yxH ∑ = Do đó, sự độc lập của y và x kì vọng là mọi biến trong y là độc lập của mọi biến trong x. Lưu ý là không có giới hạn trên yy∑ hoặc xx∑ Các thống kê kiểm định tỉ số hợp lí 0 : yxH 0∑ = cho bởi S R S S R Ryy xx yy xx Λ = = (4.30) có phân phối như 1, ,p q n q− −Λ . Ta bác bỏ giả thiết H0 nếu αΛ ≤ Λ . Như vậy, ta có một kiểm định chính xác cho 0 : yxH 0∑ = . Giá trị tới hạn cho của Wilks được cho trong Bảng A.9 [TL Rencher - Methods of Multivariate Analysis] bằng cách sử dụng và . Λ Hv = q q1Ev n= − − Do tính đối xứng của __________________________________________________________________ 146 Chương 4 S R S S R Ryy xx yy xx = Λ trong (4.30) cũng được phân phối như 1, ,p q n q− −Λ . Lưu ý rằng | Syy | | Sxx | trong (4.30) là một ước lượng của yy∑ xx∑ , từ : 11 11 22 22 0 A A 0 A A = = A nên được xác định khi . Do đó ∑ 0yx∑ = Λ của Wilks so sánh một ước lượng của không có hạn chế một ước lượng với giả thiết ∑ 0 : yxH 0∑ = . Ta có thể thấy một cách trực giác rằng | S | < | Syy | | Sxx | , chú ý là : 11 12 1 1 11 22 21 11 12 22 11 12 22 21 21 22 A A A A A A A A A A A A A A − −= − − = − Nên 1S S S S S Sxx yy yx xx xy −= − và là xác định dương, 1S S Syx xx xy− 1S S S S Syy yx xx xy yy −− < . Điều này có thể được minh họa cho trường hợp p = q = 1: ( )2 22 2 2 22S y yx y x yx y x yx x s s s s s s s s = = − < s khi 2yxs tăng, | S | giảm. Λ của Wilks trong (4.30) có thể biểu diễn trong điều kiện của vectơ riêng: (4.31) ( )2 1 1 s i i r = Λ = −∏ Ở đây s = min (p, q) và là giá trị riêng khác 0 của 2 'ir s 1 1S S S Sxx xy yy yx − − . Chúng ta cũng có thể sử dụng , giá trị riêng (khác 0) của là giống như 1 1S S S Syy yx xx xy − − 1 1S S S Syy yx xx xy − − 1 1S S S Sxx xy yy yx − − Số các giá trị riêng khác 0 là s=min(p,q), vì s là hạng của cả và 1 1S S S Syy yx xx xy − − 1 1S S S Sxx xy yy yx − − Các giá trị riêng kí hiệu vì chúng là những bình 2ir __________________________________________________________________ 147 Chương 4 phương tương quan chính tắc giữa y và x. Trong những trường hợp đặc biệt p = 1, (4.31) sẽ trở thành 2 21 1ir RΛ = − = − g quan bội giữa y và ( )1 2, , ..., qx x x . đây R2 là bình phương của tở ươn Ví dụ 4.4: Xét các dữ liệu bệnh tiểu đường trong Bảng 1.2. Có một phân vùng tự nhiên trong các biến, với y1 và y2 của quan sát nhỏ và x1, x2, và x3 của quan sát chính. Ta kiểm định độc lập của của y và x, nghĩa là, 0 : yxH 0∑ = . Từ ví dụ 1.2, các ma trận hiệp phương sai được phân chia là : . Để thực hiện kiểm định, ta tính : Vì vậy, chúng ta bác bỏ giả thiết của sự độc lập. Lưu ý việc sử dụng số 40 trong là của n-1-q=46-1-3=42. Đây là một phương pháp tiếp cận bảo toàn cho phép sử dụng bảng giá trị mà không có phép nội suy. 0 05 2 3 40. , , ,Λ 4. 4. 2 Sự độc lập của nhiều vectors con : Cho k tập hợp các biến sao cho y và ∑ được chia như sau 1 2 y y y yk ⎛ ⎞⎜ ⎟⎜= ⎜⎜ ⎟⎜ ⎟⎝ ⎠ # ⎟⎟ và 11 12 1 21 22 2 1 2 k k k k kk ∑ ∑ ∑⎛ ⎞⎜ ⎟∑ ∑ ∑⎜ ⎟∑ = ⎜ ⎟⎜ ⎟⎜ ⎟∑ ∑ ∑⎝ ⎠ " " # # # " __________________________________________________________________ 148 Chương 4 với pi các biến trong yi, với 1 2 ... kp p p p+ + + = .Lưu ý rằng không đại diện phân vùng nào của y, không phải là mẫu vectors ngẫu nhiên độc lập. Nhưng giả thuyết rằng nhóm vectors con độc lập nhau và có thể được biểu diễn với giả thiết 1 2y ,y , ,yk 1 2y ,y , ,yk 0 : i jH 0∑ = cho tất cả các i j≠ , hoặc (4.32) 11 22 0 0 0 0 0 : 0 0 kk H ∑⎛ ⎞⎜ ⎟∑⎜∑ = ⎜⎜ ⎟⎜ ⎟∑⎝ ⎠ " " # # # " ⎟⎟ Thống kê tỉ số hợp lí là 11 22 S S S ... Skk u = (4.33) 11 22 R R R ... Rkk = (4.34) với S và R có được từ mẫu ngẫu nhiên của n quan sát và được phân chia như ∑ ở trên, tương ứng . Lưu ý rằng mẫu thức ở (4.33) là định thức của S bị thu hẹp bởi H 1 2y ,y ,...,yk 0, có nghĩa là Si j 0= với mọi i j≠ . Các thống kê u không có phân phối của Wilks như trong (4.30) khi k = 2, nhưng là xấp xỉ χΛ 2 tốt để phân phối của nó được cho bởi ' lnu vc u= − (4.35) ở đây ( )3 211 2 312c afv= − + a (4.36) 2 1 2 f a= , 2 22 1 k i i a p p = = −∑ , 3 33 1 k i i a p p = = −∑ __________________________________________________________________ 149 Chương 4 và ν là bậc tự do của S hay R (xem tại phần đầu của mục 4.2). Ta bác bỏ giả thiết độc lập, nếu 2' , fu αχ> Bậc tự do, 2 1 2 f a= , phát sinh từ suy luận sau. Số tham số trong không bị giới hạn bởi các Giả thuyết là ∑ (1 1 2 p p )+ . Với giả thiết ở (4. 32), số các tham số trong mỗi là ii∑ (1 12 i ip p + ) , với tổng số là (1 1 1 2 k i ii p p= )+∑ . Sự khác biệt là : ( ) ( ) 2 21 2 2 2 2 2 1 1 11 1 2 2 2 1 1 2 2 2 k i i ii i i i i i i f p p p p p p p p ap p p p p p = ⎛ ⎞= + − + = + − −⎜ ⎟⎝ ⎠ ⎛ ⎞ ⎛ ⎞= + − − = − =⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠ ∑ ∑ ∑ ∑ ∑ Ví dụ 4.5: Cho 30 nhãn hiệu sản phẩm của rượu vang Nhật Bản Seishu, Siotani, ...v.v... (1963) nghiên cứu mối quan hệ giữa y1 = hương vị, y2 = mùi, và : x1 = pH, x5 = trực tiếp giảm đường, x2 = nồng độ axít 1, x6 = tổng số đường, x3 = độ axít 2, x7 = rượu, x4 = độ sake, x8 = formyl-nitơ. Ta kiểm định độc lập của bốn tập con của các biến: Các ma trận hiệp phương sai mẫu là : __________________________________________________________________ 150 Chương 4 Bảng 4.2: Đo lường rượu Seishu __________________________________________________________________ 151 Chương 4 với S11 là 2 × 2, S22 là 3 × 3, S33 là 3 × 3, và S44 là 2 × 2. Trước tiên ta thu được : Với xấp xỉ χ2, ta tính được : Sau đó, u’ =-νc ln u = -(29)(0.838)ln(0.01627) = 100.122, kết quả này vượt quá , và ta bác bỏ giả thuyết của độc lập của bốn tập con. 20 001 37 69 35. , .χ = 4. 4. 3 Kiểm định độc lập cho tất cả các biến : Nếu tất cả các pi = 1 trong giả thiết (4.32) trong mục 4.4.2, trường hợp đặc biệt là tất cả các biến cùng độc lập, 0 0: jkH σ = với i j≠ , hoặc 11 22 0 0 0 0 0 0 0 : kk H σ σ σ ⎛ ⎞⎜ ⎟⎜ ⎟∑ = ⎜ ⎟⎜ ⎟⎜ ⎟⎝ ⎠ " " # # # " Không có giới hạn trên của các σjj. Với σjk = 0 với mọi i j≠ , tương ứng ρjk cũng là 0, và một dạng tương đương của giả thiết là: 0 : P IH ρ = , ở đây Pρ là ma trận tương quan tổng thể đã được xác định trong (1.24). Vì mọi pi = 1, thống kê (4.33) và (4.34) làm giảm __________________________________________________________________ 152 Chương 4 11 22 S R . ... pp u s s s = = (4.37) và (4.35) sẽ trở thành ( )1 2 5 6 ' lnu v p⎡= − − +⎢⎣ ⎦ u ⎤⎥ (4.38) trong đó có một xấp xỉ phân phối 2fχ , với ν là bậc tự do của S hoặc R (xem một nhận xét ở phần đầu của mục 4.2) và (1 1 2 f p p )= − là bậc tự do của χ2. Ta bác bỏ giả thiết H0 nếu 2' , fu αχ> . Chính xác cả tỷ lệ phần trăm các điểm của u’ để lựa chọn các giá trị của p và n được cho trong Bảng B4 (Mathai và Katiyar 1979). Số điểm tỷ lệ phần trăm giới hạn phân phối χ2 cũng được đưa ra để so sánh. Lưu ý rằng |R| trong (4.37) chạy từ 0 đến 1. Nếu các biến số không tương quan (trong mẫu), chúng ta có R = I và |R| = 1. Mặt khác, nếu hai hoặc nhiều hơn các biến có quan hệ tuyến tính, R sẽ không có hạng đầy đủ và chúng ta có |R| = 0. Nếu các biến số tương quan cao hơn, |R| sẽ là gần đến 0; nếu tương quan là rất nhỏ, |R| sẽ được gần đến 1. Điều này có thể được minh họa khi cho p = 2: 1 1 R r r = Ví dụ 4.6 : Để kiểm tra Giả thuyết 0 0: ,jkH j kσ = ≠ , với bộ dữ liệu thăm dò từ Bảng 1.3, ta tính được : Sau đó, từ (4.37) và (4.38), ta có __________________________________________________________________ 153 Chương 4 Với độ chính xác 0,01 giá trị quyết định cho u’ tra từ Bảng B4 là 23.75 và do đó ta bác bỏ giả thiết H0. Giá trị quyết định xấp xỉ χ2 cho u’ là , nên giả thiết H 2 0 01 10 23 21. , .χ = 0. bị bác bỏ. __________________________________________________________________ Phụ lục A TÀI LIỆU THAM KHẢO Tiếng Việt [1] Đào Hữu Hồ, Nguyễn Văn Hữu, Hoàng Hữu Như (2004), Thống Kê Toán Học, NXB. ĐHQG Hà Nội, Hà Nội. [2] Đào Hữu Hồ (2001), Xác Suất Thống Kê, NXB. ĐHQG Hà Nội, in lần thứ 6, Hà Nội. [3] Nguyễn Bác Văn (1998), Xác Suất và Xử Lý Số Liệu Thống Kê; NXB. Giáo Dục, TP. Hồ Chí Minh. Tiếng Anh [4] Rencher, A.C. (2002), Methods of multivariate analysis, John Wiley & Sons, Inc., 605 Third Avenue, New York. [5] Wolfgang Hardle, Léopold Simar (2007), Applied Multivariate Statistical Analysis, Springer Berlin Heidelberg, New York. [6] Nigel Da Costa Lewis (2004), Applied Statistical Methods for Risk Management, John Wiley & Sons, Inc., Hoboken, New Jersey. [7] Rencher, A. C. (1998), Multivariate Statistical Inference and Applications, Wiley , New York. __________________________________________________________________ Bảng giá trị phân phối T2 - Hotelling Bảng B1 Phụ lục B B ậc tự d o, v __________________________________________________________________ Bảng giá trị phân phối T2 - Hotelling Bảng B1 Phụ lục B __________________________________________________________________ Bảng giá trị t - Bonferonni - 2 0 05, , .k vtα α = Bảng B2 Phụ lục B2 __________________________________________________________________ Kiểm định sự bằng nhau của hai ma trận hiệp phương sai Bảng B3 Phụ lục B ( )2ln ln S Spl iiM v k− = −∑ __________________________________________________________________ Kiểm định cho sự độc lập của p biến Bảng B4 Phụ lục B __________________________________________________________________
File đính kèm:
- luan_van_uoc_luong_va_kiem_dinh_trong_thong_ke_nhieu_chieu.pdf