logo xDuLieu.com

Trang trướcKiểm định Kruskal-WallisTrang sau

Đối với thí nghiệm một yếu tố trong đó giá trị các biến không tuân theo phân bố chuẩn, việc sử dụng phân tích phương sai để so sánh các giá trị trung bình của các nghiệm thức là không phù hợp. Khi đó ta dùng kiểm định Kruskal-Wallis để thực hiện công việc này.

Kiểm định Kruskal-Wallis

 

Xét thí nghiệm một yếu tố gồm `a` nghiệm thức, nghiệm thức `i` được lặp lại `n_i` lần. Vậy có `N` đơn vị thí nghiệm với:

`N=sum n_i`(3)

Nếu số lần lặp cho các nghiệm thức đều giống nhau là `n` thì:

`N=an`(4)

Sau khi thực hiện `N` đơn vị thí nghiệm, ta thu được các đáp ứng `y_(ij)`. Giả sử `y_(ij)` không có phân phối chuẩn, ta thực hiện kiểm định Kruskal-Wallis qua những bước sau:

  • Xếp thứ tự `N` số hạng theo thứ tự tăng dần để chúng có hạng từ 1 đến `N`. Sau đó ta thay thế giá trị `y_(ij)` bằng `R_(ij)` là hạng của `y_(ij)` trong cách xếp hạng trên. Trong trường hợp có nhiều số có giá trị bằng nhau, hạng sẽ có giá trị là trung bình của các giá trị của những hạng có giá trị bằng nhau ấy.
  • Tính :
    `S^2=1/(N-1) [sum_(i=1)^a sum_(j=1)^(n_i) R_(ij)^2 - (N(N-1)^2)/4 ]`(5)
    Nhận xét rằng `S^2` là phương sai của `N` số hạng `R_(ij)`. Nếu cả `N` số hạng đều khác nhau thì:
    `S^2=(N(N+1))/12`(6)
  • Tính :
    `H=1/S^2 [sum_(i=1)^a R_(i•)^2/n_i - (N(N+1)^2)/4 ]`(7)
    Để thuận tiện trong tính toán, đặt :
    `HC=(N(N+1)^2)/4`(8)
    Nếu cả `N` giá trị `y_(ij)` đều khác nhau thì ta có thể tính ngay `H` theo công thức:
    `H=12/(N(N+1)^2) sum_(i=1)^a R_(i•)^2/n_i - 3(N+1) `(9)
    Nếu số số hạng `y_(ij)` giống nhau không nhiều, sự khác biệt trong kết quả của hai công thức (7) và (9) là không đáng kể, ta có thể sử dụng công thức (9) để việc tính toán được nhanh gọn hơn.
  • Nếu `n_i > 4`, H tuân theo phân phối `chi^2`. Vì vậy để kiểm tra sự khác biệt của giá trị trung bình `a` nghiệm thức, ta so sánh `H` với `H`*`=chi_(alpha, a-1)^2` rồi kết luận (tương tự như phân tích phương sai).

Thí dụ

 

Người ta so sánh 3 quy trình sản xuất bánh bằng cách so sánh năng suất tính bằng kg sản phẩm trong một giờ. Kết quả được trình bày ở Bảng 1. Hãy đánh giá năng suất của 3 quy trình.

Bảng 1 Năng suất của 3 quy trình trong 5 ca máy
Quy trình 1 Quy trình 2 Quy trình 3
24 20 25
26 21 28
23 19 26
25 21 24
24 19 27

Ta xếp hàng 15 số hạng trên như Bảng 2 dưới đây.

Bảng 2 Bảng xếp hạng năng suất của 15 ca máy
  `y_(23)` `y_(25)` `y_(21)` `y_(22)` `y_(24)` `y_(13)` `y_(11)` `y_(15)` `y_(34)` `y_(14)` `y_(31)` `y_(12)` `y_(33)` `y_(35)` `y_(32)`
`y_(ij)` 19 19 20 21 21 23 24 24 24 25 25 26 26 27 28
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
`R_(ij)` 1,5 1,5 3 4,5 4,5 6 8 8 8 10,5 10,5 12,5 12,5 14 15
  `R_(23)` `R_(25)` `R_(21)` `R_(22)` `R_(24)` `R_(13)` `R_(11)` `R_(15)` `R_(34)` `R_(14)` `R_(31)` `R_(12)` `R_(33)` `R_(35)` `R_(32)`

Kết quả chuyển đổi từ giá trị sang hạng và một số tính toán sơ bộ được thể hiện trên Bảng 3 sau:

Bảng 3 Kết quả chuyển từ giá trị sang hạng và một số tính toán sơ bộ
  Quy trình 1 Quy trình 2 Quy trình 3 Tổng
`y_(ij)` `R_(ij)` `y_(ij)` `R_(ij)` `y_(ij)` `R_(ij)`
24 8 20 3 25 10,5
26 12,5 21 4,5 28 15
23 6 19 1,5 26 12,5
25 10,5 21 4,5 24 8
24 8 19 1,5 27 14
`n_i` 5 5 5 15
`R_(i•)` 45 15 60 120
`R_(i•)^2 / n_i` 405 45 720 1170
`sum R_(ij)^2`   430,5   54   751,5 1236

Từ đó ta có :

  `HC=(N(N+1)^2)/4=(15xx16^2)/4=960`

  `S^2=1/(N-1) [sum_(i=1)^a sum_(j=1)^(n_i) R_(ij)^2 - (N(N-1)^2)/4 ] = 1/(15-1) (1236-960) =19,71`

  `H_o=1/S^2 [sum_(i=1)^a R_(i•)^2/n_i - (N(N-1)^2)/4 ] = 1/(19,71^2) (1170-960) =10,65`

Mà `H`*`=chi_(0,05, 2)^2=5,99`

Nên `H_o > H`* : sự khác biệt về năng suất của ba quy trình có ý nghĩa thống kê.



Trang trướcVề đầu chươngTrang sau


Trang web này được cập nhật lần cuối ngày 28/11/2018