Đối với thí nghiệm một yếu tố trong đó giá trị các biến không tuân theo phân bố chuẩn, việc sử dụng phân tích phương sai để so sánh các giá trị trung bình của các nghiệm thức là không phù hợp. Khi đó ta dùng kiểm định Kruskal-Wallis để thực hiện công việc này.
Xét thí nghiệm một yếu tố gồm `a` nghiệm thức, nghiệm thức `i` được lặp lại `n_i` lần. Vậy có `N` đơn vị thí nghiệm với:
| `N=sum n_i` | (3) |
Nếu số lần lặp cho các nghiệm thức đều giống nhau là `n` thì:
`N=an`(4)
Sau khi thực hiện `N` đơn vị thí nghiệm, ta thu được các đáp ứng `y_(ij)`. Giả sử `y_(ij)` không có phân phối chuẩn, ta thực hiện kiểm định Kruskal-Wallis qua những bước sau:
| `S^2=1/(N-1) [sum_(i=1)^a sum_(j=1)^(n_i) R_(ij)^2 - (N(N-1)^2)/4 ]` | (5) |
| `S^2=(N(N+1))/12` | (6) |
| `H=1/S^2 [sum_(i=1)^a R_(i•)^2/n_i - (N(N+1)^2)/4 ]` | (7) |
| `HC=(N(N+1)^2)/4` | (8) |
| `H=12/(N(N+1)^2) sum_(i=1)^a R_(i•)^2/n_i - 3(N+1) ` | (9) |
Người ta so sánh 3 quy trình sản xuất bánh bằng cách so sánh năng suất tính bằng kg sản phẩm trong một giờ. Kết quả được trình bày ở Bảng 1. Hãy đánh giá năng suất của 3 quy trình.
| Quy trình 1 | Quy trình 2 | Quy trình 3 |
|---|---|---|
| 24 | 20 | 25 |
| 26 | 21 | 28 |
| 23 | 19 | 26 |
| 25 | 21 | 24 |
| 24 | 19 | 27 |
Ta xếp hàng 15 số hạng trên như Bảng 2 dưới đây.
| `y_(23)` | `y_(25)` | `y_(21)` | `y_(22)` | `y_(24)` | `y_(13)` | `y_(11)` | `y_(15)` | `y_(34)` | `y_(14)` | `y_(31)` | `y_(12)` | `y_(33)` | `y_(35)` | `y_(32)` | |
| `y_(ij)` | 19 | 19 | 20 | 21 | 21 | 23 | 24 | 24 | 24 | 25 | 25 | 26 | 26 | 27 | 28 |
| 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | |
| `R_(ij)` | 1,5 | 1,5 | 3 | 4,5 | 4,5 | 6 | 8 | 8 | 8 | 10,5 | 10,5 | 12,5 | 12,5 | 14 | 15 |
| `R_(23)` | `R_(25)` | `R_(21)` | `R_(22)` | `R_(24)` | `R_(13)` | `R_(11)` | `R_(15)` | `R_(34)` | `R_(14)` | `R_(31)` | `R_(12)` | `R_(33)` | `R_(35)` | `R_(32)` |
Kết quả chuyển đổi từ giá trị sang hạng và một số tính toán sơ bộ được thể hiện trên Bảng 3 sau:
| Quy trình 1 | Quy trình 2 | Quy trình 3 | Tổng | ||||
|---|---|---|---|---|---|---|---|
| `y_(ij)` | `R_(ij)` | `y_(ij)` | `R_(ij)` | `y_(ij)` | `R_(ij)` | ||
| 24 | 8 | 20 | 3 | 25 | 10,5 | ||
| 26 | 12,5 | 21 | 4,5 | 28 | 15 | ||
| 23 | 6 | 19 | 1,5 | 26 | 12,5 | ||
| 25 | 10,5 | 21 | 4,5 | 24 | 8 | ||
| 24 | 8 | 19 | 1,5 | 27 | 14 | ||
| `n_i` | 5 | 5 | 5 | 15 | |||
| `R_(i•)` | 45 | 15 | 60 | 120 | |||
| `R_(i•)^2 / n_i` | 405 | 45 | 720 | 1170 | |||
| `sum R_(ij)^2` | 430,5 | 54 | 751,5 | 1236 | |||
Từ đó ta có :
`HC=(N(N+1)^2)/4=(15xx16^2)/4=960`
`S^2=1/(N-1) [sum_(i=1)^a sum_(j=1)^(n_i) R_(ij)^2 - (N(N-1)^2)/4 ] = 1/(15-1) (1236-960) =19,71`
`H_o=1/S^2 [sum_(i=1)^a R_(i•)^2/n_i - (N(N-1)^2)/4 ] = 1/(19,71^2) (1170-960) =10,65`
Mà `H`*`=chi_(0,05, 2)^2=5,99`
Nên `H_o > H`* : sự khác biệt về năng suất của ba quy trình có ý nghĩa thống kê.
Trang web này được cập nhật lần cuối ngày 28/11/2018
Thiết kế thí nghiệm
Các chuyên đề
Xử lý dữ liệu
Ma trận
R