Ta xét thí dụ sau :
Một nhóm nghiên cứu thị trường muốn khảo sát sự ưa chuộng của 2 loại sản phẩm là sản phẩm thịt và sản phẩm rau của ba nhóm người có thu nhập khác nhau: cao, trung bình và thấp. Kết quả khảo sát phải cho biết rằng sự ưa chuộng của các nhóm có độc lập với thu nhập hay không, nghĩa là tỷ lệ ưa chuộng của các nhóm thu nhập là có giống nhau hay không, với độ tin cậy 95%.
Kết quả điều tra được tổng hợp trên Bảng 1.
| TN cao | TN trung bình | TN thấp | Cộng | |
|---|---|---|---|---|
| Sản phẩm thịt | 18 | 42 | 58 | 118 |
| Sản phẩm rau | 42 | 28 | 12 | 82 |
| Cộng | 60 | 70 | 70 | 200 |
Phần chính của Bảng 1 là bảng tham chiếu chéo (contingency table hay crosstab) hay bảng tham chiếu 2 chiều gồm `c` cột giữa và `d` dòng giữa. Số hạng `x_(ij)` của bàng này cho biết số lượng người thích sản phẩm `i` trong nhóm có thu nhập `j`.
Qua Bảng 1 ta thấy:
Cơ cấu của người được hỏi ý kiến gồm:
Ta đặt giả thuyết Ho như sau : tất cả các nhóm người có thu nhập khác nhau đều có tỷ lệ ưa chuộng các sản phẩm rau và thịt như nhau. Nghĩa là luôn có 59% số người thích sản phẩm thịt và 41% số người thích sản phẩm rau. Nếu giả thuyết này đúng thì ta sẽ có Bảng 2.
| TN cao | TN trung bình | TN thấp | Cộng | |
|---|---|---|---|---|
| Sản phẩm thịt | 35,4 | 41,3 | 41,3 | 118 |
| Sản phẩm rau | 24,6 | 28,7 | 28,7 | 82 |
| Cộng | 60 | 70 | 70 | 200 |
Như vậy trong phần chính bảng tham chiếu chéo đã xuất hiện những số liệu mới `e_(ij)` tương ứng với giả thuyết Ho. Để tính toán các số liệu này, thí dụ cho nhóm thu nhập cao, ta lý luận như sau:
Nhóm thu nhập cao có 60 người. Để phù hợp với giả thuyết Ho thì phải có 59% thích sản phẩm thịt và 41% thích sản phẩm rau. Vậy:
Ta cũng lý luận tương tự cho các nhóm khác và có kết quả trên Bảng 2.
Để kiểm định giả thuyết này, chúng ta dùng tiêu chuẩn kiểm định sau:
| `chi^2=sum_(i=1)^d sum_(j=1)^c ((x_(ij)-e_(ij))^2)/e_(ij)` | (23) |
Tiêu chuẩn này tuân theo phân phối khi bình phương với độ tự do tính như sau:
`nu=(d-1)(c-1)`(24)
Kiểm định sự độc lập của hai thuộc tinh là loại kiểm định một phía với vùng bác bỏ ở bên phải giá trị tới hạn. Sử dụng bảng phân vị khi bình phương ta có:
`chi^2`*`=chi_(0,05,\ 2)^2=5,991`.
Từ số liệu của thí dụ trên, ta có :
`chi_o^2=(18-35,4)^2/(35,4)+(42-41,3)^2/(41,3)``+(58-41,3)^2/(41,3)``+(42-24,6)^2/(24,6)``+(28-28,7)^2/(28,7)``+(12-28,7)^2/(28,7)`
`chi_o^2=37,359`
Vì `chi_o^2>chi^2`* nên ta bác bỏ Ho.
Kết luận : hai tính chất "nhóm thu nhập" và "sản phẩm ưa thích" không độc lập nhau. Sản phẩm ưa thích có sự phụ thuộc nào đó vào tỷ lệ thu nhập.
Trang web này được cập nhật lần cuối ngày 27/11/2018
Thống kê
Các chuyên đề
Xử lý dữ liệu
Ma trận
R