Để có thể nắm bắt được các nguyên tắc của phân tích phương sai được dễ dàng hơn, chúng ta xem xét thí dụ sau.
Một nghiên cứu muốn tìm hiểu mối liên quan giữa màu sắc ưa thích và trí thông minh của con người. Để làm được điều đó người ta chọn ra 3 nhóm tương ứng với ba tông màu ưa thích là A, B và C. Như vậy mỗi nhóm đặc trưng cho một tổng thể. Trong mỗi nhóm lấy ra 10 người một cách ngẫu nhiên và xác định chỉ số `IQ` (Intelligence Quotient) cho từng người. Kết quả được ghi nhận ở Bảng 1 sau.
Nhóm A | Nhóm B | Nhóm C | |
---|---|---|---|
102 | 89 | 51 | |
88 | 100 | 76 | |
106 | 92 | 90 | |
93 | 76 | 117 | |
98 | 64 | 103 | |
104 | 104 | 64 | |
90 | 66 | 64 | |
103 | 98 | 50 | |
99 | 90 | 89 | |
92 | 82 | 67 | |
Trung bình | 97,5 | 86,1 | 77,1 |
Nếu ta xem xét trung bình của ba nhóm thì ta thấy có sự khác biệt khá rõ rệt. Tuy nhiên ta cần xem xét thêm sự biến động của `IQ` trong từng nhóm (Hình 1).
Hình 1 Phân phối của `IQ` trong ba nhóm A, B, và C
Trên Hình 1, ta thấy rằng mức biến động của `IQ` trong từng nhóm là khá lớn, điều này do ta lấy mẫu ngẫu nhiên. Như vậy ta cũng có thể đặt câu hỏi: liệu sự khác biệt về `IQ` trung bình của 3 nhóm là thực sự do tác động của yếu tố màu hay chỉ do ngẫu nhiên?
Để trả lời câu hỏi này ta đi so sánh hai sự biến động của `IQ`:
Nếu sự biến động giữa các nhóm lớn hơn một cách đáng kể thì giữa các nhóm thực sự có sự khác biệt. Còn ngược lại, ta xem sự khác biệt giữa các nhóm không có ý nghĩa về mặt thống kê.
Để đánh giá mức độ chênh lệch giữa hai sự biến động ấy, ta cần một chỉ tiêu. Vì vậy, phân tích phương sai là một dạng của kiểm định thống kê trong đó cặp giả thuyết được phát biểu như sau:
Trong phần sau, ta sẽ xem xét chi tiết hơn về phân tích phương sai.
Trang web này được cập nhật lần cuối ngày 27/11/2018
Thống kê
Các chuyên đề
Xử lý dữ liệu
Ma trận
R