logo xDuLieu.com

Trang trướcThí nghiệm sử dụng chủ thể lặpTrang sau

Khái quát

 

Trước hết ta xét một số thí dụ sau.

Thí dụ 1 : Để so sánh chất lượng cảm quan của 3 sản phẩm, mỗi sản phẩm cần 6 điểm cảm quan, ta có thể làm theo một trong hai cách sau:

  • sử dụng 18 cảm quan viên khác nhau, mỗi mẫu sử dụng 6 cảm quan viên, mỗi cảm quan viên chỉ đánh giá một mẫu duy nhất,
  • Sử dụng 6 cảm quan viên khác nhau, mỗi cảm quan viên đánh giá cả 3 sản phẩm.

Thí dụ 2 : Để so sánh chất lượng dinh dưỡng của 3 sản phẩm, mỗi sản phẩm cần 6 kết quả đánh giá, ta cũng có thể làm theo một trong hai cách sau:

  • sử dụng 18 người thử nghiệm, mỗi người chỉ sử dụng một sản phẩm duy nhất,
  • sử dụng 6 người thử nghiệm, mỗi người thử nghiệm lần lượt cả 3 sản phẩm.

Trong hai thí dụ trên, ta thấy yếu tố khảo sát có 3 mức. Trong cách thứ nhất, mỗi mức được thực hiện trên một chủ thể khác nhau. Như vậy với 6 lần lặp, ta cần tổng cộng 18 chủ thể khác nhau. Ngược lại, trong cách thứ hai, ta chỉ cần 6 chủ thể, mỗi chủ thể đều được thử nghiệm với cả ba mức của yếu tố khảo sát.

Thí nghiệm mà chủ thể được thử nghiệm với tất cả các mức của yếu tố khảo sát được gọi là thí nghiệm với chủ thể lặp (repeated measures). Phương pháp bố trí thí nghiệm này được sử dụng rộng rãi trong các nghiên cứu về y dược, trong các ngành khoa học xã hội.

Ưu điểm của kiểu bố trí này là việc so sánh ảnh hưởng của các mức của yếu tố khảo sát chính xác hơn vì các mức được thử nghiệm trên cùng một chủ thể. Mặt khác chi phí cũng giảm đi vì sử dụng ít chủ thể hơn. Ngoài ra, trong nhiều trường hợp, khi yếu tố khảo sát là thời gian thì ta bắt buộc phải bố trí lặp.


Phân tích phương sai

 

Xử lý số liệu cho thí nghiệm có chủ thể lặp có một số điểm đặc thù riêng. Để làm rõ hơn, ta xem xét thí dụ sau.

Thí dụ 3 : Để so sánh chất lượng cảm quan của 3 sản phẩm A, B và C, ta sử dụng 6 cảm quan viên (CQV), mỗi CQV đánh giá cả 3 sản phẩm với thang điểm 7. Kết quả được trình bày trên Bảng 1 sau:

Bảng 1 Kết quả đánh giá cảm quan của 3 sản phẩm A, B, và C
CQV Sản phẩm A Sản phẩm B Sản phẩm C Trung bình
1 4 5 6 5,0
2 3 3 4 3,3
3 2 3 3 2,7
4 3 2 3 2,7
5 5 6 7 6,0
6 4 5 6 5,0
Trung bình 3,5 4,0 4,8 4,1

Nếu ta xem thí dụ này như thí nghiệm một yếu tố thông thường với 3 nghiệm thức, mỗi nghiệm thức được thực hiện với 6 lần lặp và sử dụng phân tích phương sai với độ tin cậy 95% thì thu được các kết quả sau:

  `SS_T=34,94; df_T=17`

  `SS_A=4,11; df_A=2; MS_A=2,06`

  `SS_E=30,86; df_E=15; MS_E=2,06`

  `F_o=1; F`*`=3,68; p=0,391`

Qua đó ta kết luận rằng sự khác biệt về giá trị cảm quan của ba sản phẩm này không có ý nghĩa thống kê với độ tin cậy 95%.

Tuy nhiên khi xem xét kỹ hơn ta thấy rằng các CQV cho điểm không giống nhau mà khác biệt khá nhiều, điểm trung bình của CQV chênh lệch rất đáng kể. Điều này làm `SS_E` có giá trị lớn vì gồm cả sự biến động giữa các CQV.

Để đánh giá chính xác hơn người ta xem giá trị này - được ký hiệu lại là `SS_(SE)` - gồm hai thành phần: `SS_S` (S xuất phát từ chữ Subject: chủ thể thí nghiệm) thể hiện sự biến động giữa các CQV, và `SS_E` thể hiện sai số ngẫu nhiên thực sự:

`SS_(SE)=SS_S+SS_E`(13)

Và phân tích phương sai được thực hiện lại dưới dạng:

`SS_T=SS_A+SS_S+SS_E`(14)

Như thế ta xem như có thêm một yếu tố mới là S. Điểm đặc biệt của S là không có tương tác với yếu tố chính A. Trong Thí dụ 3, yếu tố mới này là CQV, có 6 mức.

Độ tự do của `SS_E` bây giờ chỉ còn là:

`df_E=df_T-df_A-df_S=(a-1)(n-1)`(15)

`SS_T` và `SS_A` được tính như khi phân tích phương sai thông thường, còn `SS_S` được tính như sau:

`SS_S=a sum_(j=1)^n (bar y_j - bar y)^2 `(16)

trong đó `a` là số mức của yếu tố chính, `n` là số CQV, `bar y_j` là điểm trung bình của CQV `j`, `bar y` là điểm trung bình chung.

Để tính toán được thuận tiện hơn cũng như để giảm sai số tích lũy khi làm tròn số trung bình, ta có thể tính `SS_S` bằng công thức sau:

`SS_S=1/n sum_(j=1)^n y_(•j)^2 - y_(••)^2/(an)`(17)

Với số liệu của Thí dụ 3, ta có

  `SS_S = 3xx[(5-4,1)^2+(3,3-4,1)^2+(2,7-4,1)^2+(2,7-4,1)^2+(6-4,1)^2+(5-4,1)^2 ]=29,37`

  `SS_E=SS_(SE)-SS_S=30,83-29,37=1,46`

Ngoài ra : `df_S=n-1=5` ; `df_(SE)=15`

Nên : `df_E=df_(SE)-df_S=15-5=10`

Vậy : `MS_E=(SS_E)/(df_E)=(1,46)/10=0,146`

  `F_o=(MS_A)/(MS_E)=(4,11)/(0,146)=28,15`

Thế mà : `F`*`=F_(0,05, 2, 10)=4,10`

Vậy `F_o > F`* , sự khác biệt giữa 3 sản phẩm có ý nghĩa thống kê ở độ tin cậy 95%.

Qua phân tích trên, khi ta tính đến sự biến động do yếu tố CQV, `MS_E` giảm đi, vì thể `F_o` tăng lên, kết quả đã thay đổi rất đáng kể.


So sánh các nghiệm thức

 

Để so sánh sự khác biệt giữa các nghiệm thức, ta so sánh như bình thường, chỉ cần lưu ý là khi đi tính độ chênh lệch có ý nghĩa, ta sử dụng giá trị `MS_E` đã hiệu chỉnh.

Đối với Thí dụ 3, sử dụng phương pháp LSD, ta có:

  `LSD=t_(alpha//2, df_E) sqrt((2MS_E)/n) = t_(0,025, 10) sqrt((2xx0,146)/6) =0,49`

Lập bảng tính hiệu số giữa các trung bình điểm cảm quan của ba sản phẩm, ta có Bảng 2.

Bảng 2 Hiệu số giữa các trung bình điểm cảm quan
  `bar y_A=3,5` `bar y_B=4,0` `bar y_C=4,8`
`bar y_A=3,5` 0 0,5 1,3
`bar y_B=4,0` 0 0,8
`bar y_C=4,8`     0

So sánh các kết quả này với LSD, ta kết luận rằng cả 3 sản phẩm này đều khác biệt nhau về điểm cảm quan, và các sự khác biệt ấy có ý nghĩa thống kê.



Trang trướcVề đầu chươngTrang sau


Trang web này được cập nhật lần cuối ngày 28/11/2018