logo xDuLieu.com

Trang trướcThí nghiệm có yếu tố lồng nhauTrang sau

Khái quát về yếu tố lồng nhau

 

Trong một số thí nghiệm nhiều yếu tố, các mức của yếu tố này (tạm gọi là yếu tố B) chỉ có ý nghĩa trong một mức nào đó của một yếu tố khác (tạm gọi là yếu tố A). Khi đó ta gọi hai yếu tố này là lồng nhau (nested). Để làm rõ thêm, ta xét thí dụ sau.

Công ty XYZ sản xuất cà phê hòa tan và muốn đánh giá hàm lượng cafein của sản phẩm này. Nguyên liệu được nhập từ 4 quốc gia là Việt Nam, Brazil, Colombia, và Indonesia. Tại mỗi quốc gia, cà phê nhân được mua từ 3 địa phương khác nhau.

Vậy yếu tố quốc gia A gồm 4 mức được ký hiệu lần lượt là VN, BR, CO, và IN. Yếu tố địa phương B gồm 3 mức được ký hiệu lần lượt là 1, 2, và 3. Như vậy thí nghiệm này có thể là thí nghiệm kết hợp đủ, gồm 2 yếu tố và 12 nghiệm thức.

Vấn đề ở đây là mức 1 của VN (là Long Khánh chẳng hạn) chẳng có liên quan gì cả đến mức 1 của Brazil, Colombia hay Indonesia. Nói cách khác mức 1 này của yếu tố B chỉ có ý nghĩa đối với mức VN của yếu tố A. Ta gọi quan hệ này của hai yếu tố là lồng nhau, B lồng trong A. Trong thí dụ trên là thí nghiệm lồng nhau ở hai cấp (two-stage nested design).

Như vậy ta cũng có thể cho rằng về thực chất, thí dụ trên là thí nghiệm một yếu tố với 12 mức. Nhưng ở đây, công ty XYZ muốn có một nhận định nào đó về chất lượng cà phê nhân của từng quốc gia. Do đó phương pháp thiết kế thí nghiệm và xử lý số liệu theo kiểu yếu tố lồng nhau được sử dụng.


Phân tích phương sai

 

Để đơn giản, ta xét trường hợp thí nghiệm có hai yếu tố lồng nhau, B lồng trong A. Yếu tố A được khảo sát ở `a` mức, yếu tố B ở `b` mức, như vậy có `ab` nghiệm thức. Mỗi nghiệm thức sẽ được lặp lại `n` lần, như vậy có `abn` đơn vị thí nghiệm. Cần lưu ý thêm là ta đang xét trường hợp thí nghiệm cân bằng: số lần lặp cho các nghiệm thức giống nhau (là `n`) và số mức của yếu tố B cho tất cả `a` mức của yếu tố A đều bằng nhau (là `b`).

Đáp ứng `Y` của mỗi đơn vị thí nghiệm là `y_(ijk)` với `i` là chỉ số cho yếu tố A, `j` là chỉ số cho yếu tố B, `k` là chỉ số của lần lặp. Về mặt khảo sát lý thuyết theo mô hình tuyến tính, kết quả `y_(ijk)` được trình bày dưới dạng sau:

`y_(ijk)=mu+tau_i+beta_(j(i))+epsilon_((ij)k)`(3)

trong đó `mu` là số trung bình của `abn` giá trị `y_(ijk)`; `tau_i` là tác động của yếu tố A khảo sát tại mức `i`; `beta_(j(i))` là tác động của yếu tố B tại mức `j` trong mức `i` của yếu tố A; và `epsilon_((ij)k)` là sai số ngẫu nhiên.

Khảo sát được thực hiện trong trường hợp cả hai yếu tố A và B đều có hiệu lực khu trú. Trong phương trình (3) ta không thấy có thừa số thể hiện sự tương tác giữa hai yếu tố vì ở đây sự tương tác này là không có ý nghĩa.

Phân tích phương sai được trình bày dưới dạng:

`SS_T=SS_A+SS_(B(A))+SS_E`(4)

Với :

`SS_T=sum_(i=1)^a sum_(j=1)^b sum_(k-1)^n (y_(ijk)-bar y_(•••))^2 `(5)
`SS_A=bn sum_(i=1)^a (bar y_(i••)-bar y_(•••))^2 `(6)
`SS_(B(A))=n sum_(i=1)^a sum_(j=1)^b (y_(ij•)-bar y_(i••))^2 `(7)
`SS_E=sum_(i=1)^a sum_(j=1)^b sum_(k-1)^n (y_(ijk)-bar y_(ij•))^2 `(8)

Để tính toán được thuận tiện hơn, cũng như giảm bớt sai số tích lũy do làm tròn khi tính các trị trung bình, ta có thể sử dụng những công thức sau:

`SS_T=sum_(i=1)^a sum_(j=1)^b sum_(k-1)^n y_(ijk)^2 \ -\ y_(•••)^2 / (abn) `(9)
`SS_A=1/(bn) sum_(i=1)^a y_(i••)^2 \ -\ y_(•••)^2 / (abn) `(10)
`SS_(B(A))=1/n sum_(i=1)^a sum_(j=1)^b y_(ij•)^2\ -\ y_(•••)^2 / (abn)`(11)
`SS_E=sum_(i=1)^a sum_(j=1)^b sum_(k-1)^n y_(ijk)^2\ -\ 1/n sum_(i=1)^a sum_(j=1)^b y_(ij•)^2`(12)

Độ tự do của các thừa số này là `df_T=abn – 1` ; `df_A=a–1` ; `df_(B(A))=a(b–1)` ; `df_E=ab(n – 1)`.

Sau đó ta tiếp tục đi tính các giá trị `MS, F_o`, rồi so sánh với `F`*, ... như khi phân tích phương sai thông thường.




Trang trướcVề đầu chươngTrang sau


Trang web này được cập nhật lần cuối ngày 28/11/2018