logo xDuLieu.com

Trang trướcKhái quát về phân tích phương saiTrang sau

Giới thiệu phân tích phương sai

 

Phân tích phương sai (ANOVA : analysis of variance) bao gồm một số các phương pháp dùng để khảo sát, đánh giá sự khác biệt giữa các "nhóm" về một hay một số chỉ tiêu nào đó.

Trong phân tích phương sai, các "nhóm" được hình thành dựa trên sự khác biệt về giá trị của một hay một số thuộc tính. Thí dụ ta muốn khảo sát sự khác biệt của ba phương pháp bảo quản là dùng nhiệt độ thấp, dùng bao bì và xử lý trong dung dịch chất bảo quản đến chất lượng xoài. Như vậy, phương pháp bảo quản là thuộc tính dùng để phân nhóm, và thuộc tính này có ba giá trị là nhiệt độ thấp, bao bì, và xử lý trong dung dịch chất bảo quản.

Sự khác biệt giữa các "nhóm" (nếu có), dựa vào một hay một số chỉ tiêu mà ta quan tâm. Như trong thí dụ trên, chỉ tiêu được chọn có thể là tỷ lệ hao hụt về trọng lượng, hàm lượng vitamin C bị mất trong bảo quản, ...

Do đặc điểm này nên phân tích phương sai được sử dụng đầu tiên trong lĩnh vực xử lý dữ liệu thí nghiệm nông nghiệp, và hiện nay, phương pháp này được dùng như một phương pháp chủ yếu trong phân tích dữ liệu của các thí nghiệm. Ta sẽ thấy ảnh hưởng của điều này thể hiện trong nhiều thuật ngữ của phân tích phương sai.


Biến trong phân tích phương sai

 

Trong phân tích phương sai, ta có một số loại biến sau:

  • Yếu tố (factor) : là tên gọi khác của biến độc lập. Yếu tố là thuộc tính dùng để phân nhóm như ta vừa đề cập ở phân trên. Yếu tố có kiểu là biến định danh (nominal). Nếu ban đầu có kiểu là định lượng thì ta cũng chuyển thành biến định danh. Trong sử dụng các phần mềm để xử lý số liệu, ta cần lưu ý đến tính chất này của yếu tố.
  • Đáp ứng (response) : là tên gọi khác của biến phụ thuộc. Đáp ứng là chỉ tiêu dùng để so sánh sự khác biệt giữa các nhóm. Giá trị của đáp ứng phụ thuộc vào giá trị của yếu tố. Đáp ứng luôn luôn có kiểu là số.
  • Hiệp biến (covariate) : là một biến độc lập, nghĩa là có thể có tác động đến đáp ứng, nhưng không phải là yếu tố mà ta quan tâm. Trong phân tích phương sai, ta phải tách riêng tác động của hiệp biến đến đáp ứng để đánh giá chính xác hơn tác động của yếu tố. Hiệp biến có kiểu là số và ta thường không thể tác động đến giá trị của hiệp biến mà chỉ có thể ghi nhận giá trị của nó. Trong thí dụ vừa nêu trên, khối lượng quả xoài dùng trong thí nghiệm bảo quản có thể là một hiệp biến.
  • Nhiễu (nuisance factor) : cũng gần tương tự như hiệp biến, nghĩa là một dạng biến độc lập, có thể có tác động đến đáp ứng, nhưng không phải là yếu tố mà ta quan tâm và ta cần tách riêng tác động của nhiễu đến đáp ứng để đánh giá chính xác hơn tác động của yếu tố. Nhiễu thường có kiểu định danh và trong một số trường hợp, chúng ta có thể giảm bớt tác động của nhiễu bằng cách thực hiện thí nghiệm một cách phù hợp (như bố trí các đơn vị thí nghiệm hợp lý) hay kiểm soát tác động của nó bằng cách chia khối. Trong thí dụ mà chúng ta đề cập bên trên, nguồn nguyên liệu có thể là một nhiễu.

Chủ thể thí nghiệm

 

Để đánh giá tác động của yếu tố đến đáp ứng, ta cần sử dụng các chủ thể thí nghiệm (subject) hay vắn tắt hơn, chủ thể. Trong thí nghiệm ta vừa nêu trên, chủ thể là các quả xoài.

Mỗi chủ thể có thể chỉ thuộc một nhóm. Như trong thí dụ trên, mỗi quả xoài chỉ có thể tham gia vào một phương pháp bảo quản, không thể tham gia vào cả hai phương pháp bảo quản.

Nhưng trong một số trường hợp khác, một chủ thể có thể tham gia vào một số nhóm khác nhau. Thí dụ ta muốn so sánh ba phương pháp dạy Toán đến khả năng lĩnh hội. Khi ấy, một học sinh có thể tham dự vào cả ba phương pháp nói trên. Trong trường hợp này ta gọi là thí nghiệm với chủ thể lặp (repeated measures).


Phân loại các phương pháp phân tích phương sai

 

Các phương pháp phân tích phương sai có thể chia thành một số loại dựa vào tiêu chí dùng để phân loại:

  • khi dựa vào dạng của chủ thể tham gia vào dữ liệu, ta có phân tích phương sai với chủ thể không lặp (between-groups hay between-subjects), chủ thể lặp (within-groups hay within-subjects), và hỗn hợp (mixed),
  • khi dựa vào số yếu tố dùng trong phân nhóm, ta có phân tích phương sai một yếu tố (one-way) và nhiều yếu tố (factorial),
  • khi ta cần tách riêng tác động của hiệp biến, ta dùng phân tích phương sai với hiệp biến (ANCOVA: analysis of covariance),
  • khi dựa vào số đáp ứng, ta có phân tích phương sai một đáp ứng và nhiều đáp ứng (MANOVA: multivariate analysis of variance)


Trang trướcVề đầu chươngTrang sau


Trang web này được cập nhật lần cuối ngày 26/11/2018