xDuLieu ⮞Dữ liệu đa biến ⮞Khái quát về dữ liệu đa biến ⮞Phân loại các phương pháp xử lý dữ liệu đa biến
Phân loại các phương pháp xử lý dữ liệu đa biến
Do khả năng ứng dụng rộng rãi, được quan tâm của nhiều nhà nghiên cứu nên đã có nhiều phương pháp xử lý đa biến được nghiên cứu về mặt lý thuyết cũng như được ứng dụng trong thực tế. Việc phân loại các phương pháp này phụ thuộc vào tiêu chí sử dụng.
Nếu ta căn cứ trên các đặc điểm của biến trong dữ liệu thì việc phân loại dựa vào:
- Có biến nào được xem là biến phụ thuộc hay không ?
- Nếu có, thì số biến phụ thuộc là bao nhiêu ?
- Các biến phụ thuộc có kiểu dữ liệu là gì ?
Khi dựa vào tiêu chí thứ nhất, người ta chia các phương pháp thông dụng trong xử lý đa biến làm hai nhóm chính:
- nhóm các phương pháp "phụ thuộc" (dependent), trong đó có một hay một số biến được xem là phụ thuộc, một hay một số biến khác được xem là độc lập. Giá trị của các biến phụ thuộc tùy thuộc vào giá trị của các biến độc lập. Như vậy mục tiêu chính của các phương pháp thuộc nhóm này là tìm kiếm mối quan hệ giữa biến phụ thuộc và biến độc lập
- nhóm các phương pháp "liên thuộc" (interdependent), trong đó tất cả các biến đều có vai trò như nhau, không có sự phân biệt "độc lập" hay "phụ thuộc". Các phương pháp của nhóm này thường khảo sát một cấu trúc tiềm ẩn nào đó giữa các biến hay giữa các phần tử.
Trong nhóm các phương pháp phụ thuộc, nếu :
- số biến phụ thuộc là 1 :
- nếu dữ liệu của biến phụ thuộc có kiểu số : ta có phương pháp hồi quy (multiple regression),...
- nếu dữ liệu của biến phụ thuộc có kiểu phi số : ta có phương pháp phân tích sự khác biệt (discriminant analysis),...
- số biến phụ thuộc nhiều hơn 1 :
- nếu dữ liệu của biến phụ thuộc có kiểu số : ta có phương pháp phân tích tương quan chính tắc (canonical correlation), phân tích phương sai (multivariate analysis of variance),...
- nếu dữ liệu của biến phụ thuộc có kiểu phi số : ta có phương pháp phân tích tương quan chính tắc sử dụng các biến nộm,...
Trong nhóm các phương pháp liên thuộc, nếu ta cần tìm cấu trúc hay quan hệ:
- giữa các biến : ta có các phương pháp phân tích thành tố chính (principal component analysis), phân tích yếu tố (factor analysis), ...
- giữa các phần tử : ta có phương pháp phân nhóm (cluster analysis), ...
Nếu ta dựa vào mục đích của xử lý thì ta có :
- các phương pháp tìm mối quan hệ giữa biến độc lập và biến phụ thuộc: các phương pháp hồi quy,
- đánh giá sự khác biệt giữa các nhóm phần tử: các phương pháp phân tích phương sai,
- phân nhóm các phần tử: các phương pháp phân nhóm, phân tích sự khác biệt, hồi quy logistic,
- phân tích cấu trúc tiềm ẩn của dữ liệu: các phương pháp phân tích thành tố chính, phân tích yếu tố.


