xDuLieu ⮞Thiết kế thí nghiệm ⮞Một số khái niệm cơ bản ⮞Biến trong thiết kế thí nghiệm
Biến trong thiết kế thí nghiệm
Như đã đề cập trong phần trước, biến là thành phần cốt lõi của thí nghiệm, là trung tâm của quá trình xử lý dữ liệu. Trong phần này, ta sẽ xem xét tính chất của một số loại biến, một số loại giá trị của biến.
Yếu tố & Đáp ứng
Tùy theo vai trò của biến trong thí nghiệm, ta có hai loại chính:
- Yếu tố (factor) : là các biến mà ta muốn khảo sát ảnh hưởng của chùng đến kết quả của thí nghiệm. Giá trị của các yếu tố có thể thay đổi tương đối dễ dàng và độc lập nhau tùy theo yêu cầu của thí nghiệm. Vì thế, người ta còn gọi yếu tố là biến độc lập (independent variable). Một số thí dụ của yếu tố là pH, nhiệt độ, loại vật liệu sử dụng, vận tốc băng chuyền.
- Đáp ứng (response) : Giá trị của đáp ứng phụ thuộc vào yếu tố, và ta chỉ có thể thay đổi nó một cách gián tiếp thông qua thay đổi giá trị của các yếu tố. Vì thế đáp ứng còn được gọi là biến phụ thuộc (dependent variable). Độ cứng của sản phẩm, hiệu suất phản ứng, tỷ lệ thu hồi là một vài thí dụ của đáp ứng.
Ngoài hai loại biến chính này, ta còn cần quan tâm đến nhiễu (nuisance factor). Đó là các yếu tố khó định tính hay định lượng và tác động của nó đến đáp ứng cũng không rõ ràng. Thí dụ như lô nguyên liệu, tay nghề người làm thí nghiệm, điều kiện phòng thí nghiệm.
Trong một số trường hợp, ta cũng cần xem xét ảnh hưởng của các biến kèm (hay hiệp biến - covariable). Đó là các đại lượng ta có thể xác định được nhưng khó khống chế hay không thể khống chế được. Thí dụ như trong nghiên cứu về ảnh hưởng của các phương pháp bảo quản đến chất lượng trái cây, khối lượng của quả có thể là một biến kèm.
Trong nhiều trường hợp của các thí nghiệm quan trắc, tính độc lâp hay phụ thuộc của biến chỉ mang tính quy ước, đáp ứng cho một mục đích cụ thể nào đó; vai trò của biến cũng có thể thay đổi tùy theo mục đích khi phân tích số liệu.
Biến định tính & biến định lượng
Tùy theo đặc điểm của giá trị mà biến có thể là định tính hay định lượng.
- Biến là định lượng khi giá trị của nó có thể đo, đếm, tính, và được biểu diễn bằng số như khối lượng, chiều dài, hàm lượng chất xúc tác, nhiệt độ.
- Biến là định tính khi giá trị của nó đươc xác định thông qua cảm giác của các giác quan hay qua nhận định, đánh giá, phân loại của con người như mầu, phương pháp xử lý, giới tính, loại dung môi sử dụng, mức độ an toàn (đạt, không đạt).
Trong một số trường hợp, việc phân biệt này chỉ mang tính tương đối và có thể có sự chuyển đổi qua lại. Thí dụ khi ta dùng thang điểm để đánh giá cảm quan, ta đã chuyển từ định tính sang định lượng. Hay ngược lại nếu hàm lượng chì trong thức uống bé hơn 0,5 µg/mL thì mức độ an toàn được đánh giá là đạt, ta đã chuyển từ định lượng sang định tính.
Chúng ta cũng lưu ý rằng khi chúng ta sử dụng số để mã hóa các biến định tính, thì không có sự chuyển đổi, các con số ấy chỉ làm cho việc xử lý dữ liệu được tiện lợi hơn mà thôi. Thí dụ đối với giới tính, khi ta mã hóa các giá trị "nam" là 0 và "nữ" là 1, thì ta không thể thực hiện các phép tính trên các số 0 và 1 ấy.
Các kiểu giá trị của biến
Trong thống kê nói chung và trong lĩnh vực thí nghiệm nói riêng, hiện nay sử dụng bốn kiểu giá trị của biến do Stanley Smith Stevens đề xuất năm 1946 và 1951:
- Kiểu “định danh” (nominal hay categorical) : các phần tử được xếp vào một số nhóm, các phần tử trong một nhóm có cùng tính chất khảo sát (cùng giá trị của biến tương ứng) và giá trị này do con người gán cho nó. Như vậy giá trị chỉ cho ta biết phần tử thuộc nhóm hay loại nào. Thí dụ: mầu: xanh, đỏ, vàng; mức độ an toàn: đạt, không đạt; vật liệu: thép, thủy tinh, nhựa; dung môi: nước, alcol, toluen, phenol. Để thuận tiện, các giá trị này có thể được mã hóa (thí dụ: Xanh: 1; Đỏ: 2; Vàng: 3). Cần lưu ý là khi sử dụng số để mã hóa, ta không thể thực hiện các phép tính toán thông thường trên các giá trị đó. Trong kiểu này có kiểu đặc biệt là nhị phân (binary hay dichotomous) trong đó chỉ có hai giá trị.
- Kiểu “có thứ tự” (ordinal) : Ta có thể sắp xếp các giá trị theo một thứ tự nào đấy. Thí dụ như kết quả của đánh giá cảm quan trong phương pháp so hàng: rất thích, khá thích, thích, ...; thứ bậc trong lớp của học sinh. Tuy vậy sự khác biệt giữa các giá trị khó xác định, hiệu số giữa hai giá trị (nếu có) không có ý nghĩa.
- Kiểu “có hiệu số” (interval) : Giá trị của biến loại này là số, tuy nhiên tỷ số giữa hai số đo của một đại lượng kiểu này không có ý nghĩa mà chỉ hiệu số của chúng mới có ý nghĩa mà thôi. Thí dụ nhiệt độ bách phân; sự chia độ của thang đo căn cứ vào độ chênh lệch (hay “hiệu số”) của hai điểm: điểm sôi (lấy là 100°C) và điểm đông đặc của nước (lấy là 0°C). Ngoài ra, giá trị “0” chỉ mang tính quy ước. Ta chỉ có thể thực hiện được một số phép tính nhất định cho các giá trị kiểu này.
- Kiểu “có tỷ số” (rational) : Rất nhiều đại lượng dùng trong khoa học tự nhiên, kỹ thuật thuộc nhóm này như khối lượng, khoảng cách, thời gian, năng lượng, nhiệt độ tuyệt đối. Tên của kiểu dựa vào nguyên tắc đo: chiều dài một vật có số đo là tỷ số giữa chiều dài vật đó và chiều dài của một vật lấy làm chuẩn. Mặt khác, tỷ số giữa hai đại lượng này có ý nghĩa rõ ràng, dùng để so sánh. Ngoài ra giá trị “0” trong thang đo có ý nghĩa rõ ràng. Ta có thể thực hiện hầu như bất kỳ phép tính đại số, giải tích nào cho giá trị kiểu này.
Biến liên tục & biến rời rạc
Khi biến chỉ có thể lấy một số hữu hạn (hay vô hạn đếm được) các giá trị thì biến được gọi là rời rạc. Thí dụ số lỗi trong một sản phẩm.
Ngược lại, nếu biến có thể lấy vô số giá trị trong các khoảng đã định thì biến được gọi là liên tục. Thí dụ nồng độ chất xúc tác của một phản ứng.
Tuy vậy, ta cũng cần lưu ý thêm tình hình thực tế như các trường hợp sau:
- Do giới hạn bởi độ chính xác của dụng cụ đo nên số lượng giá trị của biến liên tục cũng có giới hạn. Trong trường hợp này biến liên tục bị rời rạc hóa (discretization).
- Cũng có khi biến rời rạc có một số lượng đáng kể giá trị, giá trị lại thay đổi trong một khoảng rộng và khoảng cách giữa các phần tử có giá trị gần nhau lại bé hơn nhiều so với khoảng này. Thí dụ như thu nhập của một cá nhân. Khi ấy ta có thể xem biến này là liên tục để kháo sát thuận tiện hơn.


