Sample size là gì? Dù bạn là marketer hay nhà nghiên cứu thị trường, brand hay agency, doanh nghiệp hay tổ chức chính phủ thì một vấn đề muôn thuở chính là việc xác định cụ thể số kích thước mẫu (sample size) cần thiết nhằm đạt kết quả thống kê đại diện cho tổng thể.
Dưới đây, Infocare sẽ cung cấp tới bạn một số phương pháp và công cụ giúp xác định kích thước mẫu phù hợp.
Mục lục
Kích thước mẫu (Sample size) là gì?
Kích thước mẫu là một thuật ngữ thường dùng trong thống kê và nghiên cứu thị trường, xuất hiện mỗi khi bạn cần khảo sát một tập đáp viên (người trả lời khảo sát) lớn. Thuật ngữ này liên hệ tới phương thức nghiên cứu thực hiện trên tổng thể (population) lớn.
Vậy, phương pháp chọn mẫu (sampling) là gì, và tại sao kích thước mẫu (sample size) lại quan trọng đến vậy?
Khi bạn cần khảo sát một tập lớn đối tượng mục tiêu, bạn sẽ muốn lấy được ý kiến của toàn bộ nhóm đó, nhưng về cơ bản là không thể thu thập được kết quả từ toàn bộ mọi người. Do vậy bạn có thể chọn ngẫu nhiên một số mẫu từ một số lượng cá nhân trong tập đối tượng đó, những người có thể đại diện cho tổng thể.
Số lượng mẫu rất quan trọng nhằm thu thập được những kết quả nghiên cứu chính xác và có ý nghĩa về mặt thống kê cũng như triển khai hoạt động nghiên cứu một cách thành công.
- Nếu kích thước mẫu quá nhỏ, kết quả của bạn sẽ bị lẫn một tỷ lệ không cân đối những đối tượng không phù hợp và trường hợp ngoại lệ. Chúng sẽ làm thay đổi độ chính xác của kết quả nghiên cứu và khiến bạn không nắm được bức tranh chính xác của tổng thể.
- Nếu kích thước mẫu quá lớn, toàn bộ hoạt động nghiên cứu sẽ trở nên quá phức tạp, tốn kém và mất quá nhiều thời gian để thực hiện, và dù kết quả có chính xác hơn nữa thì lợi ích đó cũng không bù lại được chi phí bạn phải bỏ ra.
Phương pháp xác định kích thước mẫu
Để xác định chính xác số kích thước mẫu cần thiết, bạn cần cân nhắc một số yếu tố khác nhau có thể ảnh hưởng đến kết quả nghiên cứu, và có sự hiểu biết cơ bản về những chỉ số liên quan. Từ đó, bạn có thể sử dụng công thức xác định kích thước mẫu và thực hiện thu thập khảo sát một cách tự tin vì biết chắc rằng khả năng cao bạn sẽ nhận được kết quả thống kê chính xác.
Nếu bạn muốn bắt đầu tính toán số kích thước mẫu chuẩn xác nhất cho hoạt động nghiên cứu thị trường, hãy cùng Infocare điểm qua các bước dưới đây.
Giai đoạn 1 – Xem xét các biến ảnh hưởng đến kích thước mẫu
Trước khi có thể tính toán cỡ mẫu, bạn cần xác định một số yếu tố liên quan đến tổng thể và mức độ chính xác mà bạn cần:
Bước 1. Tổng thể (Population size)
Bạn sẽ phỏng vấn/khảo sát với tổng tất cả bao nhiêu người? Để xác định được con số này, bạn cần xác định rõ nhóm đối tượng phù hợp với tổng thể của bạn hay không. Ví dụ nếu cần nghiên cứu về đối tượng người nuôi chó, bạn sẽ cần mở rộng tới toàn bộ những người đã từng nuôi/ sở hữu ít nhất một chú chó (Tất nhiên bạn có thể thêm hoặc bỏ đối tượng đã từng nuôi chó trong quá khứ, phụ thuộc vào mục tiêu nghiên cứu của bạn). Đừng lo lắng nếu bạn không thể tính toán trước con số chính xác nhé. Vì việc dự đoán một con số ước chừng, không cụ thể là rất bình thường.
Bước 2. Biên độ sai số (Margin of error) – Khoảng tin cậy (Confidence Interval)
Sai số là không thể tránh khỏi trong thống kê dữ liệu – nhưng câu hỏi ở đây là: bạn cho phép sai số trong khoảng bao nhiêu? Biên độ sai số (Margin of error), hay còn gọi là Khoảng tin cậy (Confidence interval), được biểu thị dưới dạng giá trị trung bình. Bạn có thể đưa ra một mức chênh lệch mà bạn cho phép giữa số trung bình của mẫu và số trung bình của tổng thể. Nếu bạn đã từng nhìn thấy một cuộc thăm dò ý kiến về chính trị trên mục tin tức, thì chắc hẳn bạn đã từng thấy chỉ số về Khoảng tin cậy và cách nó được thể hiện. Thường sẽ trông như thế này: “68% số cử tri nói đồng ý với đề xuất Z, với biên độ sai số +/-5%”.
Bước 3. Mức độ tin cậy (Confidence level)
Mức độ tin cậy (Confidence level) là một bước hoàn toàn riêng biệt, không liên quan tới cái tên tương tự – Khoảng tin cậy (Confidence interval) được nhắc tới ở bước 2. Nó đề cập đến việc bạn muốn mức độ tin cậy có giá trị trung bình được bao gồm trong biên độ sai số là bao nhiêu. Khoảng tin cây thường là 90%, 95% và 99%.
Bước 4. Độ lệch chuẩn (Standard deviation)
Ở bước này, bạn cần ước tính xem có khoảng bao nhiêu phản hồi sẽ có kết quả khác với những phản hồi khác và với số trung bình. Một độ lệch chuẩn thấp đồng nghĩa với việc tất cả giá trị thu được sẽ gần với giá trị trung bình, trong khi độ lệch chuẩn cao tức chúng sẽ trải rộng trên một phạm vi rộng hơn nhiều. Nếu chưa thực hiện khảo sát thì một lựa chọn an toàn chính là độ lệch chuẩn 0.5 sẽ giúp đảm bảo bạn có kích thước mẫu đủ lớn.
Giai đoạn 2: Tính chỉ số kích thước mẫu
Bây giờ sau khi có câu trả lời cho các bước từ 1-4, bạn đã có thể tính số kích thước mẫu bạn cần.
Bước 5. Xác định điểm số chuẩn (Z-score)
Tiếp theo, bạn cần chuyển chỉ số Mức độ tin cậy (confidence level) thành điểm số chuẩn (Điểm Z). Dưới đây là điểm số chuẩn cho các mức độ tin cậy phổ biến nhất:
- 90% – điểm Z = 1.645
- 95% – điểm Z = 1.96
- 99% – điểm Z = 2.576
Bước 6. Sử dụng công thức kích thước mẫu
Dưới đây là công thức xác định kích thước mẫu cần thiết:
Giả sử bạn chọn mức độ tin cậy 95%, độ lệch chuẩn 0.5 và sai số là +/-5%.
((1.96)2 x .5(.5)) / (.05)2
(3.8416 x .25) / .0025
.9604 / .0025
384.16
Vậy bạn cần 385 người phản hồi khảo sát.
Tuyệt vời! Bạn vừa xác định kích thước mẫu mình cần rồi đấy.
Nếu kết quả kích thước mẫu quá lớn thì sao?
Nếu bạn có kích thước mẫu quá lớn để kiểm soát, bạn có thể điều chỉnh một trong hai phương án sau:
- giảm mức độ tự tin
- tăng biên độ sai số
Điều này sẽ tăng khả năng sai số trong khi chọn mẫu, nhưng nó giúp giảm đáng kể số phản hồi bạn cần thu thập.