Sampling là gì? Hãy cùng Infocare tìm hiểu cách thức chọn mẫu, các trường hợp cần sử dụng và cách thức tối ưu nhằm chọn mẫu đại diện cho khảo sát nghiên cứu thị trường của bạn.
Mục lục
Khảo sát chọn mẫu (sampling) là gì?
Trong khảo sát thị trường, chọn mẫu là quá trình lựa chọn một nhóm công chúng mục tiêu nhằm đại diện cho tổng thể. Để dễ hình dung hơn, hãy điểm qua các phương pháp lấy mẫu dữ liệu mẫu với ví dụ dưới đây.
Trong một hoạt động nghiên cứu, bạn cần khảo sát hành vi tiêu dùng của những người đang sinh sống và làm việc ở Bắc Mỹ. Tất nhiên bạn không thể hỏi tất cả người dân ở đấy. Và cho dù hàng triệu người ở Bắc Mỹ đồng ý thực hiện khảo sát, thì việc triển khai khảo sát xuyên qua nhiều bang khác nhau, trong nhiều thứ tiếng và múi giờ khác nhau, sau đó thu thập và phân tích tất cả dữ liệu nhận được mất quá nhiều thời gian và tốn kém.
Chọn mẫu cho phép bạn thực hiện nghiên cứu ở quy mô lớn với chi phí và khung thời gian hợp lý hơn vì chỉ cần dữ liệu của số lượng cá thể nhỏ hơn trong toàn bộ tổng thể với các đặc điểm có thể đại diện thay thế cho toàn bộ.
Tuy nhiên, khi bạn quyết định lấy mẫu, bạn sẽ cần đối mặt với công việc mới. Đó là quyét định xem đối tượng nào là một phần trong danh sách mẫu của mình và cách chọn những người sẽ là đại diện tốt nhất cho tổng thể. Cách bạn giải quyết vấn đề này chính là tất cả những gì bạn cần biết về chọn mẫu.
Các định nghĩa liên quan đến chọn mẫu:
- Tổng thể nghiên cứu (population): là tập hợp tất cả các phần tử thuộc hiện tượng/ đối tượng nghiên cứu cần được quan sát, thu thập và phân tích
- Mẫu đại diện (sample): là một phần của tổng thể được chọn ra theo những cách thức nhất định và với một dung lượng hợp lý.
- Chọn mẫu (sampling): là quy trình và phương pháp chọn mẫu.
Tại sao chọn mẫu (sampling) lại quan trọng?
Dù ‘chọn mẫu’ là một định nghĩa hết sức dễ hiểu khi bạn nghĩ về một tổng thể nghiên cứu lớn, nhưng việc sử dụng phương pháp chọn mẫu khi nghiên cứu về mọi hình thức và quy mô là rất hợp lý. Đến cuối cùng, nếu có thể giảm bớt công sức và chi phí nghiên cứu thì tại sao không sử dụng, đúng không? Và do việc chọn mẫu giúp bạn có thể nghiên cứu nhóm công chúng mục tiêu lớn hơn với cùng nguồn lực khi thực hiện với một nhóm có quy mô nhỏ hơn, nó mở ra một tiềm năng đáng kể cho người làm nghiên cứu.
Chọn mẫu cũng giống như việc sử dụng bánh răng trên ô tô vậy. Thay vì luôn phải quay cả bộ bánh me có kích thước cụ thể và bị hạn chế với các đặc tính vật lý của chúng (cần nhiều lực để trực tiếp quay một bánh xe ô tô nặng), thì bạn có thể chuyển các lực tác động lên bánh xe thông qua những bánh răng khác nhau, vì vậy mà bạn có thể chọn các bánh răng lớn hơn hoặc bé hơn tùy thuộc vào địa hình khi di chuyển và vào lượng lực bạn có thể tác động.
Chọn mẫu cho phép bạn sử dụng các “bánh răng” lên nghiên cứu, từ đó giúp bạn ít bị giới hạn hơn bởi các hạn chế về chi phí, thời gian và những sự phức tạp đi cùng với các quy mô tổng thể khác nhau.
Nhờ phương pháp chọn mẫu và chúng ta có thể thực hiện các cuộc thăm dò ý kiến về tính năng cho một sản phẩm mới, cải tiến chất lượng sản phẩm hiện tại, lập bản đồ tỷ lệ lây lan và ảnh hưởng của dịch bệnh Covid-19 trên các khu vực địa lý, và thực hiện nghiên cứu điều tra dân số trên toàn quốc nhằm cung cấp một cái nhìn tổng quát về xã hội và văn hóa.
Mẫu xác suất (probability sampling) và mẫu phi xác suất (non-probability sampling)
Chiến lược chọn mẫu trong nghiên cứu rất khác nhau giữa các ngành nghề và lĩnh vực, hay từ nghiên cứu này đến nghiên cứu khác.
Có hai phương pháp chọn mẫu chính – mẫu xác suất và mẫu không xác suất.
- Mẫu xác suất (probability sampling), hay chọn mẫu ngẫu nhiên, là hình thức chọn mẫu trong đó sử dụng phương thức xác suất ngẫu nhiên thay vì lựa chọn có chủ ý.
- Mẫu phi xác suất (pon- probability sampling) là phương pháp các nhà nghiên cứu cố tình chọn các mục hoặc cá nhân tiêu biểu dựa trên mục tiêu nghiên cứu hoặc kiến thức của họ.
Phương pháp chọn mẫu xác suất (probability sampling)
Phương pháp chọn mẫu xác suất rất đa dạng các hình thức triển khai để bạn khám phá và cân nhắc. Dưới đây là một số lựa chọn phổ biến nhất.
1. Mẫu ngẫu nhiên đơn (simple random sampling)
Với phương pháp chọn mẫu ngẫu nhiên đơn, mọi phần tử trong tổng thể đều có cơ hội để được lựa chọn là một phần của danh sách mẫu nghiên cứu như nhau. Nó giống như việc chọn một cái tên từ một chiếc mũ vậy. Phương thức này có thể được thực hiện bằng cách ẩn danh toàn bộ tổng thể – ví dụ bằng cách gán cho mỗi mục hoặc mỗi người trong tổng thể một con số và chọn các con số một cách ngẫu nhiên.
Phương pháp mẫu ngẫu nhiên đơn rất đơn giản, dễ thực hiện và có chi phí thấp, đồng thời loại bỏ được tất cả rủi ro về sai lệch trong quá trình lấy mẫu. Tuy nghiên, nó không giúp người làm nghiên cứu sự kiểm soát và có thể dẫn đến xác suất các nhóm được chọn – một cách ngẫu nhiên – không thể đại diện cho tổng thể.
2. Mẫu ngẫu nhiên hệ thống (systematic sampling)
Với phương pháp lấy mẫu ngẫu nhiên hệ thống, hay còn gọi là phân cụm có hệ thống, việc chọn ngẫu nhiên chỉ áp dụng cho mục đầu tiên được chọn. Sau đó, một quy tắc sẽ được áp dụng để mọi phần tử hoặc người sau đó được chọn.
Mặc dù có liên quan đến xác suất ngẫu nhiên, nhưng nhà nghiên cứu vẫn có thể thay đổi khoảng thời gian mà các mục được chọn, điều này cho phép họ đảm bảo các lựa chọn sẽ không vô tình được nhóm lại cùng nhau.
3. Mẫu ngẫu nhiên phân tầng (stratified sampling)
Chọn mẫu ngẫu nhiên phân tầng bao gồm việc lựa chọn ngẫu nhiên trong các nhóm được xác định trước. Sẽ rất hữu ích khi các nhà nghiên cứu biết một số thông tin về nhóm đối tượng mục tiêu và có thể quyết định cách chia nhỏ (phân tầng) theo cách có ý nghĩa cho nghiên cứu.
Ví dụ, nếu bạn đang nghiên cứu hành vi di chuyển của một nhóm người, bạn có thể chia nhóm đó thành các nhóm nhỏ theo các tiêu chí như những người sở hữu, sử dụng ô tô, người sử dụng xe máy, hay những người phụ thuộc vào phương tiện giao thông công cộng.
Tuy có khá nhiều lợi tích nhưng phương pháp lấy mẫu phân tầng cũng đặt ra nhiều vấn đề cần giải quyết như làm thế nào để phân tầng tổng thể, điều có thể tạo nên nhiều nguy cơ về sai lệch dữ liệu.
4. Mẫu chùm (cluster sampling)
Với phương pháp chọn mẫu theo cụm (mẫu chùm), các nhóm nhỏ trong tổng thể chính là đối tượng được lựa chọn ngâu nhiên để nghiên cứu, thay vì chọn ngẫu nhiên các đối tượng như các phương pháp trên. Đây có thể là những nhóm đã tồn tại từ trước như những sinh viên thuộc năm nhất, phụ nữ có gia đình,..
Lấy mẫu theo cụm có thể được thực hiện bằng cách chọn toàn bộ một nhóm, hoặc trong trường hợp lấy mẫu theo 2 giai đoạn, bằng cách chọn ngẫu nhiên chính cụm đó, rồi lại chọn ngẫu nhiên trong cụm.
Mẫu phi xác suất (non-probability sampling)
Phương pháp chọn mẫu phi xác suất không giúp loại bỏ thiên vị khi chọn giống như lấy mẫu xác suất, nhưng đôi khi các loại lấy mẫu này được chọn vì tính hiệu quả hoặc đơn giản của nó. Dưới đây là một số hình thức lấy mẫu phi xác suất và cách thức thực hiện.
1. Lấy mẫu thuận tiện (convinience sampling)
Con người hoặc các phần tử trong một mẫu được chọn dựa trên khả năng tiếp cận và tính sẵn có của nó. Ví dụ, nếu bạn làm việc ở trường đại học và đang thực hiện một cuộc khảo sát nghiên cứu, thì một mẫu thuận tiện có thể bao gồm sinh viên hoặc các đồng nghiệp tình cờ ở trong khuôn viên trường, những người đang rảnh rỗi vào thời điểm đó và sẵn sàng trả lời bảng câu hỏi của bạn.
Loại mẫu này có thể có giá trị, đặc biệt nếu nó được thực hiện như bước đầu tiên nhưng sẽ có sự sai lệch đáng kể.
2. Chọn mẫu hạn ngạch (quota sampling)
Cũng giống phương pháp chọn mẫu ngẫu nhiên phân tầng dựa trên xác suất, cách tiếp cận này nhằm trải rộng trên toàn bộ tổng thể mục tiêu bằng cách xác định cụ thể đối tượng phù hợp để thực hiện khảo sát theo các nhóm tiêu chí nhất định. Ví dụ, hạn ngạch của bạn có thể bao gồm một số lượng nam giới và nữ giới nhất định. Ngoài ra, bạn có thể muốn chia mẫu theo tiêu chí về mức thu nhập cụ thể hoặc theo độ tuổi hoặc nhóm dân tộc nhất định.
Sự thiên vị có thể được đưa ra trong chính quá trình lựa chọn – ví dụ, bạn có thể thiên vị lựa chọn những người tình nguyện viên có thời gian rảnh có thể tham gia. Hoặc sự thiên vị có thể là một phần của các danh mục cho hạn ngạch được lựa chọn bởi các nhà nghiên cứu.
3. Chọn mẫu có chủ địch (purposive sampling)
Người tham gia cho mẫu được các nhà nghiên cứu lựa chọn một cách có ý thức dựa trên kiến thức và hiểu biết của họ về câu hỏi nghiên cứu hoặc mục tiêu của họ. Còn được gọi là lấy mẫu phán đoán, kỹ thuật này không có khả năng đưa ra được mẫu đại diện, nhưng nó là cách nhanh chóng và khá dễ dễ dàng để có được các kết quả hoặc phản hồi.
4. Chọn mẫu quả cầu tuyết (Snowball / referral sampling)
Với phương pháp này, những người được lựa chọn là mẫu khảo sát được yêu cầu mời những người mà họ biết để tham gia cùng, những người này sau đó cũng được mời gia đình và bạn bè của họ,.. Sự tham gia lan tỏa thông qua một cộng đồng các cá nhân được kết nối giống như một quả cầu tuyết lăn xuống dốc, càng xuống càng lớn.
Phương pháp này hữu ích khi người làm nghiên cứu không có nhiều hiểu biết về đối tượng nghiên cứu mục tiêu và không có cách dễ dàng để liên hệ hoặc tiếp cận họ. Tuy nhiên, điều này có thể bị thiên vị, ví dụ như bỏ sót các thành viên bị cô lập của một cộng đồng hoặc nghiêng về độ tuổi hoặc nhóm sở thích nhất định.
Tránh, giảm thiểu lỗi và thiên kiến khi chọn mẫu
Sử dụng mẫu là một kiểu đi tắt đón đầu. Nếu bạn có thể yêu cầu từng người trong cả tổng thể tham gia vào khảo sát của bạn và yêu cầu từng người trong số họ trả lời, bạn sẽ có trong tay một khối lượng dữ liệu với độ chính xác cao (và rất tốn nguồn lực).
Nhưng vì điều đó không thực tế, nên phương pháp chọn mẫu cung cấp một giải pháp “đủ tốt” nhằm hy sinh một số độ chính vì lợi ích thiết thực và dễ dàng. Mức độ kiểm soát mà bạn mất đi phụ thuộc vào khả năng kiểm soát lỗi khi chọn mẫu và sai lệch trong thiết kế nội dung khảo sát của bạn.