اعتيان

أخذ العينات (أو الاعتيان أو المعاينة أو سحب العينات) (بالإنجليزية: Sampling)، في الإحصاء وضمان الجودة والاستقصاء الإحصائي، طريقة فى جمع المعلومات واستخلاص الاستدلالات عن مجتمع أو عدد كبير من السكان من خلال تحليل جزء فقط منه أو ما نسميه عينة. أو هو اختيار مجموعة فرعية (عينة إحصائية) من الأفراد من داخل مجتمع إحصائي لتقدير خصائص المجتمع بأكمله. بشكل يحاول فيه الإحصائيون جعل العينات تمثّل السكان المعنيين. يوجد ميزتان لأخذ العينات، هما التكلفة المنخفضة وجمع البيانات بشكل أسرع من جمعها للسكان بالكامل.

تقيس كل ملاحظة علمية (كل رصد) خاصية واحدة أو أكثر (مثل الوزن والموقع واللون) للكيانات ممكنة الملاحظة والمميزة كأشياء أو أفراد مستقلين. في مسح أخذ العينات، يمكن وضع الوزن كأحد البيانات لضبط تصميم العينة، لا سيما في أخذ العينات الطبقية. تُستخدم نتائج من نظرية الاحتمالات والنظرية الإحصائية لتوجيه تطبيق أخذ العينات. في مجال الأعمال التجارية والبحوث الطبية، يُستخدم أخذ العينات على نطاق واسع لجمع المعلومات حول المجتمع الإحصائي. تُستخدم عينات القبول لتحديد ما إذا كانت دفعة من المواد المُنتجة تفي بالمواصفات المطلوبة.

أهمية المعاينة

الحصر الشامل أو التعداد السكانى طريقة مكثقة لرصد التغير الافتصادى والاجتماعى، ولكنها تجرى على فترات متباعدة تكون فى العادة كل عشر سنوات. و المعاينة أو سحب عينة ييسر إجراء مسح لكل السكان فى مجتمع ما، أو لقطاعات فرعية منه، بتكلفة أقل كثيرا وبانتظام، مع توجيه يقية الموارد لتحسين درجة عمق وجودة الممعلومات التى يتم جمعها، على عكس المعلومات السطحية التى يتم الحصول عليها من التعداد. وتستخدم المعاينة أيضا فى سياقات أخرى، كأن تتخذ كطريقة لضبط الجودة فى المصانع الإنتاجية.

وقد حقق استخدام المعاينة كأساس للطريقة المنهجية والإحصائيات الاستدلالية داخل نطاق علم الاجتماع، إسهامات هائلة فى تحسين الإنفاق على الأبحاث الإمبيريقية.

حجم العينة

تتطلب المعاينة بنظام الاحتمالات أن كل مفردة فى المجموع الذى تتم دراسته يجب أن تكون أمامها فرصة ثابتة أو مؤكدة لكى تختار ضمن العينة، وعندها يمكن استخدام إحصاء الاحتمالات للتوصل إلى القياس الكمى لمخاطرة استخلاص تتائج خاطئة من عينات مختلفة الأحجام. ومن الواضح بداهة أنه إذا ما تم اختيار حالة من بين كل حالتين بطريقة عشوائية من مجتمع ما، فإن مخاطرة ألا يكون النصف الذى وقع عليه الاختيار غير ممثل للمجموع، أقل كثيرا مما إذا كنا تختار حالة أو مفردة واحدة من بين كل خمسين. إن زيادة النسبة فى المعاينة إلى حد أن تكون واحدة من بين كل اتنين لابد وأن تقدم لنا معلومات يعتمد عليها أكثر مما لو كانت نسبة المعاينة واحدا من كل خمسين. و لكن الحجم الفعلى للعينة يعد أكثر أهمية فى تحديد مدى اعتبار العينة ممثلة. فعينة تضم حوالى 2500 شخص يكون لها نفس الصدق والتمثيل، سواء كانت قد اختيرت من بين مائه ألمف أو مليون نسمة. والحقيقة أن العينات التى تترواح أحجامها ما بين 2000 وإلى 2500 مفردة هى أكثر أحجام العينات شيوعا فى العينات القومية، خاصة حينما يكون المقصود هو دراسة مدى محدود من الخصائص.

تصميم العينات

هناك أنواع عديدة من تصميمات العينات. العينة العشوائية، أو العينة العشوائية البسيطة، هى التصميم الذى تتاح لكل مفردة فيه فرصة متساوية (أو احتمال متساو) فى الاختيار، حتى يمكن تطبيق أساليب إحصائيات الاحتمالات على المبياتات التى يتم جمعها. ومن الصور الأخرى الشائعة داخل هذا الإطار ما يسمى بالعينة الطبقية العشوائية، حيث يقسم مجتمع الدراسة أولا إلى مجموعات فرعية أو شرائح، ثم يتم تطبيق العشوائية فى اختيار العينة من داخل كل مجموعة أو شريحة. وعلى سبيل المثال يمكن تطبيق العشوائية فى اختيار عينة من مجموعة الذكور ومجموعة الإناث من إجمالى مجموع الممثلين السياسيين، ولمكن باستخدام معدل عينة بواقع شخص من كل عشرين من مجموع الذكور لأنهم كثرة، ومعدل عينة بواقع شخص من كل اثنين من مجموع الإتاث لأته قليل نسبيا.

ومن الأنواع الأخرى الشائعة المعاينة ذات المرحلتين أو متعددة المراحل. من ذلك مثلا أن تستخدم المعاينة العشوائية أولا فى اختيار عدد محدود من المناطق المحلية لإجراء مسح معين، ثم تطبق العشوائية فى المرحلة الثانية لاختيار الأشخاص أو الأسر أو الشركات من داخل عينة المناطق المحلية الممختارة فى المرحلة الأولى. ويمكن أن تمتد هذه المراحل إلى ثلاتة أو أكثر عند اللزوم، طالما أن عدد العينة فى النهاية يظل كبيرا بدرجة تسمح بالتحليل. وكل هذه التصميمات السابقة للمعاينة تقوم على استخدام المعاينة العشوائية فى عملية الاختيار النهائية فيصبح لدينا قائمة من الأشخاص من سجلات الناخبين، أو عناوين الأسر، أو أسماء الشركات أو أى طريقة تتيح اختيار العينة المطلوبة. ويتعين أن تشمل الدراسة جميع مفردات العينة، ولا يسمح فيها باختيار بدلاء، وذلك على العكس من الإجراءات المتبعة فى الحصول على ما يسمى بالعينة الحصية أو عينة الحصص. ولهذا السبب يتعين على جامعى البيانات فى المسوح التى تستخدم المعاينة العشوائية أن يبذلوا قصارى جهدهم لإقناع أفراد عينة المبحوثين المختارة بالمشاركة فى الدراسة. ذلك أن الفشل فى إنجاز المقابلات - وبالتالى جمع الييانات - مع كل مفردات العينة قد يوقعنا فى نوع من التحيز يطلق عليه تحيز عدم الاستجابة بالنسبة للبيانات التى جمعناها. أما بالنسبة لتصميمات المعاينة الأخرى - الأكثر تعقيداً - فيتم حساب خطأ المعاينة فيها بطرق إحصانية أكثر تعقيدا من المتبع فى نظام العينة العشوائية.

وبمعرفة حجم العينة ونسبتها من المجموع الكلى، يصبح بالإمكان تطبيق نظرية الاحتمالات، حيث تقدم لنا مدى واسعا من الاستدلالات الإحصائية فيما يتعلق بخصائص المجموع الذى سحبت منه العينة من واقع السمات التى تم ملاحظتها لتلك العينة والانحراف المعيارى (اتظر مادة: التباين) فى توزيع وسيط العينة، و الذى يشار إليه بالخطأ المعيارى للوسيط بالنسبة لأى خاصية (ولتكن العمر مثلا) والذى يمكن حسابه بحيث نقدر مدى صدق البيانات التى حصلنا عليها من العينة. ولا شك أن الأخطاء المعيارية الكبيرة تقلل من ثقتنا فى أن العينة تمثل مجتمع الدراسة تمثيلاً كاملا. كذلك يمكن حساب احتمال أن ينتج عن عينتين مقاييس مختلفة، وحساب احتمالات الحصول على قيم خاصة بمعامل الارتباط أو أى مقاييس ارتباط أخرى. ومعظم العمليات الإحصائية الأخرى ذات الصلة، واختبارات الدلالة متوفرة فى البرنامج الإحصائى المعروف فى الكمبيوتر باسم الحزمة الإحصائية للعلوم الاجتماعية. كما تمدنا كتب الإحصاء بتفاصيل عن العمليات الإحصائية الداخلةفى ذلك.

ومن المهم أن نؤكد على أن الكتب الأساسية فى دراسة العينات وحساب الاحتمالات تمت كتابتها بواسطة متخصصين فى الإحصاء، وهى تقتصر على الإشارة إلى حالة العينة العشوائية كحالة كلية واحدة، قى موضوع يجهله الإحصائى أو الباحث تماما، فلا تكون تحت يديه أى معلومات أخرى جوهرية، إلا ما يحصل عليه من العينة. ومن هنا فإن الاستنتاجات أو الاستدلالاث تقتصر فى رأيهم على تلك التى يمكن حسابها إحصاتياً ققط. و لكن من النادر بالنسبة لعالم الاجتماع أو للمشتغل بأى علم اجتماعى آخر أن يكون فى هذا الوضع. فالباحثون الأكفاء يجهزون كما كبيرا من المعلومات الجوهرية المفيدة - التى تساعدهم فى تقييم مدى صدق وثبات نتائج المسح، كما يدعمون المقاييس الإحصائية بطرق أخرى لزيادة الثقة فى الاعتماد على نتائج المسح بالعينة، و على التفسيرات التى تتم لها. ومن هذه الطرق استخدام ثلاثة أدوات بحثية مثل: تكرار المسوح (كما يتضح من استطلاعات الرأى)، ومسح التراث المذى يتيح للباحث بيانات مسوح سبق تكرارها، بالإضافة إلى التقييم النظرى. فالمقاييس الإحصائية الخاصة بتقدير الثبات أو الارتباط، أو الدلالة لا تتسا وى مع التقدير الممستند إلى الأهمية الموضوعية الحقيقية للنتائج. فأحيانا ما تصبح المسوح الاجتماعية مغرقة أو مبالغة فى الميكانيكية فى سعيها - على سبيل المثال - إلى تأكيد ما إذا كانت نسبة حدوث شئما 31% أم 36% بينما يعنينا فى هذا الأمر - من الناحية العملية - ما إذا كاتت نسبة هذا الحدوث هى الثلث أم واحد إلى كل ثلاتين.

تعريف المجتمع الإحصائي

تعتمد الممارسة الإحصائية الناجحة على التركيز على تعريف المشكلة. في أخذ العينات، يتضمن ذلك تحديد «المجتمع» الذي تُسحب منه عينتنا. يمكن تعريف المجتمع الإحصائي على أنه مجتمع يشمل جميع الأشخاص أو العناصر ذات الخصائص التي يرغب الباحث في فهمها. نظرًا لأنه نادرًا ما يكون هناك ما يكفي من الوقت أو المال لجمع المعلومات من الجميع أو عن كل شيء في المجتمع الإحصائي، يصبح الهدف إيجاد عينة تمثيلية (أو مجموعة فرعية) من ذلك المجتمع.

في بعض الأحيان يكون ما يعرّف المجتمع واضحًا. على سبيل المثال، تحتاج الشركة المصنعة إلى تحديد ما إذا كانت دفعة من المواد المُنتَجة ذات جودة عالية بما يكفي من أجل تصديرها للعميل، أو ينبغي الحكم عليها في حال كانت سيئة أو إعادة إنتاجها بسبب رداءة الجودة. في هذه الحالة، دُفعة من الإنتاج (مجموعة صغيرة) هي المجتمع.

على الرغم من أنه غالبًا ما يتكون المجتمع المطلوب من أشياء مادية، فمن الضروري أحيانًا أخذ عينات في أوقات أو أماكن مختلفة أو باختلاف زمني ومكاني معًا. على سبيل المثال، يمكن لتحقيق حول موظفي السوبر ماركت البحث في طول مدة الخروج خلال أوقات مختلفة، أو قد تهدف دراسة عن طيور البطريق المهددة بالانقراض إلى فهم استخدامها لمختلف مناطق الصيد بمرور الوقت. بالنسبة للبعد الزمني، يمكن التركيز على فترات أو مناسبات منفصلة عن بعضها زمنيًا.

في حالات أخرى، قد يكون «المجتمع» المدروس أقل وضوحًا. على سبيل المثال، درس جوزيف جاغر سلوك عجلات الروليت في كازينو في مونت كارلو، واستخدم ذلك لتحديد عجلة منحازة. في هذه الحالة، كان «المجتمع» الذي أراد جاغر الدراسة عنه هو السلوك العام للعجلة (أي التوزيع الاحتمالي لنتائجها على عدد لا نهائي من التجارب)، بينما كانت عينته عبارة عن النتائج المرصودة من تلك العجلة. تظهر اعتبارات مماثلة عند إجراء قياسات متكررة لبعض الخصائص الفيزيائية مثل التوصيل الكهربائي للنحاس.

غالبًا ما ينشأ هذا الموقف عند البحث عن المعرفة حول السببية التي جعلت المجتمع المرصود نتيجة له. في مثل هذه الحالات، قد تعامل نظرية الاعتيان المجتمع المرصود كعينة من «مجتمع أكبر». على سبيل المثال، قد يدرس الباحث معدل نجاح برنامج «الإقلاع عن التدخين» الجديد على مجموعة اختبار مكونة من 100 مريض، من أجل التنبؤ بآثار البرنامج في حال نُشر على الصعيد الوطني. يكون هنا المجتمع الأكبر هو «كل شخص مُتاح له الوصول إلى هذا العلاج في البلد»، فالمجموعة الأكبر غير موجودة بعد؛ لأن البرنامج غير متاح للجميع بعد.

قد لا يكون المجتمع الذي تُؤخذ منه العينات هو نفسه المجتمع الذي ترغب في الحصول على معلومات عنه. غالبًا ما يكون هناك تداخل كبير ولكن غير كامل بين هاتين المجموعتين بسبب مشاكل الإطار وما إلى ذلك (انظر أدناه). في بعض الأحيان قد تكون المجموعتان منفصلتان تمامًا. على سبيل المثال، قد يدرس المرء الفئران من أجل الحصول على فهم أفضل لصحة الإنسان، أو قد يدرس الشخص سجلات من مواليد 2008 من أجل وضع تنبؤات حول الأشخاص الذين ولدوا في عام 2009.

إطار أخذ العينات

في الحالة الأكثر وضوحًا، مثل أخذ عينات من دفعة من المواد المنتجة، سيكون من المرغوب فيه تحديد وقياس كل عنصر في المجتمع وتضمين أي منها في عينتنا. ومع ذلك، في الحالة العامة، لا يكون هذا ممكنًا أو عمليًا في العادة. إذ لا توجد طريقة للتعرف على جميع الفئران في مجموعة الفئران. عندما لا يكون التصويت إجباريًا، لا توجد طريقة لتحديد الأشخاص الذين سيصوتون في الانتخابات القادمة (قبل الانتخابات). هذه المجموعات الإحصائية غير الدقيقة ليست قابلة لأخذ العينات بأي من الطرق المعروفة، والتي يمكننا تطبيق النظرية الإحصائية عليها.

وأحد الحلول لذلك، السعي إلى إطار أخذ العينات الذي له خاصية تمكننا من تحديد كل عنصر على حدة وتضمين أي عنصر في العينة. أكثر أنواع الأُطر وضوحًا هو إطار قائمة عناصر المجتمع (ويفضل جميع عناصر هذا المجتمع) مع معلومات الاتصال المناسبة. على سبيل المثال، في استطلاع للرأي، تتضمن أطر أخذ العينات الممكنة السجل الانتخابي ودليل الهاتف.

العينة الاحتمالية هي عينة يكون فيها لكل وحدة في المجتمع فرصة (أكبر من الصفر) لاختيارها في العينة، ويمكن تحديد هذا الاحتمال بدقة. إن الجمع بين هذه السمات يجعل من الممكن إنتاج تقديرات غير متحيزة للمجتمع، من خلال ترجيح الوحدات المأخوذة من العينات وفقًا لاحتمالية اختيارها.

مثال: نريد تقدير الدخل الإجمالي للبالغين الذين يعيشون في شارع معين. نزور كل منزل في ذلك الشارع، ونحدد جميع البالغين الذين يعيشون هناك، ونختار عشوائيًا شخصًا بالغًا من كل أسرة. (على سبيل المثال، يمكننا تخصيص رقم عشوائي لكل شخص، نختاره من توزيع موحد بين 0 و1، واختيار الشخص الذي لديه أكبر رقم في كل أسرة). ثم نجري مقابلة مع الشخص المختار ونسجل دخله.

من المؤكد أنه سيُختار الأشخاص الذين يعيشون بمفردهم، لذلك فإننا ببساطة نضيف دخلهم إلى تقديرنا للإجمالي. لكن الشخص الذي يعيش في منزل مكون من شخصين بالغين لديه فرصة اختيار واحد من اثنين فقط. لنعكس ذلك، عندما نأتي إلى مثل هذه الأسرة، فإننا نحسب دخل الشخص المختار مرتين من الإجمالي. (يمكن اعتبار الشخص الذي اخترناه من تلك الأسرة على أنه يمثل أيضًا الشخص الآخر الذي لم نختره).

في المثال أعلاه، ليس لدى الجميع نفس احتمالية الاختيار؛ ما يجعلها عينة احتمالية هو حقيقة أن احتمال كل شخص معروف. عندما يكون لكل عنصر في المجتمع نفس احتمالية الاختيار، يُعرف هذا باسم تصميم «احتمالية متساوية الاختيار».  يشار إلى هذه التصميمات أيضًا باسم «الترجيح الذاتي» لأن جميع الوحدات المأخوذة من العينات تأخذ نفس الوزن.

يشمل أخذ العينات الاحتمالية: أخذ العينات العشوائية البسيطة، أخذ العينات المنتظم، أخذ العينات الطبقية، الاحتمال المتناسب مع أخذ عينات حجمية، وأخذ العينات العنقودية أو متعددة المراحل. تشترك هذه الطرق المختلفة لأخذ العينات الاحتمالية في شيئين مشتركين:

  1. كل عنصر له احتمالية غير صفرية ومعروفة لأخذ عينات.
  2. تتضمن الاختيار العشوائي في مرحلة ما.

أخذ العينات غير الاحتمالية

أخذ العينات غير الاحتمالية هو أي طريقة أخذ عينات بشكل لا يكون لبعض عناصر المجتمع فرصة للاختيار (يشار إليها أحيانًا باسم «خارج التغطية» / «غير مغطاة»)، أو بشكل لا يمكن تحديد احتمال الاختيار بدقة. ينطوي هذا النوع على اختيار العناصر بناءً على الافتراضات المتعلقة بالمجتمع المعني، والذي يشكل معايير الاختيار. ومن ثم، نظرًا لأن اختيار العناصر غير عشوائي، فإن أخذ العينات غير الاحتمالية لا يسمح بتقدير أخطاء أخذ العينات. تؤدي هذه الشروط إلى تحيز الاستبعاد، مما يضع قيودًا على مقدار المعلومات التي يمكن أن توفرها العينة عن المجتمع. المعلومات حول العلاقة بين العينة والمجتمع محدودة، مما يجعل من الصعب الاستقراء من العينة إلى المجتمع.

مثال: نزور كل منزل في شارع معين، ونجري مقابلة مع أول شخص يجيب على الباب. في أي أسرة تحوي أكثر من ساكن واحد، هذه عينة غير محتملة، لأن بعض الناس أكثر عرضة للإجابة على الباب (على سبيل المثال، الشخص العاطل عن العمل الذي يقضي معظم وقته في المنزل من المرجح أن يجيب أكثر من زميل في المنزل قد يكون في العمل عندما يتصل المحاور) وليس من العملي حساب هذه الاحتمالات.

تشمل طرق أخذ العينات غير الاحتمالية أخذ العينات الملائمة وأخذ عينات الحصص وأخذ العينات الهادف. بالإضافة إلى ذلك، قد تحوّل تأثيرات عدم الاستجابة أي تصميم احتمالي إلى تصميم غير احتمالي إذا كانت خصائص عدم الاستجابة غير مفهومة جيدًا، نظرًا لأن عدم الاستجابة يعدل بشكل فعال احتمالية أخذ عينات لكل عنصر.