تحليل عاملي
التحليل العاملي (بالإنجليزية: Factor Analysis) هو طريقة إحصائية تُستخدم لوصف التباين بين المتغيرات الملاحظة والمترابطة من حيث عدد قليل من المتغيرات التي يمكن ملاحظتها والتي تسمى العوامل.
على سبيل المثال، من الممكن أن تعكس الاختلافات في ستة متغيرات ملحوظة بشكل أساسي التغيرات في متغيرين غير ملاحظتين (أساسيين).
يبحث تحليل العوامل عن هذه الاختلافات المشتركة استجابة لمتغيرات كامنة غير ملحوظة ويتم نمذجة المتغيرات المرصودة كمجموعات خطية من العوامل المحتملة، بالإضافة إلى مصطلحات «الأخطاء». يهدف تحليل العوامل إلى إيجاد متغيرات كامنة مستقلة.
النظرية الكامنة وراء الأساليب التحليلية للعامل هي أن المعلومات التي تم الحصول عليها حول الترابط بين المتغيرات المرصودة يمكن استخدامها لاحقًا لتقليل مجموعة المتغيرات في مجموعة البيانات. يستخدم تحليل العوامل بشكل شائع في علم الأحياء والقياسات النفسية ونظريات الشخصية والتسويق وإدارة المنتجات وأبحاث العمليات والتمويل. قد يساعد ذلك في التعامل مع مجموعات البيانات حيث توجد أعداد كبيرة من المتغيرات الملاحظة التي يعتقد أنها تعكس عددًا أقل من المتغيرات الأساسية / الكامنة وتعد واحدة من أكثر التقنيات استخدامًا بين التبعية وتستخدم عندما تظهر مجموعة المتغيرات ذات الصلة اعتمادًا منهجيًا فيما بينها والهدف من ذلك هو اكتشاف العوامل الكامنة التي تنشئ القواسم المشتركة.
يرتبط تحليل العامل بتحليل المكون الرئيسي (PCA)، لكن الاثنين غير متطابقين. كان هناك جدل كبير في هذا المجال حول الاختلافات بين الطريقتين (انظر القسم الخاص بتحليل العوامل الاستكشافية مقابل تحليل المكونات الرئيسية أدناه).
يمكن اعتبار PCA إصدارًا أساسيًا من تحليل العوامل الاستكشافية (EFA) الذي تم تطويره في الأيام الأولى السابقة لظهور أجهزة الكمبيوتر عالية السرعة ويهدف تحليل كل من PCA وتحليل العوامل إلى تقليل بُعد مجموعة من البيانات، لكن الأساليب المتبعة للقيام بذلك تختلف بالنسبة للتقنيتين. تم تصميم تحليل العوامل بوضوح بهدف تحديد بعض العوامل التي لا يمكن ملاحظتها من المتغيرات التي تم ملاحظتها، في حين أن PCA لا يعالج هذا الهدف مباشرة؛ في أحسن الأحوال، يوفر PCA تقريبًا للعوامل المطلوبة. من وجهة نظر التحليل الاستكشافي، فإن القيم الذاتية للـ PCA هي عبارة عن تحميلات مكونة مضخمة، أي انها تفسد بتغير الخطأ.
نبذة
التحليل العاملى مجموعة من الأساليب الإحصائية لتحليل البيانات، تستخدم عموماً لتبسيط إجراءات التحليل، عن طريق فحص البناء الداخلى لعدد من المتغيرات من أجل تحديد الانتظامات المتضمنة فيها. ومن أكثر صور التحليل العاملى شيوعا ما يسمى بالتحليل العاملى للمكون الرئيسى.
فالغالب أن هناك اتساقا بين الخصائص الاتجاهية أو المعرفية أو الثقويمية فى البيانات المسحية. فنجد على سبيل المثال أن المبحوثين الذين يؤيدون عقوبة الإعدام يمكن أن يعترضوا على تكافؤ الفرص بالنسبة للأقليات العرقية، أو يعترضوا على الإجهاض، أو يحبذوا إيقاف أنشطة النقابات العمالية وتجريم حق الإضراب، وبهذه الطريقة، فإن كل هذه العناصر تتسق مع بعضها البعض وتترابط فيما بينها. وبنفس الطريقة فإننا يمكن أن نتوقع أن أولئك الذين يحبذون هذه القيم السياسية اليمينية (قى السياق البريطانى) يمكن أن يميلوا أيضا إلى تأليد القيم الاقتصادية اليمينية، مثل خصخصة كل الأنشطة والمؤسسات التى تملكها الدولة، وتقليص خدمات دولة الرفاهية، وإيقاف التشريعات التى تحدد مستوى أدنى للأجور. وعندما تترابط وتتسق هذه الخصاتص فإنها تشكل عاملا، أو أنها تتشبع بعامل ضمنى يمكن أن يكون فىالممثال الذى ذكرناه عامل "الاتجاه المحافظ التسلطى".
وتتاح أساليب التحليل العاملى فى عدد من الحزم الإحصائية، ويمكن أن تستخدم لأغراض متعددة. وعلى سييل المثال، فإن أحد الاستخدامات الشائعة له هو اختبار "الصدق العاملى" للأسلة المختلفة المتضمنة فى أحد "المقاييس"، من خلال توضيح ما إذا كانت المبنود تقيس نفس المفهوم أو المتغير. فعندما نتعامل مع بيانات من بطاربة أسئلة تكشف عن الجوانب المختلفة للرضا عن الحكومة مثلا، فإننا يمكن أن نجد أن البنود التفصيلية التى تتعامل مع السياسات الافتصادية والمسياسية والاجتماعية، وتلك التى تتعامل مع درجة الثقة فى الحكومة أو درجة رضا المبحوثين عن المرئيس، يمكن ألا تكون مترابطة، الأمر الذى يدل على أن المبحوثين يعتبرون تلك الجوانب المختلفة متباينة ومتمايزة على المستوى التصورى. وبنفس الطريقة، فإن التحليل العاملى يمكن أن يحدد بالنسبة لأى عدد محدد من المتغيرات، الدرجة التى يمكن بها اختزال هذه المتغيرات إلى أقل عدد ممكن من أجل تبسيط التحليل، دون أن نضحى بأى من المفهومات أو المتغيرات التى نخضعها للقياس. وهناك إجراء بديل وهو أن يطلب الباحثون من المبحوثين أن يصفوا خصائص سمة اجتماعية (كالوعى الطبقى) أو شخصا معينا (كالسفاح)، ثم نقوم بالتحليل العاملى عن طريق تجميع الصفات لتوضيح كيفية ترابط واتساق الخصائص المختلفة.
وتعد كل هذه الاستخدامات استخدامات استرشادية، بمعنى أنها تحاول تحديد أى الممتغيرات يرتبط بأى متغيرات، دون أن تختبر نموذجاً معيناً أو تحاول التلاؤم مع نموذج معين. ويترتب على هذا، أن يواجه الباحثون -كما هو الحال عادة فى مثل هذا النوع من التحليل- صعوبة فى تفسير العوامل الأساسية التى تتشبع بها المجموعات المختلفة من المتغيرات. لقد توصل علماء الاجتماع إلى مسميات على درجة عالية من البراعة والخيال، واستتبطوا منها العوامل المتضمنة فيها، دون أن تتوفر لديهم فكرة واضحة عما يجب أن تكون عليه هذه الصياغات المجردة. وبالتالى فإن التحليل العاملى الدى يهدف إلى توكيد فكرة معينة لم يستخدم إلا فى النذر اليسير من الحالات. ففى مثل هذه الحالة يتوقع الباحث أن عددا من البنود التى تقيس "الرضا عن العمل" -مثلا-تشكل جميعا عاملا، ثم تختبر هذه القضية من خلال مقارنة النتائج الفعلية بحل يكون فيه تشبع العامل منضبطا.
وتوجد محكات بديلة لتحديد الطريقة الأفضل لإجراء التحليل، وعدد العوامل التى تستخدم فى التحليل، والمدى الذى يقوم فيه الحاسب الآلى بتدوير العوامل لفك تعقيدها أو تفسيرها. ويستخدم التدوير المتعامد فى وجود عوامل لا ترتبط ببعضها البعض، أما التدوير المائل فإنه يسمح لهذه العوامل أن تتيابط، وكما هو متوقع فإن ثمة جدلا حول الإجراء الأكثرملاءمةفىكل تحليل. وبالرغم من وجود قناعات راسخة حول مدى ترابط المتغيرات قبل استبعاد أى منها فى نطاق عامل، وحجم التباين الذى يفسره العامل قبل أن يستبعد باعتباره عاملا غيردال، وهذه قضايامحل جدال هى الأخرى. أما القاعدة العامة المستمدة من التجربة العملية، فإنهاتتلخص فى وجود ثلاتة متغيرات على الأقل بالنسبة لكل عامل، حتى يتسنى التوصل إلى تفسير مقبول واستبعاد العوامل التى تقل قيمتها الفعلية عن واحد صحيح، (ويتصل هذا المقدار بنسبة التباين، محسوبة بالمتوسط، التى يشير إليها عدد المتغيرات المناظرة فى الييانات، وبذلك يصبح هذا المقدار مقياسا مقننا يسمح للباحثين باستبعاد العوامل التى تحصل على درجة تباين أقل من المتغير المتوسط). ومع ذلك فحتى إذا كانت القيمة الحقيقية لأحد العوامل أكبر من واحد صحيح، فلا قيمة للإبقاء عليه (فى منظومة العوامل) إذا لم يتيسر ثفسيره وكان له معنى جوهريا. وعند هذه النقطة ينتهى التحليل الإحصائى، ويبداً دور النظرية الاجتماعية والخيال السوسيولوجى. وفضلا عن ذلك، فإن مصفوفة العوامل التى يظهر ها (التحليل العاملى) بالنسبة للمتغيرات فى أى صورة كانت، إنما تعكس البيانات التى اشتقت منها العوامل، تتطلب لحسابها متغيرات أخرى يتم مقياسها على المستوى الوسيط، وأن يكون لها توزيع اعتدالى. وهكذا فإن استخدام التحليل العاملى كثيرا ما تكتنفه خلافات حول توافر هذه الشروط أو عدم توافرها. للاطلاع على مقدمة مفيدة كتبها عالم اجتماع فى الموضوع، انظر دراسة دوان ألوين، التحليل العاملى، المنشورة فى بورجاتا وبورجاتا (محرران)، موسوعة علم الاجتماع، الصادرة عام 1992.
التنفيذ العملي
أنواع تحليل العوامل
التحليل العاملي الاستكشافي (EFA): يستخدم لتحديد العلاقات المعقدة والمتبادلة بين العناصر وعناصر المجموعة التي تعد جزءًا من المفاهيم الموحدة ولا يقدم الباحث افتراضات مسبقة حول العلاقات بين العوامل.
التحليل العاملي التوكيدي (CFA): هو نهج أكثر تعقيدًا يختبر الفرضية القائلة بأن العناصر مرتبطة بعوامل محددة ويستخدم CFA نمذجة المعادلة الهيكلية لاختبار نموذج القياس حيث يسمح التحميل على العوامل بتقييم العلاقات بين المتغيرات التي تم ملاحظتها والمتغيرات غير الملاحظة.
يمكن لنهج نمذجة المعادلة الهيكلية استيعاب خطأ القياس، وهي أقل تقييدًا من تقدير المربعات الصغرى.
يتم اختبار النماذج المفترضة مقابل البيانات الفعلية، وسيوضح التحليل كميات متغيرات ملحوظة على المتغيرات الكامنة (العوامل)، وكذلك العلاقة بين المتغيرات الكامنة.
أنواع استخراج العامل
يعد تحليل المكون الرئيسي (PCA) طريقة تستخدم على نطاق واسع لاستخراج العوامل، وهي المرحلة الأولى من (EFA). يتم حساب أوزان العوامل لاستخراج أقصى تباين ممكن ومع استمرار العوملة المتتالية حتى لا يتبقى مزيد من التباين يجب حينئذٍ تدوير نموذج العامل للتحليل.
يعد تحليل عوامل العنوان الاساسي، الذي يُطلق عليه أيضًا {Rao's canonical factoring} طريقة مختلفة لحساب نفس نموذج PCA ، والذي يستخدم طريقة المحور الرئيسي ويبحث تحليل العوامل للعنوان الاساسي عن العوامل التي لها أعلى ارتباط قانوني مع المتغيرات التي تم ملاحظتها ولا يتأثر هذا التحليل بإعادة القياس التعسفي للبيانات.
يبحث تحليل العوامل المشتركة، والذي يسمى أيضًا تحليل العوامل الرئيسية (PFA) أو تحليل العوامل (PAF)، على أقل عدد من العوامل التي يمكن أن تفسر التباين المشترك (الارتباط) لمجموعة من المتغيرات.
يعتمد تحليل الصور على مصفوفة الارتباط للمتغيرات المتوقعة بدلاً من المتغيرات الفعلية، حيث يتم التنبؤ بكل متغير من المتغيرات الأخرى باستخدام الانحدار المتعدد.
عامل ألفا يقوم على تعظيم موثوقية العوامل، على افتراض أن المتغيرات يتم أخذ عينات منها بشكل عشوائي من مجموعة من المتغيرات وتفترض جميع الطرق الأخرى حالات يتم أخذ عينات منها والمتغيرات الثابتة.
نموذج انحدار العامل هو نموذج اندماجي لنموذج العامل ونموذج الانحدار؛ أو بدلاً من ذلك، يمكن اعتباره نموذج عامل مختلط، وعواملها معروفة جزئيًا.
المصطلح
تحميلات العامل: القواسم المشتركة هي مربع التحميل الخارجي الموحد لأحد العناصر.
يشبه التحميل التربيعي لبيرسون، يكون عامل تحميل التربيع هو النسبة المئوية للتباين في متغير المؤشر الذي يوضحه العامل.
للحصول على نسبة التباين في جميع المتغيرات التي يتم حسابها لكل عامل، أضف مجموع عمليات تحميل العامل التربيعي لهذا العامل (العمود) وقسم على عدد المتغيرات. (لاحظ أن عدد المتغيرات يساوي مجموع تبايناتها حيث يكون التباين لمتغير قياسي هو 1.) هذا هو نفس تقسيم المتغيرات الذاتية للعامل على عدد المتغيرات. تحميل عامل التفسير: من خلال إحدى قواعد التجربة في تحليل عامل التأكيد، يجب أن تكون التحميلات 0.7 أو أعلى لتأكيد أن المتغيرات المستقلة المحددة سلفًا يتم تمثيلها بعامل معين، على الأساس المنطقي الذي يتوافق مع مستوى 0.7. التباين في المؤشر الذي يفسره العامل.
ومع ذلك، فإن معيار.7 هو معيار عالٍ، وقد لا تفي بيانات الحياة الواقعية بهذا المعيار، وهذا هو السبب في أن بعض الباحثين، ولا سيما لأغراض الاستكشاف، سيستخدمون مستوى أدنى مثل.4 للعامل المركزي و 0.25 ل عوامل أخرى.
في الدوران المائل، يمكن للمرء أن يفحص كلا من مصفوفة النمط ومصفوفة الهيكل.
المصفوفة الهيكلية هي ببساطة مصفوفة تحميل العوامل كما هو الحال في الدوران المتعامد، والتي تمثل التباين في المتغير المقاس الذي يفسره عامل على أساس مساهمات فريدة ومشتركة.
في المقابل، تحتوي مصفوفة الأنماط على معاملات تمثل مجرد مساهمات فريدة.
هنالك قاعدة تقول انه كلما زاد عدد العوامل، كلما قلت معاملات النمط كقاعدة، حيث ستكون هناك مساهمات أكثر شيوعًا في التباين.
للدوران المائل، ينظر الباحث إلى كل من معاملات الهيكل والنمط عند توزيع الملصق على عامل ما.
Communality: مجموع تحميلات العامل التربيعي لجميع العوامل لمتغير معين (صف) هو التباين في هذا المتغير الذي تحسبه جميع العوامل. تقيس الجماعة النسبة المئوية للتباين في متغير معين موضحة بكل العوامل بشكل مشترك وقد يتم تفسيرها على أنها موثوقية المؤشر في سياق العوامل التي يتم طرحها.
الحلول الزائفة: إذا تجاوزت المشاركة 1.0، هناك حل زائف، والذي قد يعكس عينة صغيرة جدًا أو اختيار لاستخراج عدد كبير جدًا أو قليل جدًا من العوامل.
تفرد المتغير: تقلب المتغير مطروحًا منه مشتركيته.
القيم الذاتية / الجذور المميزة: تقيس القيم الذاتية مقدار التباين في العينة الكلية التي يمثلها كل عامل. نسبة القيم الذاتية هي نسبة الأهمية التفسيرية للعوامل بالنسبة للمتغيرات. إذا كان أحد العوامل يحتوي على قيمة متناظرة منخفضة، فإنه يسهم قليلاً في تفسير الفروق في المتغيرات وقد يتم تجاهله على أنه أقل أهمية من العوامل ذات القيم الذاتية الأعلى.
مجموع الاستخراج للتحميلات التربيعية: القيم الذاتية الأولية والقيم الذاتية بعد الاستخراج (المدرجة من قبل SPSS باسم «مقتطفات الأحجام التربيعية») هي نفسها بالنسبة لاستخراج PCA ، ولكن بالنسبة لطرق الاستخراج الأخرى، ستكون القيم الذاتية بعد الاستخراج أقل من نظيراتها الأولية. تقوم SPSS أيضًا بطباعة «تناوب مبالغ الأحمال التربيعية» وحتى بالنسبة لمحكمة التحكيم الدائمة، فإن القيم الذاتية هذه تختلف عن القيم الأولية الأولية والاستخراجية، على الرغم من أن إجماليها سيكون هو نفسه.
درجات العامل (تسمى أيضًا نقاط المكون في PCA): هي علامات كل حالة (صف) في كل عامل (عمود). لحساب درجة العامل لحالة معينة لعامل معين، يأخذ المرء النتيجة المعيارية للحالة في كل متغير، ويتضاعف بواسطة التحميلات المقابلة للمتغير للعامل المحدد، ويجمع هذه المنتجات. نتائج عامل الحوسبة تسمح للمرء بالبحث عن القيم المتطرفة للعامل. أيضا ويمكن استخدام درجات العامل كمتغيرات في النمذجة اللاحقة. (موضحة من PCA وليس من منظور تحليل العوامل).