100 مجال ثقة للمتوسط الحسابي لمجتمع إحصائي، هذه المجالات محسوبة من 100 عينة عشوائية. أيضا كل من هذه المجالات محسوب بمستوى ثقة قدره 95%. فقط 94 من هذه المجالات يحتوي على القيمة الحقيقية للمتوسط الحسابي للمجتمع μ = 5، بينما 6 مجالات لا تحتوي على القيمة الحقيقية!
في الإحصاء، مجال الثقة أو نطاق الثقة[2] (بالانكليزية: Confidence Interval) هو مجال عددي يُتوقع أن يحتوي على القيمة الحقيقية لمَعلَمة إحصائية يراد معرفتها لمجتمع إحصائي ما.
يترافق مفهوم مجال الثقة مع مفهوم آخر هو مستوى الثقة والذي يمكن شرحه كالتالي: لنقل أننا نريد تقدير قيمة مَعلمة ما لمجتمع إحصائي وقمنا لهذا الغرض بتكرار تجربة إحصائية على العديد من العينات العشوائية المأخوذة من المجتمع ومن ثم قمنا بحساب مجال ثقة لقيمة المَعلَمة المدروسة من كل من هذه العينات. يُطلق على نسبة عدد مجالات الثقة التي حوت على القيمة الحقيقية للمعلمة اسم مستوى الثقة.[3][4][5]
عندما نقول أننا واثقون بنسبة 99% (أي أن مستوى الثقة قدره 99%) بأن قيمة المعلمة المنشودة (المتوسط الحسابي مثلا) تقع ضمن مجال الثقة الذي حسبناه من عينة عشوائية فإن هذا يكافئ قولنا بأن 99% من كل مجالات الثقة التي يمكن حسابها من عينات عشوائية من المجتمع الإحصائي المدروس ستحتوي على القيمة الحقيقية للمعلمة. لذا فإنه من الخطأ القول أن مستوى ثقة بقيمة 99% يعني بأن هنالك احتمال 99% بوقوع القيمة الحقيقية للمعلمة ضمن مجال الثقة المحسوب. الصحيح هو أن القيمة الحقيقية للمعلمة إما أن تقع ضمن من مجال الثقة أو أنها لا تقع ضمنه. كلمة الثقة هنا ليس لها علاقة بالاحتمالية وإنما بتكرارية احتواء مجالات الثقة المحسوبة من العديد من العينات على القيمة الحقيقية للمعلمة.[5] (انظر الشكل الجانبي).
يتم تحديد مستوى الثقة من قِبَل الباحث نفسه وبالتالي هو ليس رقما مستنبطا من بيانات العينة. جرت العادة في أغلب الأبحاث أن يتم استخدام مجالات ثقة بمستوى ثقة قدره 95% ولكن يمكن أن يتم أيضا حسابها بمستويات ثقة أخرى مثل 99% و90%. تجدر الإشارة إلى أن حجم مجال الثقة يتأثر بعدة عوامل مثل حجم العينة المدروسة وتشتت المجتمع الإحصائي.
يعتبر جيرزي نيمان هو أول من أتى بفكرة مجالات الثقة في الإحصاء وذلك في ورقة بحثية نشرت في العام 1937.[5]
تعريف
لنفرض أن لدينا عينة عشوائية من توزع احتمالي ذي معلمة (بارامتر) . لكي نتمكن من معرفة قيمة للتوزع الاحتمالي بمستوى ثقة قدره يمكننا تعريف مجال ثقة بحدين عشوائيين و يحققان الصيغة التالية:
حيث:
يشير إلى توزع الاحتمال للعينة العشوائية ذي المعلمتين و
هي مَعلمة إحصائية للتوزع الاحتمالي لسنا مهتمين بها في الدراسة لكنها توصّف التوزع الاحتمالي
هما دالتان لتحديد قيمتين عشوائيتين من (التي بدورها هي عينة عشوائية)
يمكن قراءة الصيغة أعلاه على النحو التالي: إن مجال الثقة الواقع بين الحدين العشوائيين و المأخوذين من العينة العشوائية يحتوي على القيمة الحقيقية لـ باحتمال قدره . لاحظ أنه يمكننا استعمال مفهوم «الاحتمال» هنا كون أننا ما زلنا نتكلم عن عينة عشوائية لكن حالما نقوم فعليا بأخذ العينة ولنسمها ونقوم بتحديد مجال ثقة بعينه فإننا أصبحنا أمام مثال واحد (عينة واحدة) من بين كل الأمثلة الممكنة (كل العينات الممكنة) وبالتالي لن يكون من الصحيح الحديث عن "احتمال قدره لاحتواء المجال على قيمة المعلمة " وإنما نقول أن هذا المجال هو ذو مستوى ثقة قدره .
مجال الثقة في اختبارات الفرضيات الإحصائية
إذا أجرينا اختبار فرضية إحصائية ما فيكون مستوى الثقة هو متمم متسوى الدلالة المنشود للاختبار. فإذا كان مستوى الدلالة المطلوب من قبل الباحثين هو 5% فيجب أن يكون مستوى الثقة هو 95%.[6] وبهذا يكون مجال الثقة حاويا على القيم المحتملة للمعلمة الإحصائية والتي عند إخضاعها للاختبار الإحصائي باستخدام نفس العينة فلن يمكن أن يتم رفضها.