القائمة الرئيسية

الصفحات

أنواع المتغيرات في الإحصاء وعلم البيانات

 

كل يوم، يتم إنشاء 2.5 كوينتيليون ( 1,000,000,000,000,000,000) بايت من البيانات. تأتي هذه البيانات من الصور الرقمية ومقاطع الفيديو والمشاركات على مواقع التواصل الاجتماعي وأجهزة الاستشعار الذكية وسجلات معاملات الشراء وإشارات GPS للهاتف الخلوي على سبيل المثال لا الحصر، لذلك يكتسب مجال علم البيانات و تحليل البيانات والإحصاء أهمية كبيرة ويسعى كثر من الأشخاص الى العمل كمحللي بيانات خاصة مع الرواتب الكبيرة التي أصبحت تدفعها الشركات لمحللي البيانات.

تحليل البيانات مرتبطا ارتباط وثيقا بعلم الإحصاء  لذلك في تحليل البيانات الكمية كثيرا ما نسمع عن مصطلح المتغيرات، فيا ترى ما هي هذه المتغيرات وما هي أنواعها.


في هذه المقال سنتعرف على:

        1.       تعريف المتغيرات

        2.       أنواع المتغيرات الرئيسية

        3.       أنواع المتغيرات الفرعية

تعريف المتغيرات

قبل الدخول في تعريف المتغيرات لا بد من الإشارة إلى وجود نوعين من البيانات، البيانات الكمية والبيانات النوعية، فالبيانات الكمية هي عبارة عن أرقام ونسب ونصوص يمكن عدها او قياسها وهي مرتبة في جداول أو ضمن قواعد بيانات بينما البيانات النوعية هي عبارة عن نصوص طويلة لا يمكن قياسها أو عدها وإنما نستنتج منها أفكار وتفسيرات عميقة

بالسنبة للبيانات الكمية فالمتغيرات هي جزء من مصفوفة البيانات والمتغيرات ببساطة هي الأعمدة في جدول البيانات وهي تتميز بأنها تصف الحالة المدروسة ويمكن قياسها ويعبر عنها بقيمة أو نص فمثلا اذا كان لدينا مجموعة بيانات      لمجموعة من السيارات سيكون لدينا مثلا عمود (متغير) عن نوع الوقود و نعبر عنه بقيمة مثلا قد تكون ديزل أو بنزين  و متغير آخر عن سعر السيارة نعبر عنه بأرقام وهكذا.

الأنواع الرئيسية للمتغيرات

للمتغيرات في الإحصاء عدة تصنيفات منها تصنيفات رئيسية ومنها تصنيفات فرعية، بالنسبة للتصنيفات الرئيسة تقسم الى:

متغيرات تصنيفية -Categorical Variables

وهي متغيرات نصية تقيس خصائص وصفية مثل الجنس والمرحلة الدراسية والدولة التي ينتمي اليها شخص ما 

ولها نوعين فرعيين هما المتغير النصي الذي لا يحوي ترتيب نومينال Nominal , والمتغير النصي الذي يحتوي على ترتيب وهو اوردينال Ordınal

متغيرات كمية -Quantitative Variables

وهي متغيرات رقمية قد تكون منفصلة أو متصلة تعبر عن خصائص مثل طول شخص معين أو عمره، وهذا النوع أيضا له نوعين فرعيين هما انتيرفال Interval , و راشيو Ratio

الأنواع الفرعية للمتغيرات

الآن دعونا نتعرف بالتفصيل على أنواع وتصنيفات المتغيرات الفرعية

النوع الأول – نومينال Nominal

هو متغير تصنيفي كما ذكرنا سابقا مثال ذلك الجنس (ذكر أو أنثى) وكذلك زمرة الدم، العرق (عربي – فارسي- اوربي.. الخ) , هذا المتغير لا يعبر عن ترتيب معين أو أفضلية معينة , إّذ لا أفضلية لكون الشخص ذكر أو أنثى أو لكونه فارسي أو عربي أو هندي, يمكن في بعض الحالات وعند استخدام بعض برامج تحليل البيانات أن نقوم بتكويد الإجابات  كأرقام( أي ترميزها أو التعبير عنها بأرقام بدل من النصوص مثل ذكر =1, أنثى = 2), ولكن هنا يجب أن نتذكر أن المتغير من نوع نومينال Nominal ليس له معنى رقمي ( في حال تكم تكويده بأرقام فلامعني لإجراء عمليات حسابية عليه مثل المتوسط والوسيط... )

النوع الثاني- اوردينال Ordinal

متغير تصنيفي مثال ذلك مستوى الرضا (راضي جدا- راضي- محايد- غير راض- غير راضي أبدا) وكذلك مثال درجات الطلاب في الكلية أو الفصل الدراسي مثل ( ممتاز- جيد جدا- جيد- متوسط- ضعيف), وهذا المتغير يعبر عن ترتيب معين أي افضلية لقيمة على أخرى, فمثلا قيمة " ممتاز" لدرجات الطلاب تعبر عن أفضلية أو ترتيب وكذلك مستوى الرضا. عند تحليل البيانات من الممكن أن نحول قيم المتغير أو نعبر عنها بأرقام مثل (راضي جدا = 5, راضي = 4, محايد = 3, غير راضي =2, غير راضي أبدا =1).بعض الاحصائيين يرون أنه يمكن جراء عمليات حسابية و إحصائية على قيم المتغير مثل تقييم التطبيقات في غوغل بلاي



 النوع الثالث- انتيرفال Interval

متغير رقمي يعبر عن القياسات بالأرقام مثل درجة الحرارة ومثال ذلك أيضا رواتب الموظفين وعلامات الطلاب في الامتحان والارقام تعبر عن ترتيب معين فدرجة الحرارة 29 سلسيوس أعلى قيمة من درجة الحرارة 20 سلسيوس

هذا المتغير يمكن اجراء جميع العمليات الحسابية والإحصائية عليه، وعند القيمة صفر للمتغير هذا لا يعني أن المتغير غير موجود مثلا عند درجة الحرارة صفر تو جد درجة حرارة، ولكن قيمتها صفر كما قد تكون قيمتها سالبة أيضا

 النوع الرابع- راشيو Ratio

يملك جميع خواص Interval, بالإضافة إلى خاصية أخرى فريدة وهي أنه عندما تكون قيمة المتغير صفر فهذا يعني أن المتغير غير موجود أو لا معنى منطقي لوجوده مثال ذلك متغير طول الإنسان ( لا يمكن أن يكون طول الإنسان صفر ). وكذلك عمر الأنسان فلا معنى لذكر أن شخص عمره صفر (هذا الكلام عمليا لا معنى له) , بينما في حالة Interval عند درجة الحرارة صفر فالحرارة موجودة، ولكنها بدرجة صفر وقد تكون أقل من الصفر أيضا, هذا المتغير يمكن اجراء جميع العمليات الحسابية والإحصائية عليه أيضا


الخلاصة

تقسم المتغيرات الى متغيرات تصنيفية ( نصية ) ومتغيرات كمية ( رقمية), فالمتغيرات التصنيفية هي نومينال و أوردينال ويتميز أوردينال عن نومينال أنه يعبر أفضلية أو ترتيب معين, و المتغيرات الكمية الرقمية تقسم الى نوعين هما انتيرفال و راشيو  ويتميز راشيو عن انتيرفال بأنه لامعنى له عندما تكون قيمته صفرا.

قد نصادف أثناء بحثنا تصنيفات كثيرة للمتغيرات وخاصة تصنيف المتغيرات في البحث العلمي عند دراسة الانحدار أو الارتباط فنجد تعريف المتغير التابع والمتغير المستقل، ولكن هنا في هذا المقال سوف نركز على تعريف و تصنيف المتغيرات في مصفوفة لأن تصنيف المتغير كونه تابع أو مستقل هو يتبع لتصنيفه الأساسي في مصفوفة البيانات الذي ذكرناه سابقا

 في الإحصاء و علم البيانات و تحليل البيانات معرفة أنواع المتغيرات وتحديدها هي الخطوة الأولى لكل محلل بيانات لأن هذا يترتب عليه عمليات لاحقة مرتبطة بنوع المتغير مثل تنظيف البيانات فعندما أحدد أن سعر السيارة هو متغير كمي من نوع انتيرفال فهذا يستلزم أن تكون قيمة سعر السيارة رقما و لا يكون مقبولا أن نجدا نصا مثل كلمة(خمسة آلاف) أو مثلا كلمة( سعر مرتفع) في هذا المتغير لذلك نقوم بتنظيف البيانات على هذا الأساس ومن ثم نقوم بإجراء تحليل البيانات على البيانات النظيفة.

تعليقات