القائمة الرئيسية

الصفحات

مقارنة بين أهم البرامج المستخدمة في الإحصاء

 

عندما نتحدث عن تحليل البيانات فلابد لنا أن نتحدث عن الإحصاء كونه يشكل حجر الزاوية في تحليل البيانات, هناك مجموعة واسعة من البرامج الإحصائية ولغات البرمجة التي تستخدم في الإحصاء, يمكننا  القول أن SAS و SPSS و R و Python هي الأكثر استخدامًا. تعد SAS و SPSS مدفوعة وتحتاج للاشتراك بها للحصول على الخدة بينما R و Python هي لغات برمجة مجانية.

لأن R و Python مجاني ومفتوح المصدر ، فإنهما ينموان بسرعة. فالأمر لا يحتاج شراء هذه اللغات بالاضافة لذلك يوجد مجتمع كبير من المبرمجين الذين يعملون على تطوير هذه اللغات ، ويقوم المبرمجون باستمرار ببناء مكتبات جديدة أو تحسين المكتبات الحالية. ولكن للاسف لا تملك لغات البرمجة مثل R و Python واجهة مستخدم وبالتالي فالأشخاص الذين لا يملكون خبرة في البرمجة إطلاقا لا يمنكهم التعامل معها

الان سننتقل للتعرف على ميزات كل برنامج أو لغة

SAS



SAS تعني نظام التحليل الإحصائي Statistical Analysis System, أساسا هو برنامج يستخدم في العلوم الطبية ولكن لاحقا أصبح يستخدم في العديد من الصناعات, تم تطوير SAS في جامعة ولاية كارولينا الشمالية. تم إنشاءه كأداة لتحليل مجموعات البيانات الكبيرة من البيانات الزراعية. لا يعد برنامج SAS   زهيد الثمن وعلى الرغم من ذلك يتم شراءه نظرا لقدرته على التعامل مع البيانات كبيرة الحجم, والقطاعات الرئيسية لعمل هذا البرنامج هي الصناعات الدوائية والحكومات والخدمات المصرفية.

SPSS



SPSS تعني الحزمة الإحصائية للعلوم الاجتماعية. تم تطوير SPSS في عام 1968 في جامعة ستانفورد. تم شراء SPSS من قبل IBM في عام 2009. يستخدم SPSS كثيرًا في العلوم الاجتماعية ، مثل الاقتصاد وعلم النفس. يحظى بشعبية كبيرة بين طلبة الجامعات وخاصة طلاب الدراسات العليا مثل الماستر والدكتوراه, يعد SPSS سهل الاستخدام نسبيا حيث أن لديه واجهة مستخدم رسومية. يتعبر SPSS قويا في تحليل البيانات المجموعة من الاستبيانات الكمية.

قامت SPSS ببناء الاختبارات الإحصائية الأكثر شعبية ، مثل ANOVA والانحدارات الخطية. لذلك يعد حلا سهلا وسريعا  إذا كنت ترغب في إجراء اختبار إحصائي معين. من عيوب SPSS أنه غير فعال في التعامل مع البيانات الكبيرة أو البيانات التي يتم جمعها بشكل يومي.

Python


من هذه القائمة ، Python هي لغة البرمجة الوحيدة التي لم يتم إنشاؤها خصيصًا للإحصائيات. تم تطوير Python من قبل رجل أراد إنشاء لغة برمجة سهلة للأغراض العامة. نظرًا لأنها لغة برمجة سهلة فقد اكتسب Python الكثير من الشعبية في العديد من المجالات. حيث أنشأ المبرمجون الكثير من المكتبات لـ Python ، بما في ذلك بعضها يمكن استخدامها للإحصاءات ، مثل Pandas و Numpy و Matplotlib.  يمتلك Python ميزات إحصائية ممتازة في التنبؤ. يمكن Python التعامل مع مجموعات البيانات الكبيرة بسهولة

نظرًا لأنه يحتوي على مكتبات جيدة جدًا لمعالجة الصور ، واستخراج البيانات والتعلم الآلي ، فإن Python ينمو بسرعة ويتفوق على الأدوات الأخرى في هذه المجالات.

R



إنها لغة برمجة تم إنشاؤها خصيصًا للإحصاءات. تم إصدار النسخة الأولى من R في عام 2000 في جامعة أوكلاند. ، و هي لغة برمجة ممتازة في التنبؤ والجانب التوضيحي من الإحصاءات. إنه مجاني ولديه بيئة عمل جيدة وغنية, فمثلا يفضل كثير من الباحثين  GGPLOT2 لرسوماته ويدرسها الكثير من الأشخاص بشكل أفضل وأبسط من مكتبات Python المخصصة لذات الغرض. يمكن لـ R استيراد مجموعات البيانات من SAS و SPSS وغيرها. بالنسبة لمجموعات البيانات الكبيرة ، فإن Python أفضل من R.  و على العكس بالنسبة لبعض التحليلات الإحصائية المحددة  يمكن أن تتفوق R على Python. يمكن لـ R أيضًا الاتصال بمصادر بيانات أخرى ، مثل مجموعات بيانات SQL و NOSQL.

لماذا لا تستخدم الشركات الكبيرة Python أو R؟

- الإدارات دائما ما تكون مترددة في التبديل إلى أدوات مفتوحة المصدر ، لأن هناك مخاطر محتملة من استخدام الأدوات مفتوحة المصدر وخاصة فيما يتعلق بالأمان ، لذلك فالشركات الكبيرة تحب الحصول على دعم رسمي من الشركة صاحبة البرنامج.



 


 

 

تعليقات

تعليق واحد
إرسال تعليق

إرسال تعليق