علم البيانات والاحصاء والذكاء الاصطناعي

علم البيانات والاحصاء والذكاء الاصطناعي

(Data Science &Statistics& Artificial intelligence)

     علم البيانات (Data Science) هو فن استعمال النظريات العلمية لاستخراج الأفكار والمعرفة من البيانات ويتضمن تحليل وصفي وتنبؤي والزامي، وتزايد الاهتمام بعلم البيانات في السنوات الاخيرة بشكل ملحوظ من قبل الشركات من جهة ومن قبل الافراد الراغبين بمعرفة وتعلم هذا العلم من جهة اخرى، اذ يركز بشكل اساسي على معرفة وفهم البيانات التي تمتلكها اي شركة او مؤسسة ومن ثم استخراج المعرفة منها، ويعتبر من أكثر المجالات شهرة في الوقت الحالي.

 واختلف  روّاد علم البيانات والذكاء الاصطناعي حول التعريف المناسب لهذا المصطلح ولكنهم يتفقون دون ادنى شك على انه علم قائم على المهارات الاحصائية  التي تستخدم في تحليل البيانات الخام وتحويلها الى معلومات مفيدة يمكن فهمها وتحليلها واستخلاص نتائج مفيدة منها ,بحيث يدخل مجال علم الاحصاء (statistics) مع علم البيانات (Data Science) في حل العديد من المشاكل التي نواجها في حياتنا اليومية   ومن اهمها (Anomaly Delectation ) والذي يقصد به تحديد العناصر النادرة او الاحداث او الملاحظات التي تثير الشكوك باختلافها بشكل كبير عن غالبية  البيانات ,بحيث يوجد العديد من الخوارزميات المستخدمة لها الغرض ومن اهمها خوارزمية الجار الاقرب (KNN)  والتي تعتبر من اهم خوارزميات التعلم الالي (Machine Learning) .

ويمكن من خلال المخطط ادناه توضيح العلاقة بين علم الاحصاء وعلم تعلم الالة مع علم البيانات

 

 

 

 ويتم من خلال علم البيانات تجميع وادارة ومعالجة واستخراج المعرفة من البيانات الضخمة (Big Data) التي يمكن الحصول عليها من أكثر من مصدر ولعل مواقع التواصل الاجتماعي بمختلقها هي أكبر المصادر للبيانات الضخمة والتي تكون أكثر المصادر الداعمة لها، كما ويعد علم البيانات مجالا متعدد التخصصات للدراسة اذ يتم استخدام النظريات والتقنيات من العديد من المجالات والتخصصات لمعالجة كميات كبيرة من البيانات وتحليها بهدف مواجهة التحديات في البيانات الضخمة (Big Data) ومنه هذه التخصصات:

  • هندسة وعلوم الحاسوب: والتي تتمثل بالتخزين والتصور والذكاء الاصطناعي ولغات البرمجة ونود ان نذكر بان أشهر لغات البرمجة المستخدمة في علم البيانات هي لغة (Python).
  • علوم الاحصاء: له دور فعال في علم البيانات ويرتبط ارتباط وثيق   ويتمثل باستعمال الاحتمالات والنمذجة الاحصائية وشجرة القرارات الاحصائية (Precision Trees) والانحدار (Regression) والتجميع (Clustering) والتصنيف (Classification).

 

لماذا الضجة حول علم البيانات

  • تضخم البيانات: في العامين الماضيين فقط تم توليد ٩٠% من بيانات العالم.
  • الزيادة المفرطة في الإمكانيات الحاسوبية: من الممكن تنفيذ نماذج التعلّم الآلي المعقدة على دوائر إلكترونية صغيرة.
  • إمكانيات التخزين والإمكانيات الحاسوبية التي يتم الوصول اليها بسهولة وبأسعار قليلة.

 

 

اما الذكاء الاصطناعي (Artificial intelligence)

   يشير الذكاء الاصطناعي (AI) إلى محاكاة الذكاء البشري في الآلات والحواسيب المبرمجة للتفكير مثل البشر وتقليد أفعالهم. يمكن أيضًا تطبيق المصطلح على أي آلة تعرض سمات مرتبطة بالعقل البشري مثل قابلية التعلم والقدرة على حل مشكلات جديدة

السمة المثالية للذكاء الاصطناعي هي قدرته على اتخاذ الإجراءات التي لديها أفضل فرصة لتحقيق هدف معين.

التعلم الآلي (Machine Learning)

     هو أحد أنواع الذكاء الاصطناعي (AI) ، الذي يسمح للتطبيقات البرمجية أن تصبح أكثر دقةً في تنبؤ النتائج دون القيام ببرمجتها بشكلٍ صريحٍ ، ويمكننا بناء آلات لمعالجة البيانات والتعلم من تلقاء أنفسنا دون الإشراف المستمر, وهو أسلوب تحليلي متعلق بالذكاء الاصطناعي ،والتكنولوجيا لتعلم معايير الانتظام والحكم من البيانات ، والتنبؤ بالحكم على أشياء مجهولة مبنية عليه ، في بدايات الأبحاث للتعلم الآلي ، تم إيلاء الاهتمام إلى نقطة "التعلم" ، ولكن في الوقت الحاضر ، ينصب الاهتمام على "التنبؤ والحكم على أساس التعلم.

التعلم العميق (Deep Learning)

   يمثل اسلوب واحد في تعلم الآلة، وطريقة تمد الطريق التحليلي المسمى بالشبكة العصبية neural network، وهي ايضاً طريقة تعلم آلية أكثر أساسية وواسعة، وتمكن من التحليل والاستعمال عالي الدقة لم ا رجعة البيانات والاستنتاج منها.

 

 

أشهر المجالات التي يدخل علم البيانات فيها هي الطب التنبؤي