علم البيانات الرشيقة - دور التنبؤات Agile Data Science - Role Of Predictions

 علم البيانات الرشيقة - دور التنبؤات Agile Data Science - Role Of Predictions

علم البيانات الرشيقة - دور التنبؤات Agile Data Science - Role Of Predictions

علم البيانات الرشيقة - دور التنبؤات

علم البيانات الرشيقة - دور التنبؤات Agile Data Science - Role Of Predictions


عند إجراء التنبؤات ، نأخذ ما نعرفه عن الماضي ونستخدمه لاستنتاج ما سيحدث في المستقبل. عند القيام بذلك ، ننتقل من المعالجة المجمعة للبيانات التاريخية إلى الاستقراء في الوقت الفعلي حول المستقبل. من حيث القيمة الحقيقية ، تتمثل مهمتنا في هذا الفصل في أخذ سجلات الرحلات الجوية التاريخية واستخدامها للتنبؤ بالأشياء المتعلقة بالرحلات المستقبلية.

تتوفر أمثلة التعليمات البرمجية لهذا الفصل على دور التنبؤ

 https://github.com/rjurney/Agile_Data_Code_2.git

دور التنبؤات

كلنا معتادون على التنبؤات في الحياة. تستند بعض التوقعات إلى الاستدلال الإحصائي ، والبعض الآخر مجرد آراء الخبراء. يشارك الاستدلال الإحصائي بشكل متزايد في التنبؤات بجميع أنواعها. من التنبؤات الجوية إلى خبراء التأمين الذين يحددون الأسعار إلى نقطة انتشار المراهنات الرياضية أو الاحتمالات في البوكر ، تعد التنبؤات الإحصائية جزءًا من الحياة الحديثة. في بعض الأحيان تكون التوقعات دقيقة ، وفي بعض الأحيان تكون غير دقيقة.

على سبيل المثال  رفض النقاد مرارًا وتكرارًا ترشيح دونالد ترامب للرئاسة باعتباره مزحة ، حتى مع نجاحه في التقدم ...

في هذا الفصل ، سنكسب المزيد من المعلومات حول دور 

التنبؤات في علم البيانات السريع. تعرض التقارير التفاعلية جوانب مختلفة من البيانات. تشكل التنبؤات الطبقة الرابعة من العدو السريع.

الطبقة الرابعة

عند إجراء التنبؤات ، نشير دائمًا إلى البيانات السابقة ونستخدمها كاستنتاجات للتكرار في المستقبل. في هذه العملية الكاملة ، نقوم بنقل البيانات من المعالجة المجمعة للبيانات التاريخية إلى البيانات في الوقت الحقيقي حول المستقبل.

يشمل دور التنبؤات ما يلي -

  • التنبؤات تساعد في التنبؤ. تستند بعض التوقعات على الاستدلال الإحصائي. تستند بعض التنبؤات على آراء الخبراء.

  • يشارك الاستدلال الإحصائي في التنبؤات بجميع أنواعها.

  • في بعض الأحيان تكون التوقعات دقيقة ، بينما تكون التوقعات في بعض الأحيان غير دقيقة.

التحليلات التنبؤية

تتضمن التحليلات التنبؤية مجموعة متنوعة من التقنيات الإحصائية من النمذجة التنبؤية والتعلم الآلي واستخراج البيانات التي تحلل الحقائق الحالية والتاريخية لعمل تنبؤات حول الأحداث المستقبلية وغير المعروفة.

تتطلب التحليلات التنبؤية بيانات التدريب. تتضمن البيانات المدربة ميزات مستقلة ومعتمدة. الميزات التابعة هي القيم التي يحاول المستخدم توقعها. الميزات المستقلة هي ميزات تصف الأشياء التي نريد توقعها بناءً على الميزات التابعة.

دراسة الميزات يسمى هندسة الميزات ؛ هذا أمر بالغ الأهمية لعمل التنبؤات. يعد تصور البيانات وتحليل البيانات الاستكشافية جزءًا من هندسة الميزات ؛ هذه تشكل جوهر علم البيانات Agile .

هندسة الخصائص

يتنبأ

هناك طريقتان لإجراء التنبؤات في علم البيانات السريع -

  • تراجع

  • تصنيف

يعتمد بناء الانحدار أو التصنيف كليًا على متطلبات العمل وتحليله. يؤدي التنبؤ بالمتغير المستمر إلى نموذج الانحدار والتنبؤ بالمتغيرات الفئوية يؤدي إلى نموذج التصنيف.

تراجع

يأخذ الانحدار في الاعتبار الأمثلة التي تشتمل على الميزات وبالتالي ينتج عنها مخرجات رقمية.

تصنيف

يأخذ التصنيف المدخلات وينتج تصنيفًا قاطعًا.

ملاحظة - يُطلق على مجموعة البيانات النموذجية التي تحدد الإدخال إلى التنبؤ الإحصائي والتي تمكن الجهاز من التعلم اسم "بيانات التدريب".