تحت الإشراف في تعلم الألة Machine Learning Supervised#

تحت الإشراف في تعلم الألة

Machine Learning Supervised#

تحت الإشراف في تعلم الألة Machine Learning Supervised#

يعد التعلم الخاضع للإشراف أحد النماذج الهامة للتعلم التي تشارك في آلات التدريب. يتحدث هذا الفصل بالتفصيل عن نفسه.

خوارزميات التعلم الخاضع للإشراف

هناك العديد من الخوارزميات المتاحة للتعلم الخاضع للإشراف. فيما يلي بعض الخوارزميات المستخدمة على نطاق واسع للتعليم الخاضع للإشراف

k-Nearest Neighbours خوارزمية الجار الأقرب
Decision Trees شجرة القرار
Naive Bayes
Logistic Regression الانحدار اللوجستي
Support Vector Machines الآلات فيكتور الداعمة.

ونحن نمضي قدمًا في هذا الفصل ، دعونا نناقش بالتفصيل حول كل من الخوارزميات.

ك أقرب الجيران

إن k-Nearest Neighours ، والتي تسمى ببساطة kNN ، هي تقنية إحصائية يمكن استخدامها لحل مشكلات التصنيف والانحدار. دعنا نناقش حالة تصنيف كائن غير معروف باستخدام kNN. النظر في توزيع الأشياء كما هو موضح في الصورة الواردة أدناه -

المصدر :

https://en.wikipedia.org/wiki/K-nearest_neighbors_algorithm

يعرض الرسم التخطيطي ثلاثة أنواع من الكائنات ، تم تمييزها بألوان الأحمر والأزرق والأخضر. عند تشغيل مصنف kNN على مجموعة البيانات أعلاه ، سيتم وضع علامة على حدود كل نوع من الكائنات كما هو موضح أدناه -

المصدر:

https://en.wikipedia.org/wiki/K-nearest_neighbors_algorithm

الآن ، ضع في اعتبارك كائنًا جديدًا غير معروف تريد تصنيفه على أنه أحمر أو أخضر أو أزرق. هذا هو مبين في الشكل أدناه.

كما ترى بصريًا ، تنتمي نقطة البيانات غير المعروفة إلى فئة من الكائنات الزرقاء. رياضيا ، يمكن الانتهاء من ذلك عن طريق قياس مسافة هذه النقطة غير المعروفة مع كل نقطة أخرى في مجموعة البيانات. عندما تفعل ذلك ، ستعرف أن معظم جيرانها من اللون الأزرق. سيكون متوسط المسافة إلى الكائنات الحمراء والخضراء بالتأكيد أكثر من متوسط المسافة إلى الكائنات الزرقاء. وبالتالي ، يمكن تصنيف هذا الكائن غير المعروف على أنه ينتمي إلى الطبقة الزرقاء.

يمكن أيضًا استخدام خوارزمية kNN لمشاكل الانحدار. تتوفر خوارزمية kNN على أنها جاهزة للاستخدام في معظم مكتبات ML.

أشجار القرار decision trees
يظهر أدناه شجرة قرار بسيطة بتنسيق مخطط انسيابي -

ستكتب رمزًا لتصنيف بيانات المدخلات الخاصة بك بناءً على هذا المخطط الانسيابي. المخطط الانسيابي توضيحي وتافه. في هذا السيناريو ، تحاول تصنيف بريد إلكتروني وارد لتحديد وقت قراءته.

في الواقع ، يمكن أن تكون أشجار القرار كبيرة ومعقدة. هناك العديد من الخوارزميات المتاحة لإنشاء هذه الأشجار واجتيازها. بصفتك متحمسًا للتعلم الآلي ، تحتاج إلى فهم وإتقان هذه التقنيات الخاصة بإنشاء أشجار القرار والعبور فيها.

Naive Bayes

يستخدم السذاجة بايز لإنشاء المصنفات. افترض أنك تريد فرز (تصنيف) ثمار من أنواع مختلفة من سلة فواكه. يمكنك استخدام ميزات مثل لون الفاكهة وحجمها وشكلها ، على سبيل المثال ، يمكن اعتبار أي فاكهة حمراء اللون ودائرية الشكل وقطرها حوالي 10 سم أبل. لتدريب النموذج ، يمكنك استخدام هذه الميزات واختبار احتمال تطابق ميزة معينة مع القيود المطلوبة. ثم يتم الجمع بين احتمالات ميزات مختلفة للوصول إلى احتمال أن الفاكهة المعطى هي أبل. يتطلب Naive Bayes عمومًا عددًا صغيرًا من بيانات التدريب للتصنيف.

الانحدار اللوجستي Logistic Regression

انظر إلى المخطط التالي. فإنه يدل على توزيع نقاط البيانات في الطائرة XY

من المخطط ، يمكننا أن نفحص بصريا فصل النقاط الحمراء عن النقاط الخضراء. يمكنك رسم خط حد لفصل هذه النقاط. الآن ، لتصنيف نقطة بيانات جديدة ، تحتاج فقط إلى تحديد أي جانب من السطر الذي تقرأه النقطة.

Support Vector Machines

انظر إلى التوزيع التالي للبيانات. هنا لا يمكن فصل فئات البيانات الثلاثة خطيًا. منحنيات الحدود غير خطية. في مثل هذه الحالة ، يصبح العثور على معادلة المنحنى مهمة معقدة.

المصدر: http://uc-r.github.io/svm

تأتي أدوات مكافحة ناقلات الدعم (SVM) في متناول اليد عند تحديد حدود الفصل في مثل هذه الحالات.

بحث هذه المدونة الإلكترونية

Arabic Knowledge blog مدونة المعرفة العربية