نوع المستند : البحوث والدراسات والمقالات المستوفاة للقواعد العلمية المتعارف عليها، والتى يجريها أو يشارک فى إجرائها أعضاء هيئة التدريس والباحثون فى الجامعات ومراکز البحوث المصرية والعربية، وذلک باللغتين العربية والإنجليزية .
المؤلف
Faculty of Education, Curriculums and Teaching Department, Umm Al-Qura University, Makkah, Saudi Arabia amammari@uqu.edu.sa
المستخلص
Abstract
This research explores the application of machine learning in predicting student academic outcomes, analyzing data from 236 students enrolled at a Saudi university from 2021-2024. The comprehensive dataset encompassed multiple variables, including gender, academic history (previous GPA), assessment performance (quizzes, midterms, assignments, and final exams), engagement metrics (course hours), and attendance patterns. The study evaluated multiple machine learning approaches, comparing the effectiveness of Random Forest (RF), Support Vector Machines (SVM), Logistic Regression, and k-nearest Neighbors (kNN). Gradient Boosting demonstrated superior performance through tenfold cross-validation, achieving an AUC score of 0.987. While Random Forest and kNN also yielded strong results, Logistic Regression and SVM showed comparatively lower predictive accuracy. Feature importance analysis revealed that assignment performance and final examination scores were the most significant predictors of academic success. These findings provide educators with actionable insights to develop targeted interventions and optimize learning environments for enhanced student achievement according to the evidence shown in this study serving higher education institutions.
Keywords: Machine Learning Approaches, Student Success Prediction, Higher Education.
يستكشف هذا البحث تطبيق تعلم الآلة في التنبؤ بالنتائج الأكاديمية للطلاب، وذلك من خلال التطبيق على حزمة بيانات 236 طالبًا مسجلين في إحدى الجامعات السعودية خلال الفترة من 2021 إلى 2024. شملت حزمة البيانات المتكاملة العديد من المتغيرات، بما في ذلك الجنس، والسجل الأكاديمي (المعدل التراكمي السابق)، وأداءات التقييمات (الاختبارات القصيرة، والامتحانات النصفية، والواجبات، والامتحانات النهائية)، ومؤشرات التفاعل (ساعات الدراسة)، وأنماط الحضور. قام البحث بتقييم عدة نماذج من تقنيات تعلم الآلة، ومقارنة مدى فاعلية كل من الغابة العشوائية (Random Forest - RF) ، وآلات المتجهات الداعمة (Support Vector Machines – SVM)، والانحدار اللوجستي، وأقرب الجيران k-Nearest Neighbors -(kNN). وقد أظهر نموذج التعزيز التدريجي (Gradient Boosting) أداءً متفوقًا من خلال التحقق المتقاطع المكون من عشر طيات، حيث حقق درجة AUC بلغت 0.987. بينما قدمت نماذج الغابة العشوائية (RF) وأقرب الجيران (kNN) نتائج قوية أيضًا، كما سجل كل من الانحدار اللوجستي وآلات المتجهات الداعمة دقة تنبؤية أقل نسبيًا. كشفت تحليلات أهمية الميزات أن أداء الطلاب في الواجبات ودرجات الامتحانات النهائية كانا أهم العوامل المؤثرة في النجاح الأكاديمي. تقدم هذه النتائج رؤى عملية للمؤسسات التعليمية، مما يمكنها من تطوير تدخلات مستهدفة وتحسين بيئات التعلم بتقنيات تعلم الآلة لتعزيز التنبؤ بأداء الطلاب الأكاديمي ورفع معدلات نجاحهم.
الكلمات المفتاحية: نماذج تعلم الآلة, التنبؤ بنجاح الطلاب, التعليم الآلي.