Leveraging Glycemic Index and Machine Learning for Predictive Modeling of Type 2 Diabetes Onset and Management
Date
2025-01-12
Authors
Jihan Mousa Mohammed Rahhal
جيهان موسى محمد رحال
Journal Title
Journal ISSN
Volume Title
Publisher
Al-Quds University
Abstract
Type 2 Diabetes Mellitus is a multifaceted chronic disease influenced by a combination of sociodemographic, lifestyle, and nutritional factors. This study aimed to analyze the prevalence and determinants of diabetes in a diverse population while leveraging machine learning to enhance predictive modeling. Sociodemographic characteristics such as urban residency, lower education levels, aging, and female gender were significantly associated with higher diabetes prevalence. Lifestyle factors, including low physical activity (94.1% among diabetics) and obesity (75.3%), were prominent contributors. Nutritional analysis revealed a high prevalence of dietary deficiencies among diabetics, including low fiber and polyunsaturated fatty acid intake, along with excessive sodium consumption. These findings highlight the importance of addressing dietary quality and promoting physical activity as key components of diabetes prevention.
Machine learning models were employed to predict diabetes risk, with Gradient Boosting achieving the highest accuracy (94.2%) and AUC (0.985), outperforming other models such as Random Forest and Support Vector Machines. Feature importance analysis identified glycemic load, BMI, and age as the most significant predictors of diabetes, emphasizing the role of dietary glycemic measures, body composition, and aging in disease risk. The results reinforce the potential of machine learning as a tool for early diagnosis and risk stratification.
This study shows the need for integrated, multidisciplinary strategies to combat diabetes, including education, dietary interventions, and physical activity promotion. The findings provide a foundation for future research to validate these associations and develop targeted prevention programs. The application of machine learning demonstrates a promising avenue for personalized healthcare solutions in managing and reducing the burden of Type 2 diabetes.
مرض السكري من النوع 2 هو مرض مزمن متعدد الأوجه يتأثر بمجموعة من العوامل الاجتماعية والديموغرافية ونمط الحياة والتغذية. هدفت هذه الدراسة إلى تحليل انتشار ومحددات مرض السكري في مجموعة سكانية متنوعة مع الاستفادة من التعلم الآلي لتعزيز النمذجة التنبؤية. ارتبطت الخصائص الاجتماعية والديموغرافية مثل الإقامة في المناطق الحضرية ومستويات التعليم المنخفضة والشيخوخة والجنس الأنثوي بشكل كبير بارتفاع انتشار مرض السكري. كانت عوامل نمط الحياة، بما في ذلك انخفاض النشاط البدني (94.1٪ بين مرضى السكري) والسمنة (75.3٪)، من المساهمين البارزين. كشف التحليل الغذائي عن انتشار مرتفع لنقص النظام الغذائي بين مرضى السكري، بما في ذلك انخفاض تناول الألياف والأحماض الدهنية المتعددة غير المشبعة، إلى جانب الاستهلاك المفرط للصوديوم. تسلط هذه النتائج الضوء على أهمية معالجة جودة النظام الغذائي وتعزيز النشاط البدني كمكونات رئيسية للوقاية من مرض السكري. تم استخدام نماذج التعلم الآلي للتنبؤ بمخاطر الإصابة بمرض السكري، حيث حقق نموذج Gradient Boosting أعلى دقة بلغت 94.2% وأعلى قيمة AUC بلغت 0.985، متفوقًا على نماذج أخرى مثل Random Forest وSupport Vector Machines. وأظهرت تحليلات أهمية الميزات أن الحمل الجلايسيمي، ومؤشر كتلة الجسم (BMI)، والعمر هي أهم العوامل المؤثرة في التنبؤ بالإصابة بالسكري، مما يبرز أهمية التدابير الغذائية، وتكوين الجسم، وعملية الشيخوخة في خطر الإصابة بالمرض. تعزز هذه النتائج إمكانات التعلم الآلي كأداة للتشخيص المبكر وتحديد مستويات الخطورة. تظهر هذه الدراسة الحاجة إلى استراتيجيات متكاملة ومتعددة التخصصات لمكافحة مرض السكري، بما في ذلك التعليم والتدخلات الغذائية وتعزيز النشاط البدني. وتوفر النتائج أساسًا للبحوث المستقبلية للتحقق من صحة هذه الارتباطات وتطوير برامج الوقاية المستهدفة. ويوضح تطبيق التعلم الآلي طريقًا واعداً لحلول الرعاية الصحية الشخصية في إدارة وتقليل عبء مرض السكري من النوع 2.
مرض السكري من النوع 2 هو مرض مزمن متعدد الأوجه يتأثر بمجموعة من العوامل الاجتماعية والديموغرافية ونمط الحياة والتغذية. هدفت هذه الدراسة إلى تحليل انتشار ومحددات مرض السكري في مجموعة سكانية متنوعة مع الاستفادة من التعلم الآلي لتعزيز النمذجة التنبؤية. ارتبطت الخصائص الاجتماعية والديموغرافية مثل الإقامة في المناطق الحضرية ومستويات التعليم المنخفضة والشيخوخة والجنس الأنثوي بشكل كبير بارتفاع انتشار مرض السكري. كانت عوامل نمط الحياة، بما في ذلك انخفاض النشاط البدني (94.1٪ بين مرضى السكري) والسمنة (75.3٪)، من المساهمين البارزين. كشف التحليل الغذائي عن انتشار مرتفع لنقص النظام الغذائي بين مرضى السكري، بما في ذلك انخفاض تناول الألياف والأحماض الدهنية المتعددة غير المشبعة، إلى جانب الاستهلاك المفرط للصوديوم. تسلط هذه النتائج الضوء على أهمية معالجة جودة النظام الغذائي وتعزيز النشاط البدني كمكونات رئيسية للوقاية من مرض السكري. تم استخدام نماذج التعلم الآلي للتنبؤ بمخاطر الإصابة بمرض السكري، حيث حقق نموذج Gradient Boosting أعلى دقة بلغت 94.2% وأعلى قيمة AUC بلغت 0.985، متفوقًا على نماذج أخرى مثل Random Forest وSupport Vector Machines. وأظهرت تحليلات أهمية الميزات أن الحمل الجلايسيمي، ومؤشر كتلة الجسم (BMI)، والعمر هي أهم العوامل المؤثرة في التنبؤ بالإصابة بالسكري، مما يبرز أهمية التدابير الغذائية، وتكوين الجسم، وعملية الشيخوخة في خطر الإصابة بالمرض. تعزز هذه النتائج إمكانات التعلم الآلي كأداة للتشخيص المبكر وتحديد مستويات الخطورة. تظهر هذه الدراسة الحاجة إلى استراتيجيات متكاملة ومتعددة التخصصات لمكافحة مرض السكري، بما في ذلك التعليم والتدخلات الغذائية وتعزيز النشاط البدني. وتوفر النتائج أساسًا للبحوث المستقبلية للتحقق من صحة هذه الارتباطات وتطوير برامج الوقاية المستهدفة. ويوضح تطبيق التعلم الآلي طريقًا واعداً لحلول الرعاية الصحية الشخصية في إدارة وتقليل عبء مرض السكري من النوع 2.
Description
Keywords
Citation
Rahhal، Jihan Mousa. (2025). Leveraging Glycemic Index and Machine Learning for Predictive Modeling of Type 2 Diabetes Onset and Management [رسالة ماجستير منشورة، جامعة القدس، فلسطين]. المستودع الرقمي لجامعة القدس.