A Hybrid Artificial Intelligence Approach for Early Detection of Breast Cancer and Classification from Mammogram Images in Palestine
Date
2024-05-26
Authors
Omar Faiq Sadeq Daraghmeh
عمر فايق صادق دراغمه
Journal Title
Journal ISSN
Volume Title
Publisher
Al-Quds University
Abstract
Breast cancer is a significant global health concern, especially in Palestine, and early and accurate diagnosis is crucial for improving patient outcomes and survival rates. However, despite advancements in medical technology and screening techniques, missed diagnoses remain a persistent challenge in breast cancer detection. This study investigates the use of hybrid artificial intelligence (AI) models that combine deep learning and machine learning techniques to predict benign and malignant breast cancer from mammogram images. The study starts by utilizing pre-trained convolutional neural network models, namely VGG16 and DenseNet121, for feature extraction from mammogram images. These deep learning models have been trained on large datasets and have learned to identify various patterns and features within images. By extracting these features from mammograms, the models can capture important information that is relevant to the classification of breast cancer. The extracted features are then used to train several machine learning classifiers, including logistic regression, support vector machines, random forests, and gradient boosting models. These classifiers learn to recognize patterns and make predictions based on the extracted features.
To evaluate the performance of the hybrid AI models, the study is conducted in three stages. In the first stage, the original mammogram images are used for classification. In the second stage, the mammogram images are enhanced using various image preprocessing and enhancement techniques. Finally, in the third stage, the models are tested on new mammogram images to assess their generalization capabilities. To enhance the mammogram images, several image processing techniques are applied. These include morphological erosion preprocessing, Contrast-Limited Adaptive Histogram Equalization
(CLAHE), Laplacian of Gaussian (LoG) edge enhancement, and unsharp masking. These techniques aim to improve the visibility of important structures and features within the images, making it easier for the AI models to make accurate predictions.
In the second stage, when predicting benign cases from the enhanced mammogram images, the logistic regression classifier with DenseNet121 features achieves remarkable performance. It achieves the highest accuracy of 0.991, precision of 0.996, F1-score of 0.989, and an AUC of 0.999. The support vector machine with DenseNet121 features also performs well, with an accuracy of 0.986 and an AUC of 0.999. The logistic regression model with VGG16 features demonstrates the fastest predictive time, requiring only 0.13 seconds. Similarly, in predicting malignant cases from the enhanced images, the logistic regression classifier with DenseNet121 features excels with the highest accuracy of 0.995, precision of 0.995, recall of 0.995, F1-score of 0.995, and an AUC of 0.999. The support vector machine with DenseNet121 features follows closely with an accuracy of 0.992 and an AUC of 0.998. The logistic regression model with VGG16 features maintains its fast predictive time, taking only 0.08 seconds. The study demonstrates that the enhanced mammogram images in the second stage consistently outperform the original and new test images in the first and third stages, respectively. This emphasizes the significant impact of image preprocessing and enhancement techniques on the predictive capabilities of the hybrid AI models. The findings highlight the potential of combining deep learning for feature extraction and machine learning for classification in achieving high accuracy, precision, recall, F1-scores, and AUC values for predicting breast cancer malignancy from mammogram images.
In conclusion, the study demonstrates the potential of hybrid AI models that combine deep learning and machine learning techniques for the prediction of benign and malignant breast cancer from mammogram images. The integration of deep learning for feature extraction and machine learning for classification, along with image preprocessing and enhancement, results in improved accuracy and performance. These advancements have the potential to enhance breast cancer detection, ultimately leading to better patient outcomes and survival rates.
يعد سرطان الثدي مصدر قلق صحي عالمي كبير، والتشخيص المبكر والدقيق أمر بالغ الأهمية لتحسين نتائج المرضى ومعدلات البقاء على قيد الحياة. ومع ذلك، على الرغم من التقدم في التكنولوجيا الطبية وتقنيات الفحص، لا يزال خطأ التشخيص يمثل تحديًا مستمرًا في الكشف عن سرطان الثدي. تبحث هذه الدراسة في استخدام نماذج الذكاء الاصطناعي الهجين (AI) التي تجمع بين تقنيات التعلم العميق والتعلم الآلي للتنبؤ بسرطان الثدي الحميد والخبيث من صور الثدي بالأشعة السينية. تبدأ الدراسة باستخدام نماذج الشبكة العصبية التلافيفية المدربة مسبقًا، وهي VGG16 وDenseNet121، لاستخراج الميزات من صور تصوير الثدي بالأشعة السينية. تم تدريب نماذج التعلم العميق هذه على مجموعات بيانات كبيرة وتعلمت كيفية تحديد الأنماط والميزات المختلفة داخل الصور. ومن خلال استخراج هذه الميزات من تصوير الثدي بالأشعة السينية، يمكن للنماذج التقاط معلومات مهمة ذات صلة بتصنيف سرطان الثدي. يتم بعد ذلك استخدام الميزات المستخرجة لتدريب العديد من مصنفات التعلم الآلي، بما في ذلك الانحدار اللوجستي، وآلات ناقلات الدعم، والغابات العشوائية، ونماذج تعزيز التدرج. تتعلم هذه المصنفات التعرف على الأنماط وإجراء التنبؤات بناءً على الميزات المستخرجة. لتقييم أداء نماذج الذكاء الاصطناعي الهجين، تم إجراء الدراسة على ثلاث مراحل. في المرحلة الأولى، يتم استخدام صور أشعة الثدي الأصلية للتصنيف. في المرحلة الثانية، يتم تحسين صور أشعة الثدي باستخدام تقنيات المعالجة المسبقة المختلفة للصور وتحسينها. وأخيراً، في المرحلة الثالثة، يتم اختبار النماذج على صور اشعة الثدي جديدة لتقييم قدراتها على التعميم. لتحسين صور أشعة الثدي، يتم تطبيق العديد من تقنيات معالجة الصور. وتشمل هذه المعالجة المسبقة للتآكل المورفولوجي، ومعادلة الرسم البياني التكيفي المحدود التباين (CLAHE)، وتحسين حافة Laplacian of Gaussian (LoG)، والإخفاء غير الواضح. تهدف هذه التقنيات إلى تحسين رؤية الهياكل والميزات المهمة داخل الصور، مما يسهل على نماذج الذكاء الاصطناعي إجراء تنبؤات دقيقة. وفي المرحلة الثانية، عند التنبؤ بالحالات الحميدة من خلال صور أشعة الثدي المحسنة، يحقق مصنف الانحدار اللوجستي المزود بميزات DenseNet121 أداءً رائعًا. إنها تحقق أعلى دقة تبلغ 0.991، ودقة تبلغ 0.996، ودرجة F1 تبلغ 0.989، وAUC تبلغ 0.999. تعمل أيضًا آلة ناقل الدعم المزودة بميزات DenseNet121 بشكل جيد، بدقة تبلغ 0.986 وAUC تبلغ 0.999. يوضح نموذج الانحدار اللوجستي مع ميزات VGG16 أسرع وقت تنبؤي، ويتطلب 0.13 ثانية فقط. وبالمثل، في التنبؤ بالحالات الخبيثة من الصور المحسنة، يتفوق مصنف الانحدار اللوجستي مع ميزات DenseNet121 بأعلى دقة تبلغ 0.995، ودقة تبلغ 0.995، واستدعاء 0.995، ودرجة F1 تبلغ 0.995، وAUC تبلغ 0.999. تتبع آلة ناقل الدعم المزودة بميزات DenseNet121 بدقة تبلغ 0.992 وAUC تبلغ 0.998. يحافظ نموذج الانحدار اللوجستي مع ميزات VGG16 على وقت تنبؤي سريع، حيث يستغرق 0.08 ثانية فقط. وتوضح الدراسة أن صور التصوير الشعاعي للثدي المحسنة في المرحلة الثانية تتفوق باستمرار على صور الاختبار الأصلية والجديدة في المرحلتين الأولى والثالثة، على التوالي. وهذا يؤكد على التأثير الكبير لتقنيات المعالجة المسبقة للصور وتحسينها على القدرات التنبؤية لنماذج الذكاء الاصطناعي الهجين. تسلط النتائج الضوء على إمكانية الجمع بين التعلم العميق لاستخراج الميزات والتعلم الآلي للتصنيف في تحقيق دقة عالية ودقة واسترجاع ودرجات F1 وقيم المساحة تحت المنحنى للتنبؤ بسرطان الثدي الخبيث من صور تصوير الثدي بالأشعة السينية. في الختام، توضح الدراسة إمكانات نماذج الذكاء الاصطناعي الهجين التي تجمع بين تقنيات التعلم العميق والتعلم الآلي للتنبؤ بسرطان الثدي الحميد والخبيث من صور الثدي بالأشعة السينية. يؤدي دمج التعلم العميق لاستخراج الميزات والتعلم الآلي للتصنيف، إلى جانب المعالجة المسبقة للصور وتحسينها، إلى تحسين الدقة والأداء. هذه التطورات لديها القدرة على تعزيز الكشف عن سرطان الثدي، مما يؤدي في النهاية إلى نتائج أفضل للمرضى ومعدلات البقاء على قيد الحياة.
يعد سرطان الثدي مصدر قلق صحي عالمي كبير، والتشخيص المبكر والدقيق أمر بالغ الأهمية لتحسين نتائج المرضى ومعدلات البقاء على قيد الحياة. ومع ذلك، على الرغم من التقدم في التكنولوجيا الطبية وتقنيات الفحص، لا يزال خطأ التشخيص يمثل تحديًا مستمرًا في الكشف عن سرطان الثدي. تبحث هذه الدراسة في استخدام نماذج الذكاء الاصطناعي الهجين (AI) التي تجمع بين تقنيات التعلم العميق والتعلم الآلي للتنبؤ بسرطان الثدي الحميد والخبيث من صور الثدي بالأشعة السينية. تبدأ الدراسة باستخدام نماذج الشبكة العصبية التلافيفية المدربة مسبقًا، وهي VGG16 وDenseNet121، لاستخراج الميزات من صور تصوير الثدي بالأشعة السينية. تم تدريب نماذج التعلم العميق هذه على مجموعات بيانات كبيرة وتعلمت كيفية تحديد الأنماط والميزات المختلفة داخل الصور. ومن خلال استخراج هذه الميزات من تصوير الثدي بالأشعة السينية، يمكن للنماذج التقاط معلومات مهمة ذات صلة بتصنيف سرطان الثدي. يتم بعد ذلك استخدام الميزات المستخرجة لتدريب العديد من مصنفات التعلم الآلي، بما في ذلك الانحدار اللوجستي، وآلات ناقلات الدعم، والغابات العشوائية، ونماذج تعزيز التدرج. تتعلم هذه المصنفات التعرف على الأنماط وإجراء التنبؤات بناءً على الميزات المستخرجة. لتقييم أداء نماذج الذكاء الاصطناعي الهجين، تم إجراء الدراسة على ثلاث مراحل. في المرحلة الأولى، يتم استخدام صور أشعة الثدي الأصلية للتصنيف. في المرحلة الثانية، يتم تحسين صور أشعة الثدي باستخدام تقنيات المعالجة المسبقة المختلفة للصور وتحسينها. وأخيراً، في المرحلة الثالثة، يتم اختبار النماذج على صور اشعة الثدي جديدة لتقييم قدراتها على التعميم. لتحسين صور أشعة الثدي، يتم تطبيق العديد من تقنيات معالجة الصور. وتشمل هذه المعالجة المسبقة للتآكل المورفولوجي، ومعادلة الرسم البياني التكيفي المحدود التباين (CLAHE)، وتحسين حافة Laplacian of Gaussian (LoG)، والإخفاء غير الواضح. تهدف هذه التقنيات إلى تحسين رؤية الهياكل والميزات المهمة داخل الصور، مما يسهل على نماذج الذكاء الاصطناعي إجراء تنبؤات دقيقة. وفي المرحلة الثانية، عند التنبؤ بالحالات الحميدة من خلال صور أشعة الثدي المحسنة، يحقق مصنف الانحدار اللوجستي المزود بميزات DenseNet121 أداءً رائعًا. إنها تحقق أعلى دقة تبلغ 0.991، ودقة تبلغ 0.996، ودرجة F1 تبلغ 0.989، وAUC تبلغ 0.999. تعمل أيضًا آلة ناقل الدعم المزودة بميزات DenseNet121 بشكل جيد، بدقة تبلغ 0.986 وAUC تبلغ 0.999. يوضح نموذج الانحدار اللوجستي مع ميزات VGG16 أسرع وقت تنبؤي، ويتطلب 0.13 ثانية فقط. وبالمثل، في التنبؤ بالحالات الخبيثة من الصور المحسنة، يتفوق مصنف الانحدار اللوجستي مع ميزات DenseNet121 بأعلى دقة تبلغ 0.995، ودقة تبلغ 0.995، واستدعاء 0.995، ودرجة F1 تبلغ 0.995، وAUC تبلغ 0.999. تتبع آلة ناقل الدعم المزودة بميزات DenseNet121 بدقة تبلغ 0.992 وAUC تبلغ 0.998. يحافظ نموذج الانحدار اللوجستي مع ميزات VGG16 على وقت تنبؤي سريع، حيث يستغرق 0.08 ثانية فقط. وتوضح الدراسة أن صور التصوير الشعاعي للثدي المحسنة في المرحلة الثانية تتفوق باستمرار على صور الاختبار الأصلية والجديدة في المرحلتين الأولى والثالثة، على التوالي. وهذا يؤكد على التأثير الكبير لتقنيات المعالجة المسبقة للصور وتحسينها على القدرات التنبؤية لنماذج الذكاء الاصطناعي الهجين. تسلط النتائج الضوء على إمكانية الجمع بين التعلم العميق لاستخراج الميزات والتعلم الآلي للتصنيف في تحقيق دقة عالية ودقة واسترجاع ودرجات F1 وقيم المساحة تحت المنحنى للتنبؤ بسرطان الثدي الخبيث من صور تصوير الثدي بالأشعة السينية. في الختام، توضح الدراسة إمكانات نماذج الذكاء الاصطناعي الهجين التي تجمع بين تقنيات التعلم العميق والتعلم الآلي للتنبؤ بسرطان الثدي الحميد والخبيث من صور الثدي بالأشعة السينية. يؤدي دمج التعلم العميق لاستخراج الميزات والتعلم الآلي للتصنيف، إلى جانب المعالجة المسبقة للصور وتحسينها، إلى تحسين الدقة والأداء. هذه التطورات لديها القدرة على تعزيز الكشف عن سرطان الثدي، مما يؤدي في النهاية إلى نتائج أفضل للمرضى ومعدلات البقاء على قيد الحياة.