A Systematic Comparative Evaluation of Classical Machine Learning Algorithms for Liver Lesion Classification in Ultrasound Imaging
Date
2026-01-14
Authors
Aesha Loay Ebrahim Enairat
عائشه لؤي ابراهيم انعيرات
Journal Title
Journal ISSN
Volume Title
Publisher
Al- Quds University
Abstract
Liver ultrasound is very popular as it is accessible, safe and inexpensive, but the distinction between benign and malignant liver lesions is still difficult to make, owing to the noise, low contrast, and the overlap of the lesions. The thesis is an evaluation of the performance and generalization of classical machine learning techniques in liver lesion classification with ultrasound images in 3 binary tasks, where one of them is benign-normal, another one is malignant-normal, and the last one is benign-malignant.
We merged a localized clinical dataset with a publicly available dataset in Zenodo, which created an original set of 6,791 ultrasound images. By eliminating the duplicate and very similar images to avoid redundancy we were left with a curated set of unique images numbered 2,387. We compared the default preprocessing with contrast enhancement with Contrast Limited Adaptive Histogram Equalization (CLAHE) and tested various traditional classifiers, including ensemble model, support vector machines, linear model, instance-based model as well as probabilistic models. Stratified cross-validation, independent testing and a fully isolated holdout set were used in the evaluation of model performance.
The best and consistent performance of the ensemble-based classifiers was observed especially when it came to malignant- normal and benign- normal classification. Conversely, benign-malignant classification was the hardest to carry out because the lesion types had large visual overlaps. The use of CLAHE resulted in better sensitivity and lesion separability of a number of models, and task-specific advantages.
On the whole, the findings suggest that classical machine learning pipelines with the proper support of preprocessing and strict validation may be effective in terms of assisting the classification of ultrasound-based liver lesions and may serve as the basis of further advancement.
يُعدّ التصوير بالموجات فوق الصوتية للكبد من أكثر وسائل التصوير شيوعاً نظراً لتوفره وسلامته وانخفاض تكلفته، إلا أن التمييز بين الآفات الكبدية الحميدة والخبيثة لا يزال يمثل تحدياً بسبب الضجيج، وضعف التباين، والتداخل الكبير في الخصائص البصرية بين أنواع الآفات. تهدف هذه الرسالة إلى تقييم أداء وقدرة التعميم لتقنيات التعلم الآلي التقليدية في تصنيف آفات الكبد اعتماداً على صور الموجات فوق الصوتية ضمن ثلاث مهام تصنيف ثنائية ذات أهمية سريرية: (الحميد مقابل الطبيعي)، (الخبيث مقابل الطبيعي)، و(الحميد مقابل الخبيث). تم دمج مجموعة بيانات سريرية محلية مع مجموعة بيانات عامة متاحة على منصة Zenodo، مما أسفر عن مجموعة أولية تضم 6,791 صورة موجات فوق صوتية. ولتقليل التكرار وضمان نزاهة البيانات، تم حذف الصور المكررة والمتشابهة بدرجة عالية، ليصبح عدد الصور الفريدة في المجموعة المنقّحة 2,387 صورة. كما تمت مقارنة المعالجة المسبقة الافتراضية مع تحسين التباين باستخدام تقنية المعادلة التكيفية للمدرج التكراري محدودة التباين (CLAHE)، وتم اختبار مجموعة من المصنفات التقليدية، بما في ذلك نماذج التجميع (Ensemble)، وآلات متجه الدعم، والنماذج الخطية، والمصنفات المعتمدة على الجوار، والنماذج الاحتمالية. وقد تم تقييم أداء النماذج باستخدام التحقق المتقاطع الطبقي، والاختبار المستقل، ومجموعة تحقق معزولة بالكامل (Holdout) لضمان تقييم أكثر دقة لقابلية التعميم. أظهرت النتائج أن المصنفات المعتمدة على التجميع قدّمت أداءً أكثر ثباتاً وتفوقاً، لا سيما في مهمتي تصنيف (الخبيث مقابل الطبيعي) و(الحميد مقابل الطبيعي). في المقابل، كانت مهمة (الحميد مقابل الخبيث) الأكثر صعوبة بسبب التشابه البصري الكبير بين نوعي الآفات. كما ساهمت تقنية CLAHE في تحسين الحساسية وزيادة قابلية الفصل بين الآفات في عدد من النماذج، مع اختلاف الفائدة وفقاً لطبيعة المهمة التصنيفية. بصورة عامة، تشير النتائج إلى أن خطوط المعالجة القائمة على التعلم الآلي التقليدي، عند دعمها بمعالجة مسبقة مناسبة وتحقق صارم، قد تكون فعّالة في دعم تصنيف آفات الكبد باستخدام صور الموجات فوق الصوتية، كما يمكن أن تشكل أساساً لأعمال مستقبلية تهدف إلى تطوير وتحسين هذه المنهجيات
يُعدّ التصوير بالموجات فوق الصوتية للكبد من أكثر وسائل التصوير شيوعاً نظراً لتوفره وسلامته وانخفاض تكلفته، إلا أن التمييز بين الآفات الكبدية الحميدة والخبيثة لا يزال يمثل تحدياً بسبب الضجيج، وضعف التباين، والتداخل الكبير في الخصائص البصرية بين أنواع الآفات. تهدف هذه الرسالة إلى تقييم أداء وقدرة التعميم لتقنيات التعلم الآلي التقليدية في تصنيف آفات الكبد اعتماداً على صور الموجات فوق الصوتية ضمن ثلاث مهام تصنيف ثنائية ذات أهمية سريرية: (الحميد مقابل الطبيعي)، (الخبيث مقابل الطبيعي)، و(الحميد مقابل الخبيث). تم دمج مجموعة بيانات سريرية محلية مع مجموعة بيانات عامة متاحة على منصة Zenodo، مما أسفر عن مجموعة أولية تضم 6,791 صورة موجات فوق صوتية. ولتقليل التكرار وضمان نزاهة البيانات، تم حذف الصور المكررة والمتشابهة بدرجة عالية، ليصبح عدد الصور الفريدة في المجموعة المنقّحة 2,387 صورة. كما تمت مقارنة المعالجة المسبقة الافتراضية مع تحسين التباين باستخدام تقنية المعادلة التكيفية للمدرج التكراري محدودة التباين (CLAHE)، وتم اختبار مجموعة من المصنفات التقليدية، بما في ذلك نماذج التجميع (Ensemble)، وآلات متجه الدعم، والنماذج الخطية، والمصنفات المعتمدة على الجوار، والنماذج الاحتمالية. وقد تم تقييم أداء النماذج باستخدام التحقق المتقاطع الطبقي، والاختبار المستقل، ومجموعة تحقق معزولة بالكامل (Holdout) لضمان تقييم أكثر دقة لقابلية التعميم. أظهرت النتائج أن المصنفات المعتمدة على التجميع قدّمت أداءً أكثر ثباتاً وتفوقاً، لا سيما في مهمتي تصنيف (الخبيث مقابل الطبيعي) و(الحميد مقابل الطبيعي). في المقابل، كانت مهمة (الحميد مقابل الخبيث) الأكثر صعوبة بسبب التشابه البصري الكبير بين نوعي الآفات. كما ساهمت تقنية CLAHE في تحسين الحساسية وزيادة قابلية الفصل بين الآفات في عدد من النماذج، مع اختلاف الفائدة وفقاً لطبيعة المهمة التصنيفية. بصورة عامة، تشير النتائج إلى أن خطوط المعالجة القائمة على التعلم الآلي التقليدي، عند دعمها بمعالجة مسبقة مناسبة وتحقق صارم، قد تكون فعّالة في دعم تصنيف آفات الكبد باستخدام صور الموجات فوق الصوتية، كما يمكن أن تشكل أساساً لأعمال مستقبلية تهدف إلى تطوير وتحسين هذه المنهجيات