Cross-Modality Transfer Learning for Reliable Lung Cancer Nodule Classification in Low-Dose CT

dc.contributor.authorSara Rasheed Saleh Asfouren
dc.contributor.authorسارة عصفورar
dc.date.accessioned2026-06-07T09:39:46Z
dc.date.available2026-06-07T09:39:46Z
dc.date.issued2026-01-08
dc.description.abstractLung cancer is the leading cause of cancer-related mortality worldwide and remains a major health burden in Palestine. According to the Palestine Annual Health Report 2024, lung and bronchus cancers accounted for 316 newly diagnosed cases (10.5 per 100,000 population) and 266 deaths, with 85% occurring among males. These epidemiological patterns highlight the urgent need for locally validated AI solutions that support early lung cancer detection and robust clinical decision-making, particularly in resource-limited healthcare settings where radiological expertise and structured screening programs remain limited. This study proposes a dose-aware hybrid deep-learning–machine-learning framework for multi-class Lung-RADS classification using heterogeneous chest CT datasets collected from multiple Palestinian institutions. The framework integrates optimized contrast enhancement, deep feature extraction using VGG16, and five classical machine-learning classifiers (LR, SVM, RF, GB, and DT). Contrast enhancement was systematically evaluated using two subsets of 120 malignant cases, one LDCT and one SDCT which is demonstrating that the hybrid CLAHE-USM provided the most balanced improvements (EME = 20.648, PSNR = 19.711, SSIM = 0.912). Dose-optimized parameters, including a clip limit of 3 for LDCT and 4 for SDCT, confirmed the importance of dose-specific preprocessing in stabilizing image quality. The classification results obtained across the LDCT, combined, external validation, and clinical validation datasets demonstrate that the proposed VGG16-machine learning framework provides robust and consistent performance for Lung-RADS-based nodule risk stratification. On the LDCT dataset, all classifiers achieved clinically meaningful performance, although variability was observed across Lung-RADS categories. GB and decision tree classifiers demonstrated powerful performance in LR2 and higher-risk categories, achieving accuracies above 0.85. A clear performance improvement was observed with increasing risk of malignancy. For LR4A and LR4B, most classifiers achieved higher accuracy than in lower-risk categories, reflecting the greater structural distinctiveness of high-risk nodules. The most important performance gains were observed on the combined LDCT-SDCT dataset, particularly for LR3 and LR4A-LR4B. In this setting, SVM and RF achieved near-ceiling performance, with accuracies exceeding 0.97 and AUC values approaching unity. External validation on an independent test set from Al-Makassed Hospital further confirmed the robustness of the proposed framework. For LR2, all major classifiers achieved accuracies above 0.84, whereas for LR4B, all major classifiers achieved accuracies above 0.86. The most stringent assessment of diagnostic performance was provided by Clinical validation on biopsy-confirmed LR4B cases from Augusta Victoria Hospital. SVM achieved the highest accuracy and AUC, followed closely by LR. Overall, this framework demonstrates strong potential as a practical decision-support tool for improving Lung-RADS-based risk stratification and supporting early lung cancer detection in resource-constrained healthcare settings en
dc.description.abstractيُعد سرطان الرئة من أبرز التحديات الصحية عالميًا نظرًا لارتفاع معدلات الإصابة والوفيات المرتبطة به، كما يُمثل في فلسطين عبئًا صحيًا ملحوظًا حيث يُسجَّل ضمن أعلى أسباب الوفيات السرطانية، وغالبًا ما يتم تشخيصه في مراحل متقدمة تقل فيها فرص العلاج الشافي. ويؤكد هذا الواقع الحاجة إلى حلول فعّالة تدعم الكشف المبكر وتحسّن دقة تصنيف العقيدات الرئوية وتُقلّل الأخطاء التشخيصية، خاصة في البيئات محدودة الموارد. يرتبط خطر الإصابة بسرطان الرئة بعدة عوامل، يأتي في مقدمتها التدخين، إضافة إلى التعرضات المهنية والبيئية والعوامل الوراثية. وعلى الرغم من توفر وسائل متعددة للتشخيص، فإن الكشف المبكر يظل محورًا أساسيًا لتحسين البقاء على قيد الحياة. وقد أثبتت الأدلة من التجارب السريرية الكبرى فاعلية التصوير المقطعي منخفض الجرعة (LDCT) في خفض وفيات سرطان الرئة لدى الفئات عالية الخطورة مقارنةً بأشعة الصدر، إلا أن تطبيقه العملي يترافق مع تحديات عديدة. ولتقليل هذه التحديات، طُوّرت أنظمة معيارية للتقرير والتصنيف مثل Lung-RADS التي تهدف إلى توحيد المصطلحات والتوصيات وخفض الإيجابيات الكاذبة وتعزيز اتخاذ القرار السريري. غير أن تطبيق Lung-RADS في الممارسة اليومية قد يكون معقدًا بسبب الحاجة إلى تقييم دقيق لخصائص العقيدة وتغيرها عبر الزمن، إلى جانب اختلاف البروتوكولات والأجهزة وجودة الصور. وفي السياق الفلسطيني تحديدًا، تبرز فجوة إضافية تتمثل في غياب برامج وطنية منظمة لفحص (التصوير المقطعي منخفض الجرعة) LDCT، إضافةً إلى أن معظم نماذج الذكاء الاصطناعي المنشورة جرى تطويرها وتقييمها على بيانات دولية قد لا تعكس خصائص البروتوكولات المحلية أو تنوع الأجهزة وخصائص السكان، مما يحد من قابليتها للتعميم على البيئة السريرية المحلية. انطلاقًا من هذه الفجوات، تهدف هذه الدراسة إلى تطوير وتقييم إطار ذكاء اصطناعي لدعم تصنيف العقيدات الرئوية وفق معيار Lung-RADS v2022، مع مراعاة اختلاف الجرعة بين التصوير منخفض الجرعة (LDCT) والتصوير التشخيصي القياسي (SDCT) وما يترتب عليه من اختلافات في الضجيج والتباين وجودة الصورة. يعتمد الإطار المقترح على دمج تحسين الصور ومعالجة التباين بصورة مراعية للجرعة، ثم استخراج ميزات عميقة باستخدام VGG16، تليها مرحلة تصنيف عبر خوارزميات تعلم آلي كلاسيكية متعددة بهدف مقارنة الأداء واختيار الأكثر كفاءة ضمن قيود الموارد المتاحة. اعتمدت الدراسة بيانات متعددة المصادر تشمل صورًا تشخيصية محلية (SDCT) من مستشفيات فلسطينية، إضافة إلى حالات خبيثة مؤكدة بخزعات لتوفير معيار مرجعي عالي الثقة في التحقق السريري، إلى جانب دمج بيانات عامة متاحة من فحوصات LDCT مصنفة وفق Lung-RADS. وتم تبني استراتيجية تحقق متدرجة لضمان تقييم موضوعي لقدرة النموذج على التعميم، تضمنت: (1) مجموعة اختبار محجوزة (Hold-out) من بيانات SDCT المحلية لم تُستخدم في أي مرحلة من التدريب أو تحسين المعالجة، (2) تقييم داخلي على مجموعة التطوير المدمجة LDCT+SDCT، و(3) تحقق سريري إضافي باستخدام حالات مثبتة بالخزعة، بما يعزز موثوقية الاستنتاجات ويدعم قابلية التطبيق العملي. ركزت الدراسة كذلك على تحسين جودة الصور قبل الاستخلاص الآلي للميزات، حيث تم تقييم عدة تقنيات لتعزيز التباين والحد من الضجيج، وجرى اعتماد نهج يجمع بين CLAHE وUnsharp Masking بعد ضبط معاملات CLAHE بشكل منفصل لصور LDCT وSDCT، بما يحقق توازنًا بين إبراز التفاصيل الدقيقة وحدود العقيدات من جهة، وتجنب تضخيم الضجيج في صور الجرعة المنخفضة من جهة أخرى. وقد مكّن ذلك من توفير مدخلات أكثر ثباتًا لمرحلة استخراج الميزات العميقة، وأتاح تحسينًا في قابلية تمييز الفئات المختلفة وفق Lung-RADS. ورغم الأداء القوي الذي أظهره الإطار المقترح عبر مراحل التقييم المختلفة، تظل هناك اعتبارات منهجية وعملية ينبغي أخذها بالحسبان، مثل محدودية نمذجة المعلومات الحجمية ثلاثية الأبعاد والنمو الزمني في حال الاعتماد على مدخلات ثنائية الأبعاد، إضافةً إلى تأثير عدم انتظام المتابعات السابقة لبعض الحالات، وتباين البروتوكولات السريرية (السماكة، نوى إعادة البناء، المادة الظليلة، أنظمة التحكم بالجرعة)، وهي عوامل قد تؤثر على ثبات الأداء خاصة في الفئات المتوسطة مثل LR3 وLR4A التي تتسم بطبيعتها بالغموض التشخيصي. تلخص الدراسة إلى أن الإطار المقترح يمثل خطوة عملية نحو تطوير نظام دعم قرار سريري قابل للتفسير والاستخدام ومُوائم للواقع المحلي، حيث يجمع بين المعالجة المسبقة المراعية للجرعة، واستخلاص الميزات العميقة، والتصنيف وفق Lung-RADS v2022، مع استراتيجية تحقق تشمل اختبارًا خارجيًا على بيانات محلية وتحققًا سريريًا بحالات مؤكدة بالخزعة. ومن المتوقع أن يسهم هذا النهج في تقليل التباين بين القراءات، وتحسين دقة التصنيف وتقليل الإيجابيات الكاذبة، ودعم الكشف المبكر عن سرطان الرئة في فلسطين، خصوصًا في ظل غياب برامج وطنية منظمة للفحص وارتفاع عبء العمل على اختصاصيي الأشعة.ar
dc.identifier.urihttps://dspace.alquds.edu/handle/20.500.12213/10650
dc.language.isoen
dc.publisherAl-Quds Universityen
dc.titleCross-Modality Transfer Learning for Reliable Lung Cancer Nodule Classification in Low-Dose CTen
dc.titleالتعلّم الانتقالي متعدد الأنماط لتصنيف موثوق لعُقيدات سرطان الرئة في التصوير المقطعي منخفض الجرعةar
dc.typeThesis
Files
Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Sara Asfour Thesis Final.pdf
Size:
2.59 MB
Format:
Adobe Portable Document Format
Description:
License bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
1.61 KB
Format:
Item-specific license agreed upon to submission
Description: