Computer Science
Permanent URI for this collection
Browse
Recent Submissions
Now showing 1 - 5 of 73
- ItemMachine Learning Drug Discovery for COVID-19(Al-Quds University, 2023-03-27) Claudia Alawi; كلوديا الياس رأفت علاويCOVID-19 was a big issue facing the world, and the development of an effective drug for the virus is still under research. However, developing a new drug is a lengthy and costly process that might take up many years. Artificial intelligence can have a vital role for faster and more cost-effective drug discovery. The primary protease that is essential to SARS-CoV-2 replication is 3CLpro. In this thesis a machine learning model that can be used to predict the inhibitory activity of 3CLpro was developed based on decision tree regressor. The descriptors that represent the chemical molecules were obtained using PADEL descriptor software, and these descriptors were fed into the decision tree model to train it and predict the bioactivity of unknown compounds with the target protein. The model was optimized using pruning and ensemble methods, where the decision tree was combined with SVM to improve the model performance. The research focused on both external and internal approaches for validating model performance. The model successfully discovered 26 unknown compounds from Zinc natural product data source that showed bioactivity with the target protein. Moreover, Lipinski rule of five (RO5) was applied to prioritize drug-like compounds resulting in 25 of the discovered compounds having drug like properties and can be used in clinical trials. The model was validated using 10-folds cross validation and was also validated using external dataset from different data source than the data source used in training the model, on both external and internal datasets, the proposed model has proven to be effective, however, the model showed higher performance on the external validation with accuracy of 0.89, precision of 0.75, recall of 0.6 and f1 score of 0.67 for the internal validation, while for external validation 0.98 accuracy, 0.99 precision, recall of 0.93 and f1-score of 0.96. Compared to similar studies using deep learning, our machine learning model showed better performance. In conclusion the proposed model can be useful in the drug discovery of new compounds for the COVID-19 virus. ملخص كان فيروس كورونا مشكلة كبيرة تواجه العالم، ولا يزال تطوير دواء فعال للفيروس قيد البحث. ومع ذلك، فإن تطوير دواء جديد عملية طويلة ومكلفة وقد تستغرق سنوات عديدة. يمكن أن يلعب الذكاء الاصطناعي دورًا حيويًا في اكتشاف الأدوية بشكل أسرع وأكثر فعالية من حيث التكلفة. إن البروتياز الأساسي الضروري الازم لتضاعف و نمو الفيروس هو إنزيم البروتيز الرئيسي (3CLpro). في هذه الأطروحة، تم تطوير نموذج التعلم الآلي الذي يمكن استخدامه للتنبؤ بالنشاط المثبط للبروتيز الرئيسي من خلال تطبيق شجرة القرار. تم الحصول على الواصفات التي تمثل الجزيئات الكيميائية باستخدام برنامج واصفPADEL ، وتم إدخال هذه الواصفات في نموذج شجرة القرار لتدريبها والتنبؤ بالنشاط الحيوي لمركبات غير معروفة مع البروتين المستهدف. تم تحسين النموذج باستخدام طرق التقليم والتجميع، حيث تم دمج شجرة القرار مع آلة المتجه الداعم لتحسين أداء النموذج. ركز البحث على كلا النهجين الخارجي والداخلي للتحقق من أداء النموذج. اكتشف النموذج بنجاح 26 مركبًا غير معروف من مصدر بيانات منتج الزنك الطبيعي الذي أظهر نشاطًا حيويًا مع البروتين المستهدف. علاوة على ذلك ، تم تطبيق قاعدة Lipinski (RO5) لتحديد المركبات التي تصلح ان تكون عقاقير و لها خصائص العقاقير مما انتج عن 25 من المركبات المكتشفة التي لها خصائص شبيهة بالعقاقير ويمكن استخدامها في التجارب السريرية. تم التحقق من صحة النموذج باستخدام التحقق المتقاطع المتكون من 10 تقاطعات وتم التحقق من صحته أيضًا باستخدام مجموعة بيانات خارجية من مصدر بيانات مختلف عن مصدر البيانات المستخدم في تدريب النموذج ، وقد أثبت النموذج المقترح فعاليته على كل من مجموعات البيانات الخارجية والداخلية و لكن أظهر النموذج أداءً أعلى في البيانات الخارجية. فقد كانت النتائج بدقة 0.89 ، و إحكام 0.75 ، واسترجاع 0.6 و النتيجة الكاملة للكفائة ودقة النموذج 00.67 للتحقق الداخلي ، بينما بالنسبة للتحقق الخارجي 0.98 دقة، و إحكام 0.99، واسترجاع 0.93 و النتيجة الكاملة للكفائة ودقة النموذج 0.96. مقارنة بالدراسات المماثلة التي تستخدم التعلم العميق ، أظهر نموذج التعلم الآلي لدينا أداءً أفضل. في الختام، يمكن أن يكون النموذج المقترح مفيدًا في اكتشاف الأدوية لمركبات جديدة لفيروس كورونا.
- ItemAnomaly-Based Network Intrusion Detection System Using Deep Neural Networks (ANIDS-DNN)(Al-Quds University, 2023-01-08) Sharif Mohammed Ahmad Yasin; شريف محمد احمد ياسينتقوم أنظمة الكشف عن اختراق الشبكات (NIDS) بمراقبة وتحليل حركة مرور الشبكة الواردة والصادرة وإصدار الإنذارات عند اكتشاف عمليات اقتحام أو أنشطة ضارة حيث تعتبر هذه الأنظمة خط الدفاع الثاني بعد جدار الحماية. في السنوات الأخيرة، حفز العدد المتزايد من الهجمات السيبرانية الحاجة إلى تطوير أنظمة آلية وذكية للكشف عن اختراق الشبكة والتي تتعلم السلوك الطبيعي لحركة مرور الشبكة (ANIDS)، وبالتالي فإن حركة المرور التي تنحرف عن المعتاد تعتبر شاذة أو ضارة. على الرغم من أن أنظمة كشف التسلل المستندة إلى حركة المرور غير المعتادة أفضل من أنظمة كشف التسلل القائمة على التوقيع في اكتشاف هجمات اليوم الصفري أو غير المعروفة، إلا أنها تولد معدل إنذار خاطئ مرتفعًا إذا تم تغيير السلوك الطبيعي للشبكة. لحل المشكلات المذكورة أعلاه، تقترح هذه الأطروحة نموذج ANIDS لاكتشاف الهجمات غير المعروفة او هجمات اليوم الصفري في تدفقات الشبكة باستخدام تغذية الشبكات العصبية العميقة الى الامام كخوارزمية تصنيف. يأخذ النموذج ميزات NetFlow المجمعة كمدخلات وبعد إعداد البيانات، تصنف خوارزمية التعلم العميق كل اتصال بالشبكة على أنه عادي أو شاذ. من أجل تحسين دقة الكشف عن أنماط الهجوم التي لها ترددات تعتمد على الوقت مثل هجوم nerisbotnet، تم تصميم ثلاث ميزات إدخال جديدة وهي sa_nsessions_T و da_nsessions_T و sa_da_nsessions_T عن طريق تجميع التدفقات بناءً على عنوان المصدر وعنوان الوجهة وسمات الطابع الزمني باستخدام نافذة زمنية مدتها دقيقة واحدة. وبعد المعالجة المسبقة لميزات المدخلات، يتم تحديد أهم 45 ميزة إدخال. علاوة على ذلك، يتم تعلم معلمات النموذج باستخدام عدد كبير من التدفقات ذات التصنيف متعدد الفئات من مجموعة بيانات UGR’16 العامة [32]. تم تحسين المعلمات الفائقة للنموذج للحصول على أفضل أداء من حيث الدقة ومعدل الاكتشاف والوقت اللازم لتدريب النموذج المقترح. أكدت النتائج التجريبية الأداء العالي للنموذج المقترح عند اختباره على تدفقات الشبكة غير المرئية من مجموعة بيانات UGR’16. تتكون بنية الشبكة المثلى من طبقة إدخال واحدة وثلاث طبقات مخفية وطبقة إخراج واحدة. حقق النموذج دقة 99.773٪، ومعدل موجب خاطئ أقل من 1٪، ومساحة تحت منحنى خاصية تشغيل المستقبل (ROC-AUC) تبلغ 0.999915. أيضًا، تبلغ دقة الكشف للمصنف متعدد الفئات 99.58٪ ومعدل الكشف لجميع الفئات الفردية أعلى من 99٪ باستثناء هجوم NerisBotNet حيث يبلغ معدل الكشف 94.70٪. عند مقارنة النموذج المقترح بالنماذج الحديثة الأخرى في الأدبيات [33]، [52]، والتي تم تقييمها على نفس مجموعة بيانات UGR’16، تظهر النتائج التجريبية أن النموذج المقترح يتفوق على النماذج الأخرى من حيث معدل الاكتشاف والدقة.
- Itemتقنیات تقدیر الجھد في تطویر البرمجیات - دراسة حالة لشركات البرمجیات الفلسطینیة(جامعة القدس, 2022-12-24) عدي عبد محمد الوحش; Oday Abed Mohammad Al-Wahshتقدیر الجھد ھو إحدى طرق تقییم مشروع برمجي وفھم جدولھ الزمني ومیزانیتھ. إنھ أحد أھم جوانب دورة حیاة تطویر البرمجیات. قد یؤدي عدم التعرف على تقدیر الجھد الدقیق إلى زیادة التكالیف المالیة للشركات وعملائھا مما یؤدي إلى تأثیر سلبي على واجباتھم الوظیفیة وخططھم التسویقیة المستقبلیة بالإضافة إلى خیبة أمل العمیل وعدم رضاه. یعتبر قطاع تكنولوجیا المعلومات الفلسطیني من أكثر القطاعات الواعدة والنامیة. ومع ذلك، فإن الدراسات التي تبحث في أسالیب وتقنیات تقدیر الجھد ھي على الأرجح مفقودة. لھذا السبب، كنا متحمسین لدراسة حالة شركات تطویر البرمجیات في فلسطین من أجل فھم أفضل لكیفیة تقدیر الفرق الفنیة للجھود المطلوبة لمشاریعھم البرمجیة. الغرض من ھذه الدراسة ھو )1( مسح تقنیات تقدیر الجھد الحالیة المستخدمة من قبل شركات تطویر البرمجیات الفلسطینیة البارزة وتحلیل ممارساتھا، و )2( لاقتراح أسلوب تقدیر الجھد المناسب الذي یمكن أن یتناسب مع طبیعة واحتیاجات ھذه الشركات وللتحقق من صحة ھذه التقنیة عبر تطبیق حقیقي ضمن مشاریع برمجیة فعلیة في مجموعة فرعیة مختارة من ھذه الشركات. بنا ًء على المسح والتحلیل الذي أجریناه، اخترنا تقنیة تقدیر الجھد الحالیة تسمى )Triangulation( كأسلوب تقدیر الجھد والتكلفة الأنسب للشركات الصغیرة وصناعة تطویر البرمجیات الفلسطینیة، ثم قمنا بتصمیم امتداد لھذه التقنیة من أجل )صقل( للاحتیاجات الدقیقة للشركة وتزویدھا ببعض المرونة لإجراء بعض التغییرات والتعدیلات )على سبیل المثال، تقلیل وقت تسلیم المشروع عن طریق زیادة الموارد(. علاوة على ذلك، تم تطبیق ھذه التقنیة على مشاریع البرمجیات الفلسطینیة للتحقق من نتائجھا. نعتقد أن ھذه الدراسة یمكن أن تكون موردا قیما لشركات تطویر البرمجیات الفلسطینیة. ویمكنھم استخدامھ كدلیل إرشادي لمساعدتھم في الحصول على تقدیرات أفضل وأكثر دقة للجھود، والتي بدورھا یمكن أن تقلل التكالیف وتوفر جدولة أفضل وأكثر دقة واحتیاجات التوظیف.
- ItemScholar Search Relevancy Optimization(Al-Quds University, 2020-08-10) Rida Rohi Taher Abdelmajid; رضا روحي طاهر عبدالمجيدThe massive amount of information published every day has made it difficult to conduct a more relevant search for educational materials, because of loose requirements regarding metadata content. Many researchers have pointed out the importance of metadata and the efficiency of machine learning, deep learning algorithms, and language processing in text classification and semantic similarity by discussing the efficiency of algorithms without indicating how to use these algorithms to enhance search results based on metadata. This study aims to test some of the natural language processing tasks, machine learning, and deep learning techniques, in addition to the role of metadata in enhancing search results. This study propose a framework called "Al-Quds System" as a recommender and assistance system to enables the author to add as much relevant information as possible to their publications to enhance retrievability by increasing the opportunity of displaying documents and texts in the search results. This study shows the possibility of enhancing search results by combining language processing, deep learning, and metadata. In addition, this shows that documents can classified with high accuracy whether using traditional classifiers such as Multinomial Naïve Bayes (MNB) with 85% accuracy or deep learning such as Convolutional Neural Network (CNN) with 79% accuracy, and the accuracy of classifiers depends primarily on features extracting. In addition, the semantic similarity of words or sentences can computed by representing words into vectors, the closer the cosine value to 1, the smaller the angle, and the higher match between words vectors. Which had a positive impact on the Al-Quds system as a recommender and assistance system to use by the authors.
- ItemUser Experience Framework of Arabic-English Websites Using Robotic Process Automation(Al-Quds University, 2022-09-03) Heba Faek Dyab Sheeb; هبة فايق ذياب شيبإن عملية فحص سهولة إستخدام المواقع الالكترونية والأنظمة المطورة باستخدام تقنية الويب مهم وأساسي وذلك لأنه يعكس مدى قدرة المستخدم على إستخدام النظام أو الموقع الإلكتروني بسهولة ويسر. هناك العديد من الطرق المتبعة في فحص سهولة المواقع الإلكترونية سواء كانت عن طريق إجراء تجارب عملية على مستخدمين أو من خلال تقييم المواقع الإلكترونية من خلال خبراء مختصين في هذا المجال بالاعتماد على المبادئ والمعايير العالمية ولكن معظم الأبحاث التي أجريت تركز وبشكل رئيسي على ثلاثة متغيرات رئيسية وهي فعالية وكفاءة و رضا المستخدمين عن هذه المواقع. بالرغم من التنوع الكبير في التقنيات والطرق المتبعة خصوصا بعد ظهور طرق آلية تساعد في فحص ميزات وأجزاء المواقع المختلفة،إلا أنه لا تزال الطرق التقليدية الأكثر إستخداماً وشيوعاً في الأبحاث العلمية مثل استخدام الاستبيانات والمقابلات وعمل قوائم بالمعايير المعتمدة ومطابقتها على المواقع المراد فحصها وغيرها من الطرق المختلفة ولكن جميع هذه الطرق تحتاج الكثير من الوقت والجهد بالإضافة إلى التكلفة المرتفعة. أما بالنسبة الى الطرق الالية الموجودة فهي تقدم فحص جزئية واحدة أو جزئيات وميزات محدودة في المواقع الإلكترونية مثل فحص الخطوط والألوان وسهولة الوصول ودرجة الأمان وغيرها من المتغيرات الأخرى وبالإضافة الى كونها تناسب المواقع الإنجليزية بشكل أكبر. لذلك يقدم هذا البحث طريقة وأداة جديدة في قياس سهولة المواقع الإلكترونية سواء كانت باللغة العربية والانجليزية من خلال استعمال تقنية أتمتة العمليات الروبوتية بالرجوع إلى مبادئ نيلسون المعتمدة في مجال فحص سهولة المواقع؛ حيث تقدم هذه الأداة فحص لسهولة الموقع من ناحية تصميم الموقع وخصوصا الأجزاء الرئيسية الواجب توافرها وهي ترويسة الصفحة وبالتحديد شعار المؤسسة أو الشركة والقائمة الرئيسية وعارض الصور ومنطقية المحتوى وأخيرا جزئية ذيل الموقع. وأهم ما يميز هذه الطريق أنها لا تحتاج إلى وقت وجهد كبير في إجراء فحص سهولة الموقع بالإضافة الى التكلفة المنخفضة وأيضا عدم الحاجة للوصول الى النسخة الأصلية لبرمجة الموقع. تم فحص هذه الأداة على خمسة عشر موقع مختلف تندرج تحت ثلاثة أقسام رئيسية وهي مواقع التعليم العالي (الجامعات) وعددها أربعة، ومؤسسات حكومية (وزارات) وعددها أربعة وأيضا مواقع إعلامية تختص بالأخبار وعددها ثلاثة؛ حيث تم فحص الصفحات الرئيسية لهذه المواقع بالإضافة الى صفحة عن الموقع للجامعات فقط. أظهرت هذه الأداة قدرتها على إكتشاف مواقع الخلل في التصميم في جميع المواقع التي تم فحصها وأظهرت المواقع التي يجب على المبرمج تصحيحها ولا تطابق مع مبادئ تفاعل الإنسان مع الحاسوب حيث تم عرض النتائج بأكثر من طريقة سواء كانت من خلال جداول واحصاءات أو من خلال إعادة تصميم الموقع لمعرفة طريقة المتبعة وهل تتلائم مع التصميم الشائع للمواقع بالإضافة إلى رسم خريطة للموقع تبين مواقع الأخطاء وكما أثبتت هذه الأداة سهولتها وسرعتها وفعاليتها.