Please use this identifier to cite or link to this item: http://hdl.handle.net/10889/13208
Title: Αλγόριθμοι μηχανικής μάθησης και εφαρμογές σε ιατροβιολογικά προβλήματα
Other Titles: Machine learning algorithms and applications to biomedical problems
Authors: Αναστασίου, Ευτυχία
Keywords: Βιοπληροφορική
Μηχανική μάθηση
Επιτηρούμενη κατηγοριοποίηση
Εργαλείο με γραφικά διεπαφής χρήστη
Keywords (translated): Bioinformatics
Machine learning
Supervised classification
Tool with graphical user interface
Python
Tkinter
Abstract: Στη διάρκεια του 20ου αιώνα τα επιτεύγματα της επιστημονικής κοινότητας στον τομέα της ιατρικής και της βιολογίας συνείσφεραν στη δημιουργία και την ανάπτυξη διαγνωστικών και θεραπευτικών παρεμβάσεων όπως τα αντιβιοτικά, τα εμβόλια κ.α., αλλάζοντας ριζικά τις ζωές των ανθρώπων. Οι ραγδαίες εξελίξεις συνεχίστηκαν, με σημείο αναφοράς τις αρχές του 21ου αιώνα, όπου ολοκληρώθηκε το πρόγραμμα χαρτογράφησης του ανθρώπινου γονιδιόματος (Human Genome Project). Η αποκρυπτογράφηση του γενετικού μας υλικού έδωσε το έναυσμα για την ανάπτυξη υπολογιστικών εργαλείων που θα βοηθούσαν στη συγκέντρωση, την αποθήκευση και την ανάλυση βιολογικών πληροφοριών. Ένας τρόπος εκμετάλλευσης των βιολογικών δεδομένων είναι η χρήση αλγορίθμων μηχανικής μάθησης προκειμένου να δημιουργηθούν μοντέλα που εκπαιδεύονται με τα δεδομένα και παράγουν καινούργια γνώση. Η παρούσα διπλωματική εργασία χωρίζεται σε τέσσερα μέρη. Στο πρώτο κεφάλαιο γίνεται μια αναφορά σε βασικές έννοιες της Μοριακής Βιολογίας και της Βιοπληροφορικής για να αποκτήσουμε μια καλύτερη εικόνα στο είδος της πληροφορίας που πρόκειται να αξιοποιήσουμε στη συνέχεια. Ακολούθως, παρουσιάζονται βασικοί αλγόριθμοι μηχανικής μάθησης που θα χρησιμοποιούμε σε προβλήματα κατηγοριοποίησης όπως είναι ο Naive Bayes και τα δέντρα απόφασης. Στο τρίτο κεφάλαιο, αναλύονται τα βήματα που πρέπει να ακολουθήσουμε για τη δημιουργία ενός μοντέλου μηχανικής μάθησης, όπως είναι ο καθαρισμός και η επεξεργασία των δεδομένων, η επιλογή κατάλληλου αλγορίθμου και η αξιολόγηση της ακρίβειας του μοντέλου. Στο τέταρτο κεφάλαιο, παρουσιάζεται το πρόγραμμα που κατασκευάστηκε στα πλαίσια της εργασίας σε γλώσσα προγραμματισμού Python, προκειμένου να παρέχει μια συλλογή από εργαλεία οπτικοποίησης και επεξεργασίας δεδομένων, αλγορίθμους κατηγοριοποίησης, μεθόδους αξιολόγησης και ακρίβειας για την προγνωστική μοντελοποίηση μαζί με γραφικές διεπαφές χρήστη για εύκολη πρόσβαση σε αυτές τις λειτουργίες. Τέλος, χρησιμοποιείται το πρόγραμμα για την κατασκευή ενός μοντέλου πρόγνωσης της ασθένειας σακχαρώδη διαβήτη.
Abstract (translated): During the 20th century, scientific advances in medicine and biology had contributed to the creation and development of diagnostic and therapeutic interventions such as antibiotics, vaccines etc., radically changing people’s lives. The rapid developments continued and in the early 21st century a new benchmark for humanity was reached, as the project for mapping the human genome was completed (Human Genome Project). The decryption of our genetic material led to the development of computational tools which help us to collect, save, and analyse biological information. One way of exploiting the biological data is by using machine learning algorithms in order to create models which are trained with data and generate new knowledge. This thesis is divided into four parts. In the first chapter, there is a reference to the basic concepts of Molecular Biology and Bioinformatics to get a better idea of the kind of information that we are going to use later. Secondly, basic algorithms of machine learning are presented which are used to solve classification problems such as Naïve Bayes, Neural Networks and decision trees. In the third chapter, there is a detailed description of the steps we should follow in order to create a machine learning model, such as “cleaning” and processing data, selecting the right algorithm and evaluating a model’s accuracy. In the last chapter, the program that was developed in Python programming language is presented, which provide a collection of visualization and data processing tools, classification algorithms, estimation and precision modelling methods along with graphical user interfaces for easy access to these functions. Finally, the program is used to build a model for predicting susceptibility to diabetes mellitus.
Appears in Collections:Τμήμα Μαθηματικών (ΔΕ)

Files in This Item:
File Description SizeFormat 
eytychia_anastasiou_diplomatiki.pdf1.95 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons