Αντιμετώπιση ελλιπών τιμών σε προβλήματα εξόρυξης δεδομένων

Loading...
Thumbnail Image

Date

Authors

Σταμούλη, Ιωάννα

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Η εξόρυξη γνώσης χρησιμοποιούνται σε πολλούς τομείς της σύγχρονης κοινωνίας. Σημειώνεται ότι στη συλλογή πληροφοριών παρατηρούνται ελλείψεις στα δεδομένα και στην παρούσα διπλωματική θα παρουσιαστούν τρόποι αντιμετώπισης αυτών με σκοπό όσο το δυνατόν καλύτερη εξαγωγή πληροφορίας από τα δεδομένα. Αναλύονται οι μορφές των ελλιπών τιμών και παρουσιάζονται οι αιτίες που τις προκαλούν. Γίνεται χρήση μεθόδων αντιμετώπισης ελλιπών τιμών (διαγραφή περίπτωσης, αντικατάσταση με μέση και κεντρική τιμή, παλινδρόμηση, Hot-deck καταλογισμός, k-πλησιέστερος γείτονας, πολλαπλός καταλογισμός, μέθοδος δένδρου απόφασης, μπεϋζιανή επανάληψη, κανένας καταλογισμός, μέθοδος αντικατάστασης με την πιο συχνή τιμή για τα κατηγορικά χαρακτηριστικά και με τη μέση τιμή για τα αριθμητικά χαρακτηριστικά, καταλογισμός στάθμισης με τον k- πλησιέστερο γείτονα, μέση τιμή k σημείων, καταλογισμός με μέση τιμή k-ασαφών σημείων, μηχανές διανυσμάτων υποστήριξης, κάλυψη περιπτώσεων, αλγόριθμος πρόβλεψης-μεγιστοποίησης, μοναδική τιμή αποσύνθεσης, ελάχιστος τοπικός τετραγωνικός καταλογισμός) σε βάσεις δεδομένων και εφαρμογή αλγορίθμων εξόρυξης γνώσης (δένδρο απόφασης, νευρωνικά δίκτυα, μηχανές διανυσμάτων υποστήριξης, k- πλησιέστερος γείτονας, αλγόριθμος προώθησης, αλγόριθμος ακολουθιακής ελάχιστης βελτιστοποίησης, πολυεπίπεδο νευρωνικό δίκτυο) στο στατιστικό πακέτο R και του εργαλείου KEEL.

Description

Keywords

Εξόρυξης γνώσης, Ελλιπείς τιμές, Αλγόριθμοι αντιμετώπισης ελλιπών τιμών

Citation