Please use this identifier to cite or link to this item: http://hdl.handle.net/10889/13333
Title: Shape database management using computational intelligence
Other Titles: Διαχείριση βάσεων δεδομένων σχημάτων με χρήση υπολογιστικής νοημοσύνης
Authors: Φωτοπούλου, Φωτεινή
Keywords: Shape segmentation
Visibility graph
Keywords (translated): Κατάτμηση σχήματος
Γράφος ορατότητας
Abstract: The objective of this thesis is to explore the potentiality of several methods on 2D and 3D shape database related applications, such as segmentation, retrieval, clustering to name a few. For the shape segmentation problem all methods describe the shape using contour information for the 2D or the volume for the 3D case, respectively. This kind of information is mainly represented using the notion of visibility as a head-start, moving towards into more sophisticated methods and implementations. Several algorithms are introduced which aim to explore if the (contour) volumetric information is adequately captured by visibility-based transformations and additionally to explore the limits of volumetric methods in this application. Each shape is modeled by exploiting its visibility context which is proved to be an effective and perceptual compatible way of representation \cite{visibility}. Using the visibility context indirectly implies that the convex parts of each shape are captured, which are known to imitate the human's way of partitioning. Although all mentioned methods are graph-based and use the visibility graph as a starting point, then this graph is appropriately modified to meet the needs of the segmentation issue, by using constraints, spectral techniques, or diffusion-based transformations. Extended experimental measurements revealed the highly discriminative nature of these methods and their capability of yielding meaningful shape partitions. Moving one step further, a novel method combines the complementary information provided by the mesh surface and its volume. The additional usage of geodesic measurements leaded to better results. Another issue that this thesis deals with is the 2D shape retrieval by using multidimensional descriptors originating from simple 1D sequences that represent a shape and usually describe it by means of its centroid-to-contour distance and the angle-sequence-along-contour measurements. Specifically, the phase space and the scale space representation is investigated modifying the initial 1D sequence to a set of vectors in a higher dimension. Experimental results on several databases, including an application on leaf images, demonstrated the superiority of the proposed high dimensional description over conventional ones, especially when using fusion methods. Finally, 3D shape clustering and classification is revisited from the view of Non-Negative Least Squares NNLS coding technique. The objective is to point out that NNLS as a graph encoding technique provides an effective solution to the mentioned applications. Sparse coding with L2 graph is also adopted for the fusion of multilayer graphs. Experimental results validate the excellent performance of this framework.
Abstract (translated): Σκοπός αυτής της εργασίας είναι η διερεύνηση της δυνατότητας διαφόρων μεθόδων σε εφαρμογές σχετικές με τη βάση δεδομένων 2D και 3D σχημάτων, όπως η κατάτμηση, η ανάκτηση, η ομαδοποίηση για να αναφέρουμε μερικές. Για το πρόβλημα τμηματοποίησης σχήματος, όλες οι μέθοδοι περιγράφουν το σχήμα χρησιμοποιώντας πληροφορίες περιγράμματος για το 2D ή τον όγκο για την περίπτωση 3D, αντίστοιχα. Αυτό το είδος πληροφοριών αντιπροσωπεύεται κυρίως χρησιμοποιώντας την έννοια της ορατότητας (visibility) ως αρχικό βήμα, προχωρώντας προς πιο εξελιγμένες μεθόδους και υλοποιήσεις. Εισάγονται διάφοροι αλγόριθμοι οι οποίοι στοχεύουν να διερευνήσουν εάν η ογκομετρική πληροφορία (περιγράμματος) συλλέγεται επαρκώς από μετασχηματισμούς βασισμένους στην ορατότητα και επιπροσθέτως να διερευνηθούν τα όρια των ογκομετρικών μεθόδων σε αυτή την εφαρμογή. Κάθε σχήμα μοντελοποιείται κανοντας χρήση του πλαισίου ορατότητάς του, το οποίο αποδείχθηκε ότι είναι ένας αποτελεσματικός και συμβατός με την ανθρώπινη αντίληψη τρόπος αναπαράστασης. Η χρήση του πλαισίου ορατότητας λαμβάνει υπόψιν με έμμεσο τρόπο τα κυρτά τμήματα κάθε σχήματος, τα οποία είναι γνωστό ότι μιμούνται τον ανθρώπινο τρόπο διαχωρισμού σχημάτων. Παρόλο που όλες οι αναφερθείσες μέθοδοι βασίζονται σε γραφήματα και χρησιμοποιούν το γράφημα ορατότητας ως σημείο εκκίνησης, στην περίπτωσή μας αυτό το γράφημα τροποποιείται κατάλληλα για να ικανοποιήσει τις ανάγκες του προβλήματος τμηματοποίησης, χρησιμοποιώντας περιορισμούς, φασματικές τεχνικές ή μετασχηματισμούς που βασίζονται στη διάχυση. Οι εκτεταμένες πειραματικές μετρήσεις αποκάλυψαν την εξαιρετικά διακριτική φύση αυτών των μεθόδων και την ικανότητά τους να αποδίδουν σημαντικά χωρίσματα σχήματος. Προχωρώντας ένα ακόμη βήμα, μια νέα μέθοδος παρουσιάζεται, η οποία συνδυάζει τις συμπληρωματικές πληροφορίες που παρέχονται από την επιφάνεια του πλέγματος και τον όγκο του. Η πρόσθετη χρήση των γεωδαιτικών μετρήσεων οδήγησε σε καλύτερα αποτελέσματα. Ένα άλλο θέμα με το οποίο ασχολείται αυτή η εργασία είναι η ανάκτηση 2D σχήματος χρησιμοποιώντας πολυδιάστατους περιγραφείς που προέρχονται από απλές ακολουθίες 1D που αντιπροσωπεύουν ένα σχήμα και συνήθως το περιγράφουν μέσω της απόστασης από το κέντρο προς την περίμετρο και της γωνίας- μετρήσεις κατά μήκος. Συγκεκριμένα, διερευνάται ο χώρος φάσης και η αναπαράσταση χώρου κλίμακας τροποποιώντας την αρχική ακολουθία 1D σε ένα σύνολο περιγραφέων σε υψηλότερη διάσταση. Τα πειραματικά αποτελέσματα σε διάφορες βάσεις δεδομένων, συμπεριλαμβανομένης μιας εφαρμογής σε εικόνες φύλλων, κατέδειξαν την ανωτερότητα της προτεινόμενης περιγραφής υψηλών διαστάσεων έναντι των συμβατικών, ιδίως όταν χρησιμοποιούνται μέθοδοι σύντηξης. Τέλος, επανεξετάζονται η ομαδοποίηση και η ταξινόμηση 3D σχημάτων από την άποψη της τεχνικής κωδικοποίησης μη αρνητικών ελαχίστων τετραγώνων (non negative least squares-NNLS). Ο στόχος είναι να επισημανθεί ότι το NNLS ως τεχνική κωδικοποίησης γραφημάτων παρέχει μια αποτελεσματική λύση στις προαναφερθείσες εφαρμογές. Η αραιή κωδικοποίηση με L2 γράφο υιοθετείται επίσης για τη σύντηξη γραφημάτων πολλαπλών επιπέδων. Τα πειραματικά αποτελέσματα επικυρώνουν την εξαιρετική απόδοση του προτεινόμενου αυτού του πλαισίου.
Appears in Collections:Τμήμα Μηχανικών Η/Υ και Πληροφορικής (ΔΔ)

Files in This Item:
File Description SizeFormat 
thesis_Fotopoulou.pdf2.63 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons