Please use this identifier to cite or link to this item:
Title: Ιχνηλάτηση 3D αντικειμένων και επαναφορά πόζας με χρήση RGB ιστογραμμάτων
Other Titles: 3D object tracking and pose recovery using RGB histograms
Authors: Κατσαντάς, Ιωάννης
Keywords: Ιχνηλάτηση 3D αντικειμένων
Εκτίμηση πόζας
Κατάτμηση εικόνας
Keywords (translated): 3D object tracking
Pose estimation
Image segmentation
Level set methods
Abstract: Λόγω της ικανότητας τους να ιχνηλατούν texture-less αντικείμενα σε παραγεμισμένες σκηνές, χρησιμοποιώντας απλώς μονοοπτική RGB κάμερα, οι region-based ιχνηλάτες έχουν γίνει ιδιαίτερα δημοφιλείς. Στην παρούσα διπλωματική εργασία παρουσιάζεται ένας regionbased RGB ιχνηλάτης γνωστών τρισδιάστατων αντικειμένων που είναι ικανός να τρέξει, σε πραγματικό χρόνο, για μεγάλο αριθμό αντικειμένων. Προτείνεται ένας προσεγγιστικός υπολογισμός σε ένα από τα πιο υπολογιστικά βαριά βήματα των σχετικών μεθόδων, που είναι σε θέση να αυξήσει την ταχύτητα τους μέχρι και μία τάξη μεγέθους, ανάλογα με την επιθυμητή ακρίβεια. Για ακρίβεια αντίστοιχη με των state-of-the-art, ο αλγόριθμος που θα υλοποιηθεί τρέχει τουλάχιστον δύο φορές πιο γρήγορα από την τρέχουσα γρηγορότερη μέθοδο. Επιπρόσθετα, προτείνεται μία λύση για την ειδική κατηγορία του modeled occlusion που, σε αντίθεση με τις άλλες μεθόδους, δεν χρησιμοποιεί GPU και είναι πέντε φορές γρηγορότερη. ΄Ολα τα παραπάνω επιτυγχάνονται με τη χρήση μόλις μίας CPU. Τέλος, για να επαναφέρεται η ιχνηλάτηση όταν χάνεται το αντικείμενο, ο ιχνηλάτης εισάγεται στο ενδιάμεσο στάδιο μίας υπάρχουσας template matching διαδικασίας για τα τελευταία βήματα ενός εκτιμητή πόζας. Για τη διαδικασία αυτή, ο ιχνηλάτης προσαρμόζεται με υπάρχοντα μοντέλα για πιο αυστηρό segmentation, ενώ διορθώνεται κατάλληλα η σχετική με το matching training διαδικασία για να ταιριάξει με τον ιχνηλάτη της εργασίας.
Abstract (translated): In this thesis we present a region-based RGB tracker for known 3D models which is capable of running in real-time for a large number of objects. We suggest an approximation during one of the most computationally costly steps of the related methods which can increase performance by one order of magnitude, depending on the level of desired accuracy. For accuracy similar to that of the state of the art, our algorithm runs at least two times faster than the currently fastest method. In addition, we present a solution for the special case of modeled occlusion which, contrary to the other existing solutions, doesn’t require a GPU and runs five times faster. Everything described is run on a single CPU core. Finally, in order to recover from tracking loss, the tracker is introduced into a later stage of an existing template matching process for the final steps of a pose estimator. To make this possible, the tracker is adjusted to use existing more advanced segmentation models, while the training process is changed accordingly to match with our tracker’s characteristics.
Appears in Collections:Τμήμα Ηλεκτρολ. Μηχαν. και Τεχνολ. Υπολογ. (ΔΕ)

Files in This Item:
File Description SizeFormat 
Nemertes_Katsantas(ele).pdf3.28 MBAdobe PDFView/Open

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.