Στην παρούσα πτυχιακή εργασία διερευνώνται και υλοποιούνται μέθοδοι εξαγωγής και παρακολούθησης χαρακτηριστικών σε wce βίντεο. Στo πλαίσιo της εργασίας, τα δεδομένα προέρχονται από μια ειδική ασύρματη έγχρωμη κάμερα, σε μέγεθος μεγάλης βιταμινούχου κάψουλας, που χορηγείται προς κατάποση από τον εκάστοτε εξεταζόμενο. Η κάμερα αυτή προωθείται κατά μήκος του πεπτικού σωλήνα του εξεταζόμενου με τις περισταλτικές κινήσεις του εντέρου. Κατά το ταξίδι της στο γαστρεντερικό σωλήνα παράγονται βίντεο, που αποτελούνται από όλα τα καρέ που συλλαμβάνει η κάμερα (WCE). Από αυτά τα βίντεο εξάγονται εικόνες, στις οποίες και εφαρμόζονται διαφορετικές τεχνικές εξαγωγής και περιγραφής χαρακτηριστικών σημείων ενδιαφέροντος. Για την αξιολόγηση των διαφορετικών τεχνικών εξαγωγής χαρακτηριστικών, κατασκευάζονται τεχνητά καρέ, που προκύπτουν από την εφαρμογή απλών μετασχηματισμών στα εξαχθέντα καρέ.
During the last few years, the production of digital content has been continuously increasing. Digital cameras have been integrated to computers, mobile phones and tablets and have become interdependent to many daily activities. As a result, the research fields of digital image processing and computer vision have benefited from content availability and many new research topics have arisen. The goal of this thesis is to tackle the problem of building recognition, i.e., given a query image of a specific building, to retrieve images of the same building within a database. To this goal, we choose to follow a traditional approach of content-based image retrieval.
This thesis aims to recognize and quantify image aesthetics in a certain photography style (bokeh) which is characterized from the level in depth of field.The problem is treated as a task related to image aesthetics quality assessment. In addition we suggest a method to improve active learning strategies for any image classification task using deep active learning with custom and pre-trained CNN model architectures.