Pattern Recognition and Image Processing Group Institute of Visual Computing and Human-Centered Technology |
Former (1990-2021) |
186.841 UE Einführung in die Digitale Bildverarbeitung (EDBV) - Hall of Fame
Best of WS 2014/2015
Image Stitching
Team: Hanna Huber, Sebastian Kirchner, Nikolaus Leopold, Ernad Sehic, Patrick Wahrmann
Das Ziel ist es zwei Bilder mit überlappenden Bildbereichen (also gleiche Szene mit horizontal verschobener Kamera) anhand von in beiden Bildern vorhandenen Bildmerkmalen (Interest Points) zu einem Bildmosaik zusammenzufügen, sodass die zusammengehörenden Interest Points übereinanderliegen.
- Die Bilder werden mittels eines GUIs eingelesen.
- Dann wird eine Bildpyramide (Difference of Gaussian, kurz DoG) für SIFT aufgebaut, mittels wiederholt ausgeführtem Gauss-Filter und Downsampling.
- Mithilfe der Bildpyramide werden Extrempunkte gefunden (Minima und Maxima der DoG Bilder).
- Unpassende Extrempunkte (geringer Kontrast, Kanten) werden entfernt, die verbleibenden Extrema sind die gesuchten Keypoints.
- Für Rotationsinvarianz werden die Keypoint-Umgebungsorientierungen bestimmt.
- In der Folge werden mittels SIFT die Keypoint-Deskriptoren erstellt.
- Korrespondierende Keypoints werden gefunden und zu Merkmalspaaren zusammengefasst.
- Mittels RANSAC (Random Sample Consensus Algorithmus) wird die homographische Transformationsmatrix ermittelt, mit der die Bilder so überandergelegt werden, dass die korrespondierenden Keypoints übereinstimmen.
Ergebnisse:
Malen nach Zahlen
Team: Tristan Bauer, Sarah El-Sherbiny, Patrick Mayr, Robin Melan, Ulrik Schremser
Ziel ist das Ausfüllen eines vorgegebenen Bildes mit Farben. Das Bild wird zuBeginn aus farblosen Flächen gebildet und die Aufgabe besteht darin diese Flächen korrekt auszumalen.Welche Farbe verwendet werden soll, wird durch eine Zahl innerhalb jeder Fläche angegeben.
- Als erstes wird ein Bild mithilfe einer GUI eingelesen. Weiters werden Farben definiert, welche den jeweiligen Zahlen im Bild zugewiesen werden. Auch die Methode, welche zur Zahlenerkennung herangezogen wird, kann in der GUI ausgewählt werden.
- Das eingelesene RGB-Bild wird im Anschluss in ein Binärbild umgewandelt. Dies erfolgt nach der Methode von Otsu. Um auch Bilder mit leichten Helligkeitsunterschieden oder leichtem Rauschen verarbeiten zu können, wird diese Methode lokal auf das Bild angewendet.
- In weiterer Folge werden die, im Binärbild vorhandenen, Vorder- und Hintergrundregionen mittels Connected Component Labeling extrahiert.
- Nun kommt es zum logischen Teil: Es wird erkannt welche Regionen mit welcher
Farbe angemalt werden müssen, sowie Entfernung und Merging von kleinen Regionen.
- Alle Zahlen mussen identifiziert werden. Dies erfolgt mithilfe drei unterschiedlicher Methoden: Template Matching, k-Nearest-Neighbours und Neural Network
- Für jede Zahl wird eine Farbe definiert.
- Die zuvor definierten Farbangaben werden eingelesen.
- Im Originalbild werden die detektierten Regionen, mit den entsprechenden Farben, mittels Region Growing eingefärbt.
- Zum Schluss wird das eingefärbte Bild in der GUI angezeigt. Im Hintergrund wird in Matlab die Dauer aller Funktionen, nach deren erfolgreiche Abarbeitung, ausgegeben.
Ergebnisse:
Contact: Mail: webmaster(at)prip.tuwien.ac.at |
Tel: +43.1.58801.193301 | Fax : no longer available
2014-2020 PRIP, Impressum / Datenschutzerklärung
This page is maintained by Webmaster ( webmaster(at)prip.tuwien.ac.at ) and was last modified on 03. June 2020 20:30
2014-2020 PRIP, Impressum / Datenschutzerklärung
This page is maintained by Webmaster ( webmaster(at)prip.tuwien.ac.at ) and was last modified on 03. June 2020 20:30