Guten Tag liebes Forum,
ich habe allgemeine Fragen zum sogenannten Image-Recognition.
Gegeben sei eine Karte ( Luftbild, mehr oder minder orthogonal ), und eine weitere Karte ( Google Maps, et cetera ) .
Es gilt zu lösen:
Aus diesem einen Luftbild ( aufgenommen mit Webcam, Cam et cetera ) soll determiniert werden, welches Gebiet am passlichsten ist.
Das bedeutet, die Applikation hat 50 Templates ( Google Maps ) und muss nun das Template wiedergeben, dass diesem Luftbild am identischsten ist.
Ich habe mir überlegt, als Erstes extrahiert die Applikation alle jenen Pixel, die keine menschlichen "Errungenschaften" repräsentieren ( Bäume, Gräser, Pflanzen ), sodass menschliche Strukturen als einziges Relevantes als Referenz genommen werden kann.
Dann wollte ich die Straßen und andere rationalen Konstruktionen markieren.
Ich habe mir überlegt, die Applikation mehrere Exemplare von Straßen ( Farbe , Form ) zu offerieren, sodass es erkennen kann, dass Pixel (i, j) eine Straße ist.
Auch habe ich einen Sobel-Operator in Erwägung gezogen.
Schließlich, nach all dieser Abstraktion wird dann das Luftbild mit den Templates parallelisiert.
Folgendes Problem resultiert jedoch:
Wenn das Luftbild nicht orthogonal ist, oder schlimmer, schief ist, sodass eine Straße, die gerade ist, plötzlich eine Diagonale repräsentiert.
Wie würdet ihr dieses spezifische Problem lösen, oder sogar, wie ist mein Ansatz, habt ihr einen anderen Vorschlag?
Ich habe auf meinen Ansatz via OpenCV das sogenannte Bruteforce Matching angewandt...doch der Name wird diesem Verfahren nicht gerecht..
Wenn ich zwei Bilder habe, das Bild a) ist das ganze Bild und b) eine Szene dieses Bild, die im ganzen Bild zu suchen gilt, und das Template rotiere, so wird diese Szene im Input-Bild nicht (mehr) gefunden..
Kennt ihr Algorithmen, die diese Aufgabenstellung erfüllen?
Ich wäre über Referenzen gänzlich erfreut.
Lieben , lieben Dank und einen schönen Tag noch!
ich habe allgemeine Fragen zum sogenannten Image-Recognition.
Gegeben sei eine Karte ( Luftbild, mehr oder minder orthogonal ), und eine weitere Karte ( Google Maps, et cetera ) .
Es gilt zu lösen:
Aus diesem einen Luftbild ( aufgenommen mit Webcam, Cam et cetera ) soll determiniert werden, welches Gebiet am passlichsten ist.
Das bedeutet, die Applikation hat 50 Templates ( Google Maps ) und muss nun das Template wiedergeben, dass diesem Luftbild am identischsten ist.
Ich habe mir überlegt, als Erstes extrahiert die Applikation alle jenen Pixel, die keine menschlichen "Errungenschaften" repräsentieren ( Bäume, Gräser, Pflanzen ), sodass menschliche Strukturen als einziges Relevantes als Referenz genommen werden kann.
Dann wollte ich die Straßen und andere rationalen Konstruktionen markieren.
Ich habe mir überlegt, die Applikation mehrere Exemplare von Straßen ( Farbe , Form ) zu offerieren, sodass es erkennen kann, dass Pixel (i, j) eine Straße ist.
Auch habe ich einen Sobel-Operator in Erwägung gezogen.
Schließlich, nach all dieser Abstraktion wird dann das Luftbild mit den Templates parallelisiert.
Folgendes Problem resultiert jedoch:
Wenn das Luftbild nicht orthogonal ist, oder schlimmer, schief ist, sodass eine Straße, die gerade ist, plötzlich eine Diagonale repräsentiert.
Wie würdet ihr dieses spezifische Problem lösen, oder sogar, wie ist mein Ansatz, habt ihr einen anderen Vorschlag?
Ich habe auf meinen Ansatz via OpenCV das sogenannte Bruteforce Matching angewandt...doch der Name wird diesem Verfahren nicht gerecht..
Wenn ich zwei Bilder habe, das Bild a) ist das ganze Bild und b) eine Szene dieses Bild, die im ganzen Bild zu suchen gilt, und das Template rotiere, so wird diese Szene im Input-Bild nicht (mehr) gefunden..
Kennt ihr Algorithmen, die diese Aufgabenstellung erfüllen?
Ich wäre über Referenzen gänzlich erfreut.
Lieben , lieben Dank und einen schönen Tag noch!
Und Gott alleine weiß alles am allerbesten und besser.