Element in Bitmap finden

LaMiy · 7. Januar 2014, 14:33

Mein Vorhaben ist es in einer Bitmap Formen zu finden. (Welche spielt dabei keine Rolle)
Dafür habe ich mir eine Methode geschrieben, die folgendes macht.

Solange einen Pixel weitergehen, bis ein dunkler Pixel gefunden wurde. (Helligkeit wird hier überprüft)
Dieser Pixel ist offenbar der Anfang einer Form
Also gehe ich alle Pixel ab, die mit dieser Form zusammenhängen. (Ich gehe nach links, rechts, oben, unten, diagonal links ...)
Wenn der neue Pixel auch dunkel ist, dann gehe ich wieder in alle Richtungen
Bei diesem Vorgang merke ich mir alle besuchten Pixel, sodass ich sie nicht nochmal besuche
Jeder dunkle Pixel wird in einem Array markiert

Vergleichen kann man dieses Vorhaben mit einer Breitensuche, oder auch Tiefensuche.
Nun zum eigentlichen Problem.
In C# funktioniert der Code einwandfrei. (Breitensuche mit einer Queue und Tiefensuche mit einer Rekursion)
In C++ funktioniert es in der Breitensuche zwar auch, aber es ist extrem langsam und ich weiß nicht woran das liegt.
Hat jemand eine Idee woran das liegen könnte?

Hier die Codeausschnitte und ein paar Bilder einer Leistungsanalyse.

C++ Code

C-Quellcode

// Sucht nach Textelementen
void Map::Search()
{
// Aktuelle Position
int cp = 0;
// Breite und Höhe
int width = this->ptrBmpData->Width;
int height = this->ptrBmpData->Height;
// Neues Array erstellen (0 => nicht besucht 1=> besucht)
std::vector<bool> generalMask(width * height, false);
// Neuen Zeiger erstellen, der auf den ersten Pixel zeigt (alternativ kann auch Buffer benutzt werden)
UINT * scan = (UINT*) ptrBmpData->Scan0;
// Über alle Farbwerte gehen
for (int cp = 0; cp < (width * height); cp ++)
{
// X und Y-Position berechnen
int x = cp % width;
int y = cp / width;
// Wenn der aktuelle Pixel noch nicht besucht wurde und die Helligkeit stimmt
if (!generalMask[cp] == true && this->GetBrightness(*scan) <= this->maxBrightness)
{
// Element, ausgehend vom gefundenen Punkt suchen
StructureElement elem = this->GetElement(generalMask, x , y , width , height);
}
// Als besucht markieren
generalMask[cp] = true;
// Zum nächsten Wert
scan++;
}
}
// Methode um die Position eines Buchstabens zu finden
StructureElement Map::GetElement(std::vector<bool>& generalMask, int originX, int originY, int width, int height)
{
// Maske für die Pixel dieses Buchstabens
//TODO: Eventuell kleiner machen?
std::vector<bool> maskResult(width * height);
// Rechteck für die Ausmaße
Rect rect(width + 1, height + 1, -1, -1);
// Methode aufrufen und Daten in die Variablen laden
GetElementHelper(generalMask,
maskResult,
originX,
originY,
width,
height,
rect);
cout << originX << "/" << originY << "\n";
//Strukturelement zurückgeben
return StructureElement(maskResult,
originX,
originY,
rect.X - rect.Width,
rect.Y - rect.Height);
}
// Rekursive Methode für das Suchen den Positionen und Außmaße
void Map::GetElementHelper(std::vector<bool>& generalMask, std::vector<bool>& bResult, int originX, int originY, int width, int height, Rect bounds)
{
// Neue Queue erstellen. In ihr werden alle noch zu besuchenden Pixel gespeichert
queue<Vector2>* qVectors = new queue<Vector2>;
qVectors->push(Vector2((float)originX, (float)originY));
// Solange etwas in der Qeue ist
while (!qVectors->empty())
{
// Nächsten Wert aus der Queue holen
Vector2 vActual = qVectors->front();
qVectors->pop();
// Wurde der Pixel noch nicht besucht und ist er unterhalb des gewünschten Helligkeitswerts
if (vActual.GetX() < width && vActual.GetY() < height &&
this->GetBrightness(this->Buffer[(int)(vActual.GetY() * width + vActual.GetX())]) <= this->maxBrightness &&
generalMask[(int) (vActual.GetY() * width + vActual.GetX())] == false)
{
// Festlegen der Größe
if (vActual.GetX() < bounds.X)
bounds.X = (int) vActual.GetX();
if (vActual.GetY() < bounds.Y)
bounds.Y = (int) vActual.GetY();
if (vActual.GetX() > bounds.Width)
bounds.Width = (int) vActual.GetX();
if (vActual.GetY() > bounds.Height)
bounds.Height = (int) vActual.GetY();
// Als besucht markieren
generalMask[(int) (vActual.GetY() * width + vActual.GetX())] = true;
// Als Textpixel markieren
bResult[(int) (vActual.GetY() * width + vActual.GetX())] = true;
// Oben und unten
if (originY > 0)
qVectors->push(Vector2(vActual.GetX(), vActual.GetY() - 1));
if (originY + 1 < height)
qVectors->push(Vector2(vActual.GetX(), vActual.GetY() + 1));
if (originX > 0)
{
// Linke Seite
qVectors->push(Vector2(vActual.GetX() - 1, vActual.GetY()));
// Diagonal links
if (originY > 0)
qVectors->push(Vector2(vActual.GetX() - 1, vActual.GetY() - 1));
if (originY + 1 < height)
qVectors->push(Vector2(vActual.GetX() - 1, vActual.GetY() + 1));
}
if (originX + 1 < width)
{
// Rechte Seite
qVectors->push(Vector2(vActual.GetX() + 1, vActual.GetY()));
// Diagonal right
if (originY > 0)
qVectors->push(Vector2(vActual.GetX() + 1, vActual.GetY() - 1));
if (originY + 1 < height)
qVectors->push(Vector2(vActual.GetX() + 1, vActual.GetY() + 1));
}
}
}
delete qVectors;
qVectors = 0;
}

C#

C-Quellcode

public IEnumerable<StructureElement> Search()
{
// Dimension
int width = this._bitmapData.Width;
int height = this._bitmapData.Height;
// Output list
ICollection<StructureElement> elements = new LinkedList<StructureElement>();
// Actual uint position
int cp = 0;
// Generel visited positions
this.generalMask = new BitArray(width * height);
// Pointer at the fist uint
uint* scp = (uint*)_bitmapData.Scan0;
// Create the first coordinate
BitmapCoordinate crd = new BitmapCoordinate(generalMask, scp, width);
// Stick the array
fixed (uint* cb = this.Buffer)
// Step through each pixel
for (uint* cbp = cb, cbdest = cb + this.Buffer.Length; cbp < cbdest; cbp++)
{
// Get x and y from position
int x = cp % width;
int y = cp / width;
//nur nicht bereits besuchte und von weiß abweichende Pixel als Struktur-Anfang feststellen
if (generalMask[cp] == false && this.GetBrightness(*cbp) <= this.maxBrightness)
elements.Add(GetElement(crd, x, y, width, height)); // Die Struktur innerhalb der Bitmap der Liste aller Strukturen hinzufügen
generalMask.Set(cp, true);
cp++; // Increment cp
}
return elements;
}
private StructureElement GetElement(BitmapCoordinate helper, int originX, int originY, int width, int height)
{
// Das Element ausgehend von (originX, originY) suchen
BitArray bResult = new BitArray(width * height);
// Resultrectangle
Rect rct = new Rect() { X = width + 1, Y = height + 1, Right = -1, Bottom = -1 };
// Methode mit den aktuell besuchten Feldern und einem Feld für die Ergebnisse aufrufen
GetElementHelper(helper, bResult, originX, originY, width, height, rct);
//Strukturelement zurückgeben
return new StructureElement(bResult, _bitmap, originX, originY, new Rectangle(rct.X, rct.Y, rct.Right - rct.X, rct.Bottom - rct.Y));
}
private void GetElementHelper(BitmapCoordinate helper, BitArray bResult, int originX, int originY, int width, int height, Rect bounds)
{
// Neue Queue erstellen. In ihr werden alle noch zu besuchenden Pixel gespeichert
Queue<Vector2> qVectors = new Queue<Vector2>();
qVectors.Enqueue(new Vector2(originX, originY));
// Solange etwas in der Qeue ist
while (qVectors.Count > 0)
{
// Nächsten Wert aus der Queue holen
Vector2 vActual = qVectors.Dequeue();
// Wurde der Pixel noch nicht besucht und ist er unterhalb des gewünschten Helligkeitswerts
if (vActual.X < width && vActual.Y < height &&
this.GetBrightness(this.Buffer[(int)(vActual.Y * width + vActual.X)]) <= this.maxBrightness &&
generalMask[(int)(vActual.Y * width + vActual.X)] == false)
{
// Festlegen der Größe
if (vActual.X < bounds.X)
bounds.X = (int)vActual.X;
if (vActual.Y < bounds.Y)
bounds.Y = (int)vActual.Y;
if (vActual.X > bounds.Right)
bounds.Right = (int)vActual.X;
if (vActual.Y > bounds.Bottom)
bounds.Bottom = (int)vActual.Y;
// Als besucht markieren
generalMask[(int)(vActual.Y * width + vActual.X)] = true;
// Als Textpixel markieren
bResult[(int)(vActual.Y * width + vActual.X)] = true;
// Oben und unten
if (originY > 0)
qVectors.Enqueue(new Vector2(vActual.X, vActual.Y - 1));
if (originY + 1 < height)
qVectors.Enqueue(new Vector2(vActual.X, vActual.Y + 1));
if (originX > 0)
{
// Linke Seite
qVectors.Enqueue(new Vector2(vActual.X - 1, vActual.Y));
// Diagonal links
if (originY > 0)
qVectors.Enqueue(new Vector2(vActual.X - 1, vActual.Y - 1));
if (originY + 1 < height)
qVectors.Enqueue(new Vector2(vActual.X - 1, vActual.Y + 1));
}
if (originX + 1 < width)
{
// Rechte Seite
qVectors.Enqueue(new Vector2(vActual.X + 1, vActual.Y));
// Diagonal right
if (originY > 0)
qVectors.Enqueue(new Vector2(vActual.X + 1, vActual.Y - 1));
if (originY + 1 < height)
qVectors.Enqueue(new Vector2(vActual.X + 1, vActual.Y + 1));
}
}
}
}

Codezusatz:
Vector2 : Structure, die einfach einen X und einen Y Wert speichert (vergleichbar mit Point)
Buffer : Farbwerte der Bitmap als UINT
GetBrightness() : Methode zum Auslesen des Helligkeitswerts
StructureElement: Klasse, die einfach Informationen über eine Form festhalten soll
BitmapCoordinate: Klasse, die einfach Informationen über die Bitmap, sowie die "generalMask", also die Maske aller besuchten Pixel festhalten soll.

Was ich mir vorstellen könnte ist, dass das BitArray so viel schneller als vector<bool> ist, mir wurde jedoch gesagt, dass vector<bool> bis auf's letzte optimiert ist.
Ich hoffe dass jemand mir helfen kann und dass ich das Problem verständlich geschildert habe.

~blaze~ · 7. Januar 2014, 16:29

Hi
auf vector<bool> kann man verzichten, indem man direkt auf einem Array operiert. Erzeuge dazu ein Array mit x * y / 32 32-Bit (oder x * y / 64 64-Bit) Ganzzahlen und greife auf das (x, y)-te Element über p = (y * width + x) / 32 (bzw. 64) zu und überprüfe anschließend, ob p & (1 << (y * width + x) % 32) != 0 ist.

Gruß
~blaze~

Gonger96 · 7. Januar 2014, 16:40

Wozu denn so ein Akt ? Ich kann doch besser n vector<> benutzen, als dass ich dieses durch ein Array ersetze und dann daran herumrechnen muss. Das Array spart weder Performance noch Speicher oder hab ich da was falsch verstanden ?

Artentus · 7. Januar 2014, 18:16

Also in .Net ist ein Array performanter und speicherschonender als die List<T>, daher vermute ich einfach mal, dass das auch in C++ gilt (wird ja das gleiche Prinzip sein).

Gonger96 · 7. Januar 2014, 18:21

Ja, in C++ gibts aber auch noch ne list<>. Das gilt aber auch für vector<>, bis auf eine Ausnahme - der vector<bool>. Ein Array braucht pro bool ein Byte, da man minimal nur 1 Byte im Speicher ablegen kann. Ein vector<bool> braucht für jedes Element nur 1 Bit. Es wird ein Byte allokiert und dann solang mit Bits befüllt bis ein neues gebraucht wird, ich denk mal so regelt das BitArray auch.

Ich hab schon etwas an dem Code rumgetestet und bin der Meinung, dass es an der Rekursion liegt. Diese ist auch sehr langsam, nur ich hab keine Ahnung wieso das dann in .Net läuft. Also müsste irgendwo n Fehler drin stecken.

LaMiy · 7. Januar 2014, 18:39

Ich habe es mal so getestet.

C-Quellcode

int width = 2, height = 2;
unsigned int* mask = 0;
mask = new unsigned int[width * height];
mask[(1 * width + 0) / 32] = 1;
int x = 0, y = 1;
unsigned int tmp = mask[(y * width + x) / 32];
if (tmp & (1 << (y * width + x) % 32) != 0)
cout << "Passt";

Ich versuche das mal zu implementieren und melde dann, ob es spürbar schneller ist.

Chrisber · 7. Januar 2014, 18:55

LaMiy schrieb:

Ich versuche das mal zu implementieren und melde dann, ob es spürbar schneller ist.

Es ist deutlich schneller. Es wird noch schneller, wenn du so wenig Aufrufe von new machst wie es geht. new ist teuer!
Siehe auch: de.wikipedia.org/wiki/RAII, obwohl das für deinen Fall wohl nicht geht da der Stack zu klein ist. Aber eigentlich brauchst du new nur ein mal, imho.

RodFromGermany · 8. Januar 2014, 07:00

@LaMiy:: Das sieht ja sehr nach echter Bildverarbeitung aus.
Vielleicht übersdenkst Du Dein Konzept noch mal völlig neu.
Mach Dir eine Reihe von Elementar-Operatoren, z.B. (für SW-Bilder)
Medianfilter (Ausreißer eliminieren)
Gradient
(intelligente) Diskriminierung
Laplacefilter (Kanten finden)
...
desweiteren geeignete Anzeigeoperationen, Histogramm-Korrektur, Falschfarbenbild usw.
---
Und wenn Du ein Bild bearbeitest, wird der bearbeitete Bildinhalt in einen neuen Bildspeicher geschrieben bzw. danach wieder zurückkopiert.
Und mach Dir gleich einen Undo-Operator mit.
So kannst Du Dein Bild "experimentell" prozessieren - nach jedem Schritt anzeigen lassen und sehen, was nun kommen könnte

LaMiy · 8. Januar 2014, 08:08

@RodFromGermany:
Diese Art von Filtern brauche ich wahrscheinlich erst später.
(aber auch dann nur im kleinen)
Die Idee mit dem "Undo" Operator finde ich zu Testzwecken sehr gut, wie genau stellst du dir das vor? Einfach "Unlocken" und wieder Locken?

@all
Habe mich mit @blaze: über seine Variante unterhalten.
Soweit sollte es passen, aber es fliegt 'n StackOverflow.
Jemand eine Idee?

Code

C-Quellcode

// Sucht nach Textelementen
void Map::Search()
{
// Aktuelle Position
int cp = 0;
// Breite und Höhe
int width = this->ptrBmpData->Width;
int height = this->ptrBmpData->Height;
// Neues Array erstellen (0 => nicht besucht 1=> besucht)
unsigned int* mask = 0;
mask = new unsigned int[width * height];
ZeroMemory(mask, width * height);
// Neuen Zeiger erstellen, der auf den ersten Pixel zeigt (alternativ kann auch Buffer benutzt werden)
UINT * scan = (UINT*)ptrBmpData->Scan0;
// Über alle Farbwerte gehen
for (int cp = 0; cp < (width * height); cp++)
{
// X und Y-Position berechnen
int x = cp % width;
int y = cp / width;
int p = mask[(y * width + x) / 32];
int pp = 1 << ((y * width + x) % 32);
int a = p & pp;
int yy = a;
// Wenn der aktuelle Pixel noch nicht besucht wurde und die Helligkeit stimmt
if (a == 0 && this->GetBrightness(*scan) <= this->maxBrightness)
{
// Element, ausgehend vom gefundenen Punkt suchen
StructureElement elem = this->GetElement(mask, x, y, width, height);
}
// Als besucht markieren
mask[(y * width + x) / 32] |= (1 << ((width * y + x) % 32));
scan ++;
}
}
// Methode um die Position eines Buchstabens zu finden
StructureElement Map::GetElement(unsigned int* mask, int originX, int originY, int width, int height)
{
// Maske für die Pixel dieses Buchstabens
//TODO: Eventuell kleiner machen?
unsigned int* maskResult = 0;
maskResult = new unsigned int[width * height];
ZeroMemory(maskResult, width * height);
// Rechteck für die Ausmaße
Rect rect(width + 1, height + 1, -1, -1);
// Methode aufrufen und Daten in die Variablen laden
GetElementHelper(mask,
maskResult,
originX,
originY,
width,
height,
rect);
cout << originX << "/" << originY << "\n";
//Strukturelement zurückgeben
return StructureElement(maskResult,
originX,
originY,
rect.X - rect.Width,
rect.Y - rect.Height);
}
// Rekursive Methode für das Suchen den Positionen und Außmaße
void Map::GetElementHelper(unsigned int* generalMask, unsigned int* bResult, int originX, int originY, int width, int height, Rect bounds)
{
int p = generalMask[(originY * width + originX) / 32];
int pp = 1 << ((originY * width + originX) % 32);
int a = p & pp;
float brightness = this->GetBrightness(this->Buffer[(originY * width + originX)]);
// Wurde der Pixel noch nicht besucht und ist er unterhalb des gewünschten Helligkeitswerts
if (originX < width && originY < height && originY > 0 && originX > 0 &&
brightness <= this->maxBrightness &&
a == 0)
{
// Allocation of the vars
if (originX < bounds.X)
bounds.X = originX;
if (originY < bounds.Y)
bounds.Y = originY;
if (originX > bounds.Width)
bounds.Width = originX;
if (originY > bounds.Height)
bounds.Height = originY;
// Set as visited
int xx = generalMask[(originY * width + originX) / 32];
generalMask[(originY * width + originX) / 32] |= 1 << ((originY * width + originX) % 32);
int xxx = generalMask[(originY * width + originX) / 32];
// Mark as not white pixel
bResult[(originY * width + originX) / 32] |= 1 << ((originY * width + originX) % 32);
// Up and down
if (originY > 0)
GetElementHelper(generalMask, bResult, originX, originY - 1, width, height, bounds);
if (originY + 1 < height)
GetElementHelper(generalMask, bResult, originX, originY + 1, width, height, bounds);
if (originX > 0)
{
// Continue at the left side
GetElementHelper(generalMask, bResult, originX - 1, originY, width, height, bounds);
// Diagonal left
if (originY > 0)
GetElementHelper(generalMask, bResult, originX - 1, originY - 1, width, height, bounds);
if (originY + 1 < height)
GetElementHelper(generalMask, bResult, originX - 1, originY + 1, width, height, bounds);
}
if (originX + 1 < width)
{
// Continue at the right side
GetElementHelper(generalMask, bResult, originX + 1, originY, width, height, bounds);
// Diagonal right
if (originY > 0)
GetElementHelper(generalMask, bResult, originX + 1, originY - 1, width, height, bounds);
if (originY + 1 < height)
GetElementHelper(generalMask, bResult, originX + 1, originY + 1, width, height, bounds);
}
}
}

RodFromGermany · 8. Januar 2014, 08:12

LaMiy schrieb:

wie genau stellst du dir das vor?

Du arbeitest auf einem Array. Mach vor dem Anwenden des Operators eine Kopie vom Feld. Die kannst Du in einer List(Of ) | vector<> speichern und ggf. restaurieren.

LaMiy · 10. Januar 2014, 15:24

So ich habe es nun hiermit gelöst. stackoverflow.com/questions/12…-and-assignment-operators
Das ist im Prinzip die Methode, die blaze vorgeschlagen hat.
Klappt sehr gut, und im direkten Vergleich bekam ich mit der Methode vector<bool> 'nen StackOverflow, während die verlinkte Klasse funktioniert hat.
(Kann eventuell sein, dass ich vector<bool> falsch benutzt habe

)

Element in Bitmap finden

Element in Bitmap finden

C-Quellcode

C-Quellcode

C-Quellcode

LaMiy schrieb:

C-Quellcode

LaMiy schrieb:

Ähnliche Themen

6 Benutzer haben hier geschrieben