Für ein reines Schwarz/Weißbild (also nur Schwarz oder Weiß) dürfte es nicht so schwer werden, da zusammenhängende Objekte einfach zu ermitteln sind, immer den schwarzen Pixeln entlang. Die Form kann man dann gut aus der Kompaktheit, dem Verhältnis zwischen Umfang und Volumen des Objekts, ableiten. Neuronale Netze sind insofern nur sinnvoll, wenn du Translation, Rotation und Skalierung der Objekte ausschließen kannst. Sonst musst du erst die "Ware" aufbereiten, mit den angesprochene Korrelationen beispielsweise. Der Aufwand ist bei Deiner Fragestellung kaum zu vertreten.
mfg
Gast1234