Ich seh nicht, daß da was wegoptimiert wird.

Versuch mal die Klammer um #define F_CPU wegzulassen. Bzw funktioniert der Originalcode? Mit 16MHz-Quarz sollte der flott aber noch erkennbar blinken. Ansonsten nur die 1000000 durch ne 16000000 ersetzen.

Funktioniert der Beispielcode von
https://www.roboternetz.de/wissen/in...n_f%C3%BCr_AVR
?

Zuden gibt es einen Fehler inder wait (uint16_t)

https://www.roboternetz.de/wissen/in...-atomarer_Code