Beim PC sind die Prozessoren so weit, das die mehr als einen Befehl pro Zyklus können. Die üblichen µCs können das aber nicht, da ist man eher noch bei mehreren Zyklen pro Befehl. Da gibt es aber ggf. welche die einem einige Aufgaben durch spezielle Hardware abnehmen können (z.B. UART, Input Capture mit FIFO, "DMA"-Funktionen ).
Durch die breiteren Register werden einige Aufgaben schneller, aber nicht alle. Hier hilft es vermutlich schon, weil die Auflösung des Timers auch eher bei 16-32 Bit liegt.