llama.cpp moves MTP sampling to backend

LaunchDevelopers

27 days ago

PR #23287 moves MTP draft path sampling to backend for improved performance. The change optimizes multi-token prediction in speculative decoding.

27 days ago