NPU, alespoň dnes, má omezené schopnosti. Je to spíš akcelerátor některých AI operací, jako rozpoznání řeči nebo detekci pozadí pro videohovor. na LLM to nepomůže.
Grafika je něco jiného, potřebujete ale takovou která pojme celý model (a podporuje ji soft, což třeba na ollamu je snad jen nvidia).