exllama — это экономичный с точки зрения памяти инструмент для выполнения преобразований лица с помощью моделей LLaMA с использованием квантованных весов, позволяющий выполнять высокопроизводительные задачи NLP на современных графических процессорах при минимальном использовании памяти и поддержке различных аппаратных конфигураций.