Финна настройка на модела Google's Gemma-3-4B-IT с MLX_LM и подготовката му за Ollama

Финното настройване на големи езикови модели (LLMs) става все по-достъпно благодарение на инструменти като MLX-LM, който е оптимизиран за Apple Silicon. В тази статия ще направим финна настройка на базовия модел Google Gemma-3-4B-IT с помощта на персонализиран датасет, сливане на адаптерите и конвертиране на резултата във формат GGUF за използване с Ollama. Ще разгледаме основните стъпки: изтегляне на базовия модел, финна настройка, сливане, работа с токенайзера, конвертиране към GGUF и конфигуриране на Modelfile за Ollama. Предварителните условия включват Mac от M-серията, инсталиран MLX_LM, регистрация в Hugging Face и Llama.cpp за етапа на конвертиране. Да започваме! Стъпка 1: Изтегляне на базовия модел от Hugging Face Преди да можете да настроите модела, трябва да изтеглите базовия Google Gemma-3-4B-IT модел от Hugging Face. Имайте предвид, че Gemma моделите са с ограничен достъп, което означава, че трябва да приемете лицензионните условия на страницата на модела (https://huggingfa...

5. Големият Хадрон колайдер - 2008 Тайм


Ако някой изобрети супер икономичен авотмобил, който има разход на гориво 1л/100км. и същия този автомобил спука гума, никой няма да каже, че автомобила е бил неуспешен. Същото се случва и с големият Хадрон колайдер, най-големия в света ускорител на частици, който беше стартиран през септември, работи около 10 дни и след това се наложи да бъде изключен до следващата пролет, заради прегрял кабел. Мега машината ще ускорява протони в противоположни посоки с приблизително скороста на светлината и ще ги разбива един в друг за около 1 – 6000 от секундата в опит да отговори на големи въпроси, като защо съществува масата и дали вселената има други измерения за които ние не знаем. Ако ще отнеме само няколко месеца за да открием това, какво толкова?

Коментари

Популярни публикации от този блог

Поддръжка и настройка на хидрофор

Родопски диалектни думи

Памук заседнал в ухото