Fine-tuning and Distillation of Large Language Models

Anil Turaga • June 5, 2025

Video and reference links for a one hour talk I gave as part of the Dynamic Talk series at Grid Dynamics

Resources for fine-tuning LLMs

Author: Anil Turaga's LinkedIn

Slides: Dynamic Talk on Fine-tuning LLMs – PDF

Libraries for finetuning

Unsloth – Docs
Torchtune – Docs
Axolotl – Docs

Infrastructure

Colab by Google – Free T4 for up to 4 hours/day. colab.research.google.com
RunPod – Wide array of GPU options. runpod.io
Hyperscalers – GPU-enabled ML services on major clouds.
Local – Nvidia GPU equipped machines. macOS support

Example use cases covered in the talk

Continued pre-training for another language – Notebook, Datasets: Wikipedia, Alpaca Korean chat
Supervised fine-tuning for code edit prediction – SFT Notebook, DPO Notebook, Dataset: Zeta
Reinforcement learning with GRPO for writing style – Training Script, Datasets: Style Classification, Chat Questions

OpenAI fine-tuning as a service

Open source models

Vision: Qwen-VL
Reasoning: Qwen-3
Coding: Qwen-Coder

Miscellaneous