5.4 Hugging Face Pratik — Bölüm 5 İmza Sayfası (Mini LoRA Eğitimi)¶

Kim için: 🟢 başlangıç 🔵 iş 🟣 kişisel

⏱️ Süre: ~50 dakika

📋 Önkoşul: 5.1 + 5.2 + 5.3 okundu; hiperparametre mantığı elinde. Google hesabı (Colab için), HuggingFace hesabı (model indirme + adaptör yükleme).

🎯 Çıktı: **İlk LoRA adaptörün Colab T4/L4 üstünde eğitildi** — Qwen3-1.7B veya Llama 3.2 1B Instruct + 50 Türkçe örnek + ~20-30 dakikada tamamlandı (Unsloth ile 10-15 dk). Temel model ile ince ayarlı modeli karşılaştıran testin var. HuggingFace Hub'a yüklendi (herkese açık veya özel). **3. pratik imza** (9.4 RAG + 9.5 Agent + 5.4 ince ayar). Mülakatta "İnce ayar denediniz mi?" sorusuna **evet + somut demo**.

Yabancı kelime mi gördün?

Colab = Google Colab, ücretsiz bulut GPU not defteri. TrainingArguments = HF Transformers'taki eğitim yapılandırma sınıfı. Trainer = eğitim yöneticisi; veri + model + ayar verince çalıştırır. SFTTrainer = TRL kütüphanesinin instruction tuning'e özel eğiticisi, sohbet şablonunu otomatik halleder. Gradient checkpointing (gradyan kontrol noktası) = eğitim belleğini ~%30 düşürür, süre ~%20 artar. HuggingFace Hub'a yüklemek (push) = adaptörü huggingface.co hesabına model sürümü olarak göndermek. JSONL (JSON Lines — JSON satırları) = her satırı bağımsız JSON olan dosya biçimi; veri seti taşımak için yaygın. Sentetik veri = LLM ile üretilmiş eğitim verisi; küçük gerçek veri eksiğini doldurmak için 2025'ten itibaren standart yöntem (Anthropic, Microsoft Phi-4 raporları doğrular). Token/sn = eğitim hızı ölçütü; T4'te ~5-10 token/sn, A100'de ~50-100, H100'de ~150-300.

Neden bu sayfa?¶

5.1-5.3 teorikti. Bu sayfa gerçek eğitim — Colab'i aç, 30-60 dakika ayır, kendi ince ayarlı adaptörün elinde. Bitişte:

GitHub profilinde "first LoRA adapter" commit'i
HuggingFace Hub'da kendi model sayfan (herkese açık) — CV'de link
Mülakatta "İnce ayar pratiği var mı?" sorusu → "Evet, Qwen 3-1.7B üstünde 50 örnek LoRA, repo şu" cevabı

İkincisi: Bu sayfa platformun 3. pratik imza sayfası. 9.4 rag-chatbot + 9.5 icerik-ozet-agent + 5.4 mini ince ayar (bu tur). Her üçü pytest kanıtlı, çalışır kod. Öğrenci 3 kanıtlanabilir proje ile iş başvurusu yapar.

Üçüncüsü: İnce ayar hiç yapmama yerine küçük bir deney zihniyeti verir. Mülakatçı için: "gerekmeyeceğini bilen ama pratik göstermek için küçük deney yapmış" aday > "hiç denemedim" diyen aday.

Hedef — ne yapacağız¶

50 örnekli Türkçe yönerge ayarı (instruction tuning) denemesi:

Model: Qwen3-1.7B-Instruct (2026'da güncel; alternatif: Qwen2.5-1.5B-Instruct ya da Llama 3.2 1B-Instruct — Türkçe iyi, küçük, hızlı)
Veri: 50 örnek — "müşteri destek asistanı" biçiminde (sen üreteceksin veya Claude ile sentetik üreteceksin)
Yöntem: QLoRA (4-bit niceleme + LoRA adaptör) + isteğe bağlı Unsloth ile 2-5× hızlandırma
Hiperparametreler: 5.3'te öğrendiğin tercih (r=8, QKVO, LR 2e-4, 2-3 epoch, optim="adamw_8bit", bf16=True)
GPU: Colab T4/L4 (ücretsiz katman, günlük yaklaşık 4-6 saat işlem birimi kotası)
Süre: ~20-30 dakika eğitim (Unsloth ile 10-15 dk) + 10 dakika kurulum + 10 dakika test = 40-50 dakika
Çıktı: HuggingFace Hub'da KULLANICI_ADI/qwen-tr-musteri-destek-v1 adaptörü + model kartı (model card) Türkçe

Uyarı: Bu üretim modeli değil — 50 örnek deney seviyesi. Amaç: pratik refleks + ilk ince ayar deneyimi + CV sinyali. Üretim için 500-2000 kaliteli örnek + DPO sonrası tercih ayarı + 2 epoch düşük LR + barındırılan inference altyapısı gerekir.

Bu sayfanın ekosistemi¶

🗺️ Ekosistem — LoRA eğitimi sırasında kim ne yapar

flowchart LR
    S["👤 Sen\n(Colab sekmesi)"]
    COLAB["📓 Google Colab\nT4 GPU (ücretsiz)"]
    VERI["📄 50 örnek\nJSONL Türkçe"]
    HF_BASE["🤗 HF Hub\nQwen 2.5-1.5B base"]
    TRL["⚙️ PEFT + TRL\nQLoRA + SFTTrainer"]
    HF_OUT["🤗 HF Hub\nsenin adapter'ın"]
    TEST["🧪 Test hücresi\nbase vs FT"]

    S -->|"1. notebook aç"| COLAB
    S -->|"2. veri upload"| VERI
    VERI --> COLAB
    COLAB -->|"3. from_pretrained"| HF_BASE
    HF_BASE --> TRL
    COLAB -->|"4. trainer.train"| TRL
    TRL -->|"5. ~20 dk eğitim"| TRL
    TRL -->|"6. push_to_hub"| HF_OUT
    COLAB --> TEST
    TEST -->|"7. 3 soru × 2 model"| S

    style S fill:#ddd6fe,stroke:#7c3aed
    style COLAB fill:#dbeafe,stroke:#2563eb
    style TEST fill:#dbeafe,stroke:#2563eb
    style HF_BASE fill:#fed7aa,stroke:#ea580c
    style HF_OUT fill:#fed7aa,stroke:#ea580c
    style TRL fill:#fed7aa,stroke:#ea580c
    style VERI fill:#fef3c7,stroke:#ca8a04

Aktör	Rol	Nerede
👤 Sen	Notebook'u çalıştır, sonucu doğrula	Tarayıcı sekmesi
📓 Google Colab	T4 GPU + Python runtime (ücretsiz ~12 saat)	bulut
📄 50 örnek JSONL	Senin hazırladığın Türkçe instruction verisi	Colab FS upload
🤗 HF Hub (base)	Qwen 2.5-1.5B-Instruct ağırlıkları (~3 GB)	huggingface.co
⚙️ PEFT + TRL	QLoRA config + SFTTrainer (auto chat template)	Colab pip
🤗 HF Hub (adapter)	Eğittiğin adapter (~30 MB) — CV link	huggingface.co/USERNAME
🧪 Test hücresi	Aynı sorularda base vs FT model karşılaştırma	Notebook son hücre

Burada olan nedir: Colab GPU'yu rent ediyor, HF Hub model deposunu, PEFT/TRL eğitim orchestrator'ı. Sen sadece veri + config veriyorsun. Çıktı: HF Hub'da senin adına adapter + CV sinyali. Toplam maliyet: $0.

Adım 0 — Hazırlık (10 dk)¶

Google Colab hesabı¶

colab.research.google.com — Google hesabıyla giriş. Ücretsiz katmanda T4 veya L4 GPU çıkar (kullanılabilirlik değişken; 2024 sonu Google ücretsiz katmanı kısıtladı, günlük kota var).

Runtime seçimi: 1. Üst menü → Runtime → Change runtime type 2. Hardware accelerator: T4 GPU (ya da uygunsa L4 GPU) 3. Save

Hugging Face hesabı¶

huggingface.co/join — ücretsiz hesap.

Access token: 1. Settings → Access Tokens → New token 2. Name: colab-ft, Type: Write (model push için) 3. Token'ı kopyala (bir kere göreceksin)

Veri hazırlama — 50 örnek¶

50 Türkçe müşteri destek örneği. Gerçek data yoksa sentetik üret (Claude Sonnet ile):

Prompt: Sen 50 örnekli Türkçe müşteri destek asistanı dataset'i üret.
Her örnek JSON: {"user": "soru", "assistant": "kurumsal samimi cevap"}

Konular: kargo takip, iade, ürün bilgi, şikayet, memnuniyet.
Ton: samimi ama profesyonel, "merhaba efendim" değil, "merhaba", max 3 cümle cevap.

Sadece 50 JSON satırı döndür, başka metin yok.

Claude ~30 saniyede 50 örnek üretir. musteri-destek-50.jsonl olarak kaydet.

Adım 1 — Colab kurulum (5 dk)¶

Yeni Colab notebook aç, aşağıdaki hücreleri sırayla çalıştır.

Hücre 1: Kütüphane kurulum¶

!pip install -q -U \
    transformers==5.6.2 peft==0.19.1 trl==1.2.0 \
    datasets==4.8.4 accelerate==1.13.0 bitsandbytes==0.49.2 \
    huggingface_hub

~2 dakika sürer. (Sürümler 2026 Nisan'da en günceller; sonraki seansta pip install -U paket_adi ile yenisini çekersin. Ana sürümler değişirse — örn. transformers 6.x — kod kırılmalarına dikkat.)

from huggingface_hub import login
login(token="hf_XXXXX")  # senin token'ın

Hücre 3: GPU kontrolü¶

import torch
print(f"CUDA: {torch.cuda.is_available()}")
print(f"GPU: {torch.cuda.get_device_name(0)}")
print(f"VRAM: {torch.cuda.get_device_properties(0).total_memory / 1e9:.1f} GB")

Çıktı (örnek): CUDA: True, GPU: Tesla T4, VRAM: 15.8 GB — T4 ücretsiz katmanı. L4 düşerse: GPU: NVIDIA L4, VRAM: 22.1 GB. P100 / V100 nadir; çıkmaz.

Adım 2 — Veri yükle (2 dk)¶

Hücre 4: Veri upload¶

Colab sol panel → dosya ikonu → musteri-destek-50.jsonl'i sürükle-bırak.

Hücre 5: Dataset yükle¶

from datasets import load_dataset

# JSONL formatında oku
dataset = load_dataset("json", data_files="musteri-destek-50.jsonl", split="train")
print(f"Örnek sayısı: {len(dataset)}")
print(f"İlk örnek: {dataset[0]}")

# Train/test 90/10 split
split = dataset.train_test_split(test_size=0.1, seed=42)
train_ds, test_ds = split["train"], split["test"]
print(f"Train: {len(train_ds)}, Test: {len(test_ds)}")

45 train + 5 test.

Hücre 6: Chat template format¶

def format_example(example):
    """Qwen chat template'ine uygun format."""
    return {
        "text": (
            f"<|im_start|>user\n{example['user']}<|im_end|>\n"
            f"<|im_start|>assistant\n{example['assistant']}<|im_end|>"
        )
    }

train_ds = train_ds.map(format_example)
test_ds = test_ds.map(format_example)
print(train_ds[0]["text"])

Adım 3 — Model yükle QLoRA config (5 dk)¶

Hücre 7: Base model + 4-bit quantization¶

from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig
import torch

MODEL_NAME = "Qwen/Qwen3-1.7B-Instruct"  # 2026 öntanımlı; alternatif: "Qwen/Qwen2.5-1.5B-Instruct" (eski) veya "meta-llama/Llama-3.2-1B-Instruct"

# QLoRA 4-bit NF4 config
bnb_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_quant_type="nf4",          # NF4 format (5.3'te anlattık)
    bnb_4bit_compute_dtype=torch.float16,
    bnb_4bit_use_double_quant=True,      # double quantization
)

tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
tokenizer.pad_token = tokenizer.eos_token

model = AutoModelForCausalLM.from_pretrained(
    MODEL_NAME,
    quantization_config=bnb_config,
    device_map="auto",
    trust_remote_code=True,
)

print(f"Model memory: {model.get_memory_footprint() / 1e9:.2f} GB")

Çıktı: Model memory: ~1.0 GB (1.5B model 4-bit'te).

Hücre 8: LoRA config¶

from peft import LoraConfig, get_peft_model, prepare_model_for_kbit_training

# k-bit eğitim için hazırla
model = prepare_model_for_kbit_training(model)

# LoRA config — 5.3'teki tercihlerimiz
lora_config = LoraConfig(
    r=8,                                # rank
    lora_alpha=16,                      # 2 × r
    target_modules=[                    # QKVO preset
        "q_proj", "k_proj", "v_proj", "o_proj"
    ],
    lora_dropout=0.05,
    bias="none",
    task_type="CAUSAL_LM",
)

model = get_peft_model(model, lora_config)
model.print_trainable_parameters()

Çıktı örneği: trainable params: 2,179,072 || all params: 1,546,893,824 || trainable%: 0.1409%

Yani 1.54 milyar parametrenin sadece %0.14'ü eğitilir — 2.2 milyon. Bu LoRA'nın özü.

Adım 4 — Eğitim (20 dk)¶

Hücre 9: TrainingArguments¶

from transformers import TrainingArguments

training_args = TrainingArguments(
    output_dir="./qwen-tr-destek-lora",
    num_train_epochs=3,                      # 3 epoch (50 örnek için OK)
    per_device_train_batch_size=2,
    gradient_accumulation_steps=8,           # efektif batch = 16
    gradient_checkpointing=True,             # memory %30 tasarruf
    learning_rate=2e-4,
    warmup_ratio=0.03,
    lr_scheduler_type="cosine",
    logging_steps=5,
    save_strategy="epoch",
    eval_strategy="epoch",
    fp16=True,                               # T4 için mixed precision
    optim="paged_adamw_8bit",                # bitsandbytes 8-bit optimizer
    report_to="none",                        # wandb istersen "wandb"
    push_to_hub=False,                       # sonunda manuel push
)

Hücre 10: SFTTrainer¶

from trl import SFTTrainer

trainer = SFTTrainer(
    model=model,
    args=training_args,
    train_dataset=train_ds,
    eval_dataset=test_ds,
    dataset_text_field="text",
    max_seq_length=512,
    tokenizer=tokenizer,
)

print("Eğitim başlıyor...")
trainer.train()

Eğitim başlar:

 5/24 [01:10<04:12, 13.0s/it, loss=3.21]
10/24 [02:20<03:00, 12.9s/it, loss=2.45]
15/24 [03:30<02:00, 13.3s/it, loss=1.82]
20/24 [04:40<01:00, 13.2s/it, loss=1.43]
24/24 [05:30<00:00, 13.1s/it, loss=1.21]

epoch 1/3 validation loss: 1.38
...

Loss 3.21 → 1.21 düştü (3 epoch). Validation loss da düşüyor → overfitting yok.

Toplam süre: ~15-25 dk (T4 hızına göre).

Hücre 11: Adapter kaydet¶

model.save_pretrained("./qwen-tr-destek-lora-final")
tokenizer.save_pretrained("./qwen-tr-destek-lora-final")

# Boyut kontrolü
import os
for f in os.listdir("./qwen-tr-destek-lora-final"):
    size = os.path.getsize(f"./qwen-tr-destek-lora-final/{f}") / 1024
    print(f"{f}: {size:.1f} KB")

Çıktı: adapter_model.safetensors: ~8 MB (orijinal 1.5B model 3 GB; adapter 400× küçük).

Adım 5 — Test (5 dk)¶

Hücre 12: Base vs fine-tuned karşılaştırma¶

from transformers import pipeline

test_sorular = [
    "Siparişim ne zaman gelecek?",
    "İade yapmak istiyorum, nasıl yapılır?",
    "Ürün bozuk geldi, ne yapmalıyım?",
]

# Fine-tuned model (şu an yüklü)
ft_pipe = pipeline("text-generation", model=model, tokenizer=tokenizer, max_new_tokens=100)

print("=== FINE-TUNED ===")
for soru in test_sorular:
    prompt = f"<|im_start|>user\n{soru}<|im_end|>\n<|im_start|>assistant\n"
    cevap = ft_pipe(prompt, do_sample=False)[0]["generated_text"]
    print(f"\nSoru: {soru}")
    print(f"Cevap: {cevap[len(prompt):]}")

Hücre 13: Base model aynı sorular¶

# Adapter'ı kaldır, base model'i yükle
from transformers import AutoModelForCausalLM

base_model = AutoModelForCausalLM.from_pretrained(
    MODEL_NAME,
    quantization_config=bnb_config,
    device_map="auto",
)
base_pipe = pipeline("text-generation", model=base_model, tokenizer=tokenizer, max_new_tokens=100)

print("=== BASE MODEL ===")
for soru in test_sorular:
    prompt = f"<|im_start|>user\n{soru}<|im_end|>\n<|im_start|>assistant\n"
    cevap = base_pipe(prompt, do_sample=False)[0]["generated_text"]
    print(f"\nSoru: {soru}")
    print(f"Cevap: {cevap[len(prompt):]}")

Kıyas — neyi arıyorsun?

Ton: FT model daha "müşteri destek"vari mi? Base "nötr asistan" mı?
Format: FT model kısa, yapılandırılmış mı? Base uzun, genel mi?
Domain dili: Kargo/iade terimleri daha doğal mı?

Örnek karşılaştırma (gerçek T4 çıktısı gibi):

Soru: Siparişim ne zaman gelecek?

BASE: Siparişinizin teslimat süresi çeşitli faktörlere bağlıdır, 
      örneğin ürünün türü, depo konumu, kargo firması... (uzun genel)

FINE-TUNED: Merhaba, sipariş numaranızı paylaşırsanız takip durumunu 
            kontrol edip size ne zaman geleceğini söyleyebilirim. (kısa, operatif)

FT model "müşteri destek" tonunu yakalamış. Base daha "genel" kalıyor.

Adım 6 — HF Hub push (5 dk)¶

Hücre 14: HF Hub'a yükle¶

from huggingface_hub import HfApi

api = HfApi()
USERNAME = "senin-hf-username"  # değiştir
REPO = f"{USERNAME}/qwen-tr-musteri-destek-v1"

# Repo oluştur
api.create_repo(repo_id=REPO, private=False, exist_ok=True)

# Adapter'ı push et
model.push_to_hub(REPO)
tokenizer.push_to_hub(REPO)

print(f"Model: https://huggingface.co/{REPO}")

Çıktı: https://huggingface.co/USERNAME/qwen-tr-musteri-destek-v1

Hücre 15: Model card yaz¶

HF Hub repo sayfasına git → README.md → düzenle:

---
license: apache-2.0
base_model: Qwen/Qwen2.5-1.5B-Instruct
tags:
  - lora
  - qlora
  - turkish
  - customer-support
language:
  - tr
---

# qwen-tr-musteri-destek-v1

İlk LoRA adapter deneyi — Qwen2.5-1.5B-Instruct base model üstünde
50 Türkçe müşteri destek örneği ile 3 epoch QLoRA eğitim.

## Eğitim
- GPU: Google Colab T4 (ücretsiz)
- Süre: ~20 dakika
- Örnek sayısı: 45 train + 5 test
- Rank: 8, Target modules: QKVO
- LR: 2e-4, 3 epoch

## Kullanım

\`\`\`python
from peft import PeftModel
from transformers import AutoModelForCausalLM, AutoTokenizer

base = AutoModelForCausalLM.from_pretrained("Qwen/Qwen2.5-1.5B-Instruct")
tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen2.5-1.5B-Instruct")
model = PeftModel.from_pretrained(base, "USERNAME/qwen-tr-musteri-destek-v1")

prompt = "Siparişim ne zaman gelir?"
...
\`\`\`

## Değerlendirme

Bu **deney seviyesi** bir FT — üretim kullanımı için değil.
50 örnek sınırlı; gerçek proje 500-2000 örnek gerektirir.

## Kaynak

MühendisAl platform 5.4 imza projesi:
https://wiki.oluk.org/platform/bolum-5/04-hf-pratik/

LinkedIn'de — "İlk LoRA adapter'ım yayında: [HF link]. Platform Bölüm 5.4 pratik imza. QLoRA + Qwen + Türkçe" post'u at.

Adım 7 — Değerlendirme + imza kanıtı¶

4 CTO kanıtı disiplin¶

Platform'un diğer imza sayfalarında (9.4, 9.5, 3.5) 4 CTO kanıtı vardı: AST + ruff + pytest + pin. FT için eşdeğer:

Notebook çalıştı — tüm hücreler hata vermeden geçti ✓
Model dosyası oluştu — adapter_model.safetensors ~8 MB ✓
Evaluation passed — base vs FT karşılaştırma farklı çıktı üretti ✓
HF Hub'a push edildi — public URL ile erişilebilir ✓

Model card + README disiplin¶

Model card (HF Hub README) şeffaf — deney seviyesi belirtildi, üretim iddia edilmedi. Telif uyum (Apache 2.0 base model).

CTO tuzakları — 8 yaygın ince ayar hatası (pratik)¶

#	Tuzak	Sonuç	Doğru
1	50 örnek "çalıştı" = üretim	Deney ≠ üretim	README'de açıkça "deney seviyesi" yaz
2	Değerlendirme atlama	"İyi mi" bilinmez	Temel ile ince ayar karşılaştırması zorunlu
3	HF Hub'a yüklemeden dizüstüne kaydetme	Kaybolur	Git veya HF Hub sürümleme
4	Model kartı yok	Kimse anlamaz	README şeffaf + temel model + lisans
5	Telifli veri kullanımı	Yasal risk	Sentetik veya lisanslı veri
6	Temel model lisansı uyumsuz	Apache 2.0 tamam, kapalı yasak	Lisans kontrolü zorunlu
7	Colab kapattığında model kayıp	Runtime kopunca disk temizlenir	HF Hub'a yükledikten sonra güvende
8	Sonraki iterasyon yok	Tek deney → unut	v1 sonrası v2 dene, birikim sağla

Tipik Colab + LoRA hataları — şu durum şu çözüm

Hata	Sebep	Çözüm
`Disconnected. Reconnect.` (eğitimin ortasında)	Ücretsiz katman 90 dk inaktif kuralı veya kota	Sayfayı sık etkin tut; `Runtime → Manage sessions → Terminate` sonra yeniden başla; alternatif Colab Pro
`RuntimeError: CUDA out of memory`	T4'te model batch + adaptör + gradyan sığmıyor	`per_device_train_batch_size=1`; `gradient_accumulation_steps=16`; `gradient_checkpointing=True`
`403 Forbidden` (model indirme)	Llama gibi modeller HF'te onay ister	Model sayfasında "Access" → form doldur → onay bekle (genelde anlık)
`OSError: ... shared memory`	Colab `/dev/shm` küçük	`dataloader_num_workers=0` set et
`push_to_hub` başarısız	Token write yetkisi yok	HF token'ı Write seçenekliyle yeniden oluştur
İlk hücre 5 dakika takılı kaldı	Pip resolver bağımlılık çözümlüyor	Sabırlı ol; sürüm pin'le hızlanır (yukarıdaki blok)

Anthropic ekosistemi — bu deneyim CV'de nasıl geçer¶

🤖 Anthropic-öz: FT deneyiminden Anthropic kariyerine köprü

Bu sayfada yaptığın iş Anthropic'te Applied AI Engineer mülakatında doğrudan değer üretir:

Mülakatta "FT denediniz mi?"¶

Zayıf aday: "Hayır, sadece okudum."

Orta aday: "RAG kullandım, FT'ye girmedim."

Güçlü aday: "Evet, Qwen2.5-1.5B üstünde QLoRA denedim — [HF link]. 50 örnekli Türkçe müşteri destek. 20 dakikada T4'te tamamlandı. Base vs FT farkını evaluation ile gösterdim. Ama projede RAG tercih ettim çünkü veri değişim sıklığı haftalık — FT bakım yükü ağır."

Neden güçlü: Teori + pratik + karar refleksi birlikte.

Portföy güncellemesi¶

9.7 Portföy Paketleme sayfasında 3 proje vardı:

9.4 RAG Chatbot (web servisi)
9.5 Agent Otomasyon (async pipeline)
... üçüncü ne?

Şimdi: 5.4 Mini FT Deneyi — AI Engineer araç kutusu tamamlanır (RAG + Agent + FT).

LinkedIn Featured bölümünde:

[GitHub] rag-chatbot — web
[GitHub] icerik-ozet-agent — async
[HuggingFace] qwen-tr-musteri-destek-v1 — FT

Bu üçü bir araya gelince comprehensive AI engineering sinyali verir.

Anthropic Applied AI Engineer rol gereksinimi¶

Anthropic iş ilanlarında "experience with LLM fine-tuning" kriteri bazen çıkar. "Çalıştığım şirkette yaptım" demesen bile "kendi deney projem" diyebilirsin.

Uyarı: Anthropic kendisi Claude'u FT etmeye izin vermese de anlayış + alternatif model tercihi refleksi değerli. Senin "Claude + RAG %80, Llama + FT niş" üçgeni tam bu anlayışı gösterir.

Uzun vadeli yol¶

Bu basit 50-örnek deney başlangıç. İlerleyen aylarda:

Veri artır — 500-2000 kaliteli örneğe çıkar
Alternatif modeller — Qwen3, Llama 3.⅔.3, Gemma 3 dene
Domain odağı — senin niş alanın için adapter (hukuk, sağlık, eğitim)
Evaluation derinleş — MMLU, HellaSwag benchmark + domain-specific

3 ay içinde FT uzmanlığın gerçek seviyeye çıkar. Platform sonrası bu yolu takip et.

Platform içinde bu sayfanın yeri¶

Bu sayfa Bölüm 5'in pratik imza sayfası. Kavramsal imza 5.2'ydi (karar ağacı). Platform'daki 4. imza:

#	İmza sayfası	Tip	Çalışır kod
1	3.5 Semantic Search	Kavramsal + pratik	examples/semantic-search
2	9.4 Portföy Projesi 1 (RAG)	Pratik	examples/rag-chatbot
3	9.5 Portföy Projesi 2 (Agent)	Pratik	examples/icerik-ozet-agent
4	5.2 Karar Ağacı	Kavramsal	-
5	5.4 HF Pratik (bu sayfa)	Pratik	Colab notebook + HF Hub
6	8.6 Production Checklist	Kavramsal + proje	CHECKLIST.md şablon
7	9.7 Portföy Paketleme	Kavramsal	-
8	10.5 Platform Kapanışı	Pedagojik	-

8 imza sayfası platform omurgası. Öğrenci bu 8'i tamamladığında AI Engineer araç kutusu nesnel olarak hazır.

Çıktı kanıtları — büyük kanıt¶

📏 Çıktı — HF Hub URL'in

Tek kanıt, büyük değer:

HuggingFace Hub'da https://huggingface.co/USERNAME/qwen-tr-musteri-destek-v1 URL'in aktif. Sayfada:

✓ Model card şeffaf (deney seviyesi belirtilmiş)
✓ Base model + license doğru
✓ Kullanım örneği kod bloğu
✓ Eğitim detayları (hyperparam + veri)

Paylaş:

LinkedIn post'u (Hafta 6-7 content takvimi)
GitHub profile README'ye ekle
CV'ye "HuggingFace Profile: [link]" satırı
Portföy paketleme 3. madde

Görev — 45 dk Colab'de eğit¶

🎯 Görev — ilk LoRA adapter'ın HF Hub'da

Google Colab aç, T4 runtime seç.
HF hesabı + write token al.
50 Türkçe örnek hazırla (Claude ile 30 sn üret).
Yukarıdaki 15 hücreyi sırayla çalıştır.
Eğitim bitince HF Hub'a push.
Model card yaz (şeffaf).
LinkedIn post taslağı hazırla.

Başarı kriteri: 45 dakika sonunda HF Hub'da kendi adapter'ın public URL ile erişilebilir. Base vs FT karşılaştırma çıktısı ekran görüntüsü kanıt.

Başaramadıysan: Colab T4 kuyruğu (ücretsiz katman) yoğun olabilir — Runtime → Manage sessions → Terminate sonra tekrar dene. Alternatif: Llama 3.2 1B-Instruct ya da Qwen 2.5-0.5B-Instruct ile deneme (daha küçük, T4'te daha rahat). Veya Colab Pro ($10/ay) ile L4/A100 erişimi.

🔗 Birlikte okuma — neden ne oldu

**A → B:** 50 örnekli Türkçe instruction FT hedef; Qwen2.5-1.5B + QLoRA + T4. Bu yüzden **küçük model + az veri = erişilebilir başlangıç.**
**B → C:** Colab kurulum: transformers 5.6.1 + peft 0.19.1 + trl 1.2.0 + bitsandbytes. Bu yüzden **pin'li sürümler kırılmayı önler.**
**C → D:** Veri sentetik üretim (Claude ile 30 sn); chat template format (Qwen). Bu yüzden **gerçek veri yoksa Claude üretir.**
**D → E:** BitsAndBytesConfig NF4 + double quantization; model 1 GB'a düşer. Bu yüzden **4-bit quantization T4'ü kurtarır.**
**E → F:** LoRA config r=8 + QKVO target; %0.14 parametre eğitilir. Bu yüzden **tam FT'nin binde biri parametre.**
**F → G:** TrainingArguments: LR 2e-4, 3 epoch, batch 2 × accumulation 8 = 16. Bu yüzden **efektif batch boyutu bellek sınırını aşar.**
**G → H:** SFTTrainer orchestrator; 15-25 dakika eğitim; loss 3.2 → 1.2. Bu yüzden **loss düşüşü öğrenmenin kanıtı.**
**H → I:** Base vs FT karşılaştırma test; domain ton + format farkı görünür. Bu yüzden **karşılaştırma olmadan iyileşme bilinmez.**
**I → J:** HF Hub push + model card + apache-2.0 license + şeffaf README. Bu yüzden **portföy kamuya açık olunca değer kazanır.**
**J → K:** 4 CTO kanıtı: notebook çalıştı + adapter file + evaluation + HF URL. Bu yüzden **kanıtsız iddia iş görüşmesinde geçmez.**
**K → L:** LinkedIn post + portföy 3. madde + CV HF link. Bu yüzden **teknik çalışma görünür olmalı.**

Sonuç: Bölüm 5 TAM KAPANDI (5/5). Bu 3. pratik imza + 5. genel imza sayfası platformda. AI Engineer araç kutusun 3 deneyle sağlam: RAG (9.4) + Agent (9.5) + FT (5.4). Sonraki (Bölüm 7): Multimodal — vision + audio.

➡️ Sonraki adım

Bölüm 5 KAPANDI. Sonraki bölümler:

Bölüm 7 Multimodal → — vision + audio (sonraki teknik bölüm)
Bölüm 9.6 Multimodal imza — Bölüm 7 sonrası
Bölüm 10 — Kariyer — kapalı ama sürekli referans

← 5.3 LoRA ve QLoRA | Bölüm 5 girişi | Ana sayfa

Pekiştirme: Hugging Face PEFT LoRA tutorial + Unsloth notebooks + TRL SFTTrainer docs. Üçü toplam 3 saat; 2. LoRA denemeni daha güvenle yaparsın.

MühendisAl Platform — Sözlük (Glossary)¶

¶

Bu dosya pre_build.py hook'u tarafından her sayfaya otomatik eklenir.¶

Markdown `abbr` extension bu tanımları alıp terimin her geçtiği yerde¶

HTML `<abbr title="...">` sarımı yapar → MkDocs Material tooltip gösterir.¶

¶

DİKKAT: abbr case-sensitive. "Agent" tanımı "agent" kelimesini sarmaz.¶

Bu yüzden hem büyük hem küçük harf varyantları ayrı tanımlanır.¶

¶

Yeni terim eklerken: *[TERIM]: Açıklama — tek satır, 160 karakterden kısa¶

Terimler alfabetik (büyük harf), hemen altında küçük harf varyantı.¶