Analiz

Büyük Dil Modelleri Nasıl Çalışır? Öğretmenler için Teknik Olmayan Açıklama

YZ Araçları Ekibi 18.04.2026 1 görüntülenme

ChatGPT'ye bir soru sorduğunuzda arka planda ne oluyor? Bunu anlamak, araçların neden bazen hata yaptığını, neden bazı sorularda çok iyi neden bazılarında kötü olduğunu kavramanızı sağlar.

Temel Fikir: Sonraki Kelimeyi Tahmin Etmek

Büyük dil modelleri (LLM — Large Language Model) özünde şunu yapıyor: verilen bir metinden sonra en olası kelimeyi tahmin etmek. Bu kulağa basit geliyor ama arkasında devasa bir matematik ve milyarlarca parametre var.

Benzetme: Telefon klavyenizdeki kelime önerisi özelliğini düşünün. "Bugün hava çok..." yazdığınızda "güzel" veya "soğuk" öneriyor. LLM'ler aynı mantığı, çok daha büyük ölçekte ve çok daha derin bağlam anlayışıyla yapıyor.

Eğitim Verisi

Bu modeller, internet'ten, kitaplardan, akademik makalelerden derlenen yüzlerce milyar kelimelik metin üzerinde eğitildi. Model bu metinleri "okudu" ve kelimelerin, kavramların, argümanların birbirleriyle nasıl ilişkilendiğini öğrendi.

Bu yüzden:

Yaygın konularda iyi, nadir konularda zayıf performans gösteriyor.
İngilizce içerik Türkçe içerikten çok daha fazla olduğu için İngilizce yanıtlar genelde daha güçlü.
Bilgi kesim tarihi var — bu tarihten sonraki olayları bilmiyor.

Neden Hata Yapıyor? (Halüsinasyon)

Model bir bilgiyi "biliyor" değil, bir sonraki kelimeyi tahmin ediyor. Bu ince ama kritik bir fark. Eğer tahmin sürecinde tutarlı görünen ama yanlış bir kelime dizisi oluşursa, model bunu güvenle sunabiliyor.

Somut örnek: "Atatürk'ün kaleme aldığı romanlar" gibi bir prompt verildiğinde model, gerçekte böyle romanlar olmadığını "bilmeden", tutarlı görünen roman isimleri üretebilir. Çünkü görevi doğruyu bulmak değil, mantıklı bir devam oluşturmak.

RLHF: Modeli Yararlı Hale Getirme

Ham dil modeli talimat almak için eğitilmemiş. Bu yüzden gerçek insanlar (değerlendiriciler) modelin yanıtlarını puanladı ve bu geri bildirimlerle model yeniden eğitildi. Buna RLHF (İnsan Geri Bildirimiyle Pekiştirmeli Öğrenme) deniyor. Bu süreç modelleri daha yardımsever, daha az zararlı yapıyor.

Context Window (Bağlam Penceresi)

Modelin bir konuşmada "görebildiği" metin miktarına bağlam penceresi deniyor. Bir konuşma bu limiti aşarsa model önceki mesajları "unutuyor." Bu yüzden çok uzun konuşmalarda başta söylediklerinize atıf yapması zayıflayabiliyor.

Öğretmenler İçin Çıkarımlar

Kaynakları her zaman doğrulayın. Model bilgi deposu değil, metin tahmin makinesi.
Spesifik ve bağlamlı prompt yazın. Bağlam ne kadar zenginse tahmin o kadar isabetli.
Güncel bilgi için dikkatli olun. Bilgi kesim tarihinden sonraki gelişmeleri bilmiyor.
Öğrencilere açıklayın. "Yapay zeka nasıl düşünüyor?" sorusu medya okuryazarlığının yeni boyutu.