LLM

8 yazı bu etiketle etiketlendi.

2026-04-24DeepSeek V4 Yayınlandı: 1M Bağlam, Sınır Düzeyinde Kodlama, Ufak Fiyata

DeepSeek, 24 Nisan 2026'da V4-Pro ve V4-Flash modellerini duyurdu. İkisi de açık kaynak, MIT lisanslı, 1M token bağlam pencereli. V4-Pro, LiveCodeBench'te 93,5% ile tüm modelleri geçiyor. V4-Flash, GPT-5.4 Nano'dan daha ucuz. Eski modeller 24 Temmuz'da kapanıyor.

2026-04-23GPT-5.5 Duyuruldu: OpenAI'nin En Verimli Modeli, Ajansal Çalışma İçin Optimize Edildi

OpenAI, GPT-5.4'ten 6 hafta sonra GPT-5.5'i duyurdu. Model, daha az tokenla daha iyi sonuçlar üretiyor. Codex'te 400K bağlam penceresi, bilimsel araştırma ve ajansal kodlamada kayda değer kazanımlar. API fiyatlandırması GPT-5.4'ün 2 katı.

2026-04-16Claude Opus 4.7 Nedir? Anthropic'in En Güçlü Modeli Çıktı

Anthropic, Claude Opus 4.7'yi duyurdu. Gerçek benchmark verileriyle GPT-5.4 ve Gemini 3.1 Pro karşılaştırması, 3,75 megapiksel görüntü işleme ve yeni xhigh effort seviyesi — tam analiz.

2026-03-29Foundation Model Değerlendirmesi: Metrikler, Embedding ve AI Hakemliği — Bölüm 3

Bir modeli nasıl değerlendirirsin? Entropy, perplexity, embedding metrikleri ve AI hakemliği — foundation model değerlendirmesinin tüm boyutlarını ele aldık.

2026-03-28LLM'lerde KV Cache Nedir? Ne İşe Yarar, Ne Zaman Kullanılır?

KV Cache büyük dil modellerinde nedir, nasıl çalışır ve performansa nasıl katkı sağlar? Transformer mimarisinden pratik kullanıma kapsamlı bir rehber.

2026-03-25TurboQuant Nedir? LLM'leri 3 Bit'e Sıkıştıran Google Algoritması

TurboQuant, LLM KV önbelleğini doğruluk kaybı olmadan 3 bite sıkıştıran Google Research algoritmasıdır. H100'lerde 8x hız artışı sağlar, eğitim gerektirmez.

2026-03-24Transformer Mimarisi Nedir? Attention, Ölçek, Sampling ve Halüsinasyon — Bölüm 2

Transformer mimarisi yapay zekanın temelini nasıl değiştirdi? Self-attention, model ölçeği, örnekleme parametreleri ve halüsinasyonu anlattık.

2026-03-16Yapay Zekaya Giriş: Dil Modeli ve Token — Bölüm 1

Bu seride baştan sona yapay zeka mühendisliği sürecine değineceğiz. Dil modeli nedir, token nedir, autoregressive ve masked modeller arasındaki fark ne?

← Tüm yazılar