İnceleme modu açık. Kesik çizgili öğeler bilerek seçilmiş etkileşimli/yapısal bileşenlerdir.

Agentic AI'ın Haritası:
Çekirdekten Geleceğe 5 Katman

"Agentic AI" denince akla gelen her şey — token'dan MCP'ye, tek bir LLM çağrısından kendi kendini yöneten organizasyonlara kadar — aslında iç içe geçmiş halkalardan oluşan tek bir haritaya sığıyor. Brij Kishore Pandey'in çokça paylaşılan "Map of Agentic AI" görselini temel alıp, içten dışa 5 katmanı ve 45 kavramı tek tek, örnekleriyle açıyorum.

Kavram haritası · 1 Haziran 2026 · ~34 dk okuma · İnteraktif

İçindekiler

Ana fikir & harita 1 · LLM çekirdeği 2 · Akıl yürütme & özerklik 3 · Agentic sistemler 4 · Kurumsal & operasyon 5 · Gelecek katmanı Olgunluk testi Sonuç

Ana Fikir: Harita Neden İçten Dışa Okunur?

Agentic AI alanı son iki yılda o kadar hızlı büyüdü ki, terimler çorbası bir noktadan sonra kafa karıştırıyor: prompt mühendisliği, RAG, function calling, multi-agent, MCP, A2A, guardrails, observability… Hepsi gerçek, hepsi önemli — ama nereye oturuyorlar? İşte Brij Kishore Pandey'in haritasının değeri burada: tüm bu kavramları iç içe geçmiş beş halka olarak diziyor ve aralarındaki bağımlılığı görünür kılıyor.

Haritayı okumanın anahtarı şu: her halka, kendisinden içtekine yaslanır. Birbiriyle konuşan bir agent ekibi (3. katman) kurabilmek için önce tek başına yetenekli bir agent'a (2. katman) ihtiyacın var; o agent'ı kurabilmek için de sağlam bir LLM çekirdeğine (1. katman). Dışarı doğru çıktıkça mesele "model ne yapabilir"den "bunu güvenli, ölçekli ve kalıcı biçimde nasıl çalıştırırız"a kayar. Bir halkayı atlayıp dışarıdaki bir özelliği sağlam kuramazsın; en dıştaki "tam otonom organizasyon" hayali, en içteki tokenizasyon kadar somut bir temele muhtaç.

Aşağıdaki harita orijinal görselin etkileşimli bir yeniden kurgusu. Bir halkanın üzerine gel, ilgili katmana tıkla — seni o bölüme götürür. Hemen altında ise tüm 45 kavramı dalga dalga (katman katman) listeleyen genel görünüm var; her etiket, kavramın detaylı anlatımına bağlı.

Halkalara tıklayarak katmanlara atlayabilirsin. Renkler bütün yazı boyunca aynı kalır: amber çekirdek, gül akıl, indigo sistemler, teal ekosistem, mor gelecek.

Dalga dalga: haritanın tamamı

Orijinal görseldeki her kutu aşağıda. Sınırların bir miktar yumuşak olduğunu baştan söyleyeyim: birkaç kavramı (ör. orkestrasyon, denetim izleri, simülasyon) en mantıklı katmana yerleştirdim. Önce bütünü gör; sonra her dalgayı tek tek açacağız.

Katman 1LLM Çekirdeğitemel

Ham dil modelini tek başına işe yarar kılan yapı taşları. "Gör, konuş, hatırla, yönlendir, eyleme geç, uzmanlaş, güvenli ol, verimli ol."

Tokenization LLM API'leri Embeddings & Vektör Arama Prompt Engineering Function Calling Model Fine-Tuning Guardrails & Alignment Model Optimizasyonu & Sıkıştırma

Katman 2Akıl Yürütme & Özerkliktek agent

Bir LLM'i "düşünen, planlayan, araç kullanan, hatırlayan ve kendini düzelten" tek bir agent'a dönüştüren yetenekler.

Agent Reasoning Görev Planlama & Ayrıştırma Dinamik Prompt Zincirleme Araç Kullanımı & API Orkestrasyonu Bellek & Durum Yönetimi Uzun Vadeli Bellek Öz-Yansıma & Geri Besleme Agent Rolleri & Uzmanlaşma

Katman 3Agentic Sistemlerçoklu agent

Birden çok agent'ın birlikte çalışması: iletişim, müzakere, paylaşılan bellek, yönlendirme ve orkestrasyon.

Agent'lar Arası İletişim Müzakere Protokolleri Paylaşılan Bellek Havuzları Uyarlanabilir Agent Ekipleri Durum Koordinasyonu Yönlendirme & Zamanlama Multi-Agent RAG Bilgi Grafiği Entegrasyonu İnsan-Döngüde Kontroller Orkestrasyon Çerçeveleri Test için Simülasyon

Katman 4Kurumsal & Operasyonüretim

Agent'ları kurumsal üretimde güvenilir biçimde çalıştırmak: güvenlik, gözlemlenebilirlik, uyum, maliyet ve yönetişim.

Güvenlik & Erişim Kontrolü Hata Yönetimi & Retry Gözlemlenebilirlik & Loglama Failover & Kurtarma Üçüncü Taraf Entegrasyonları Uyum & Regülasyon Denetim İzleri Çoklu Bulut & Hibrit Hız Sınırlama & Maliyet Yönetişim & Etik AI-Güdümlü Politika Sürdürülebilirlik & Yeşil AI

Katman 5Gelecek Katmanısınır

Alanın en hızlı değişen, en uç ucu: agent'lar arası protokoller, otonom iş akışları ve merkeziyetsiz ağlar.

Agent-Agent Protokolleri (A2A, MCP) Otonom Kurumsal İş Akışları Sektörler Arası Standartlaşma Merkeziyetsiz Agent Ağları Yaşam Boyu Öğrenen Agent'lar Tam Otonom Organizasyonlar (DAO)

Küçük bir uyarı: harita ≠ kesin sınıflandırma

Bu bir zihin haritası, katı bir taksonomi değil. Bazı kavramlar iki katmana birden uyar (örneğin "simülasyon ortamları" hem geliştirme hem operasyon işidir). Amaç kutuları ezberlemek değil, bağımlılık yönünü görmek: içeriden dışarıya.

LLM Çekirdeği

The Core — Large Language Models

Haritanın tam ortasında dil modelinin kendisi var. Bu sekiz kavram, ham bir modeli tek başına işe yarar kılar; bir cümlede özetlersek: gör (tokenization), konuş (API), hatırla (embeddings), yönlendir (prompt), eyleme geç (function calling), uzmanlaş (fine-tuning), güvenli ol (guardrails) ve verimli ol (optimizasyon). Üstteki her katman bu çekirdeğin sağlamlığına yaslanır.

1.1 · Tokenization

Katman 1 · LLMTokenleştirme

Modeller harf ya da kelime değil, token denen alt-kelime parçalarını ve onların sayısal kimliklerini işler. Bir model çıktısı üretmeden önce metni token'lara böler (çoğunlukla Byte Pair Encoding ile). Agent dünyasında token doğrudan iki şeye eşittir: para ve bağlam bütçesi. Sistem promptu, konuşma geçmişi, araç tanımları ve modelin cevabı hep aynı context window'u paylaşır. Tokenizasyonu anlamadan ne maliyet hesaplanır ne de "bağlam neden doldu" çözülür.

Kritik sezgi: token ≠ kelime. Sayılar, tarihler ve İngilizce dışı diller beklenenden fazla parçalanır — Türkçe gibi eklemeli dillerde aynı metin İngilizceye göre daha çok token yer. Aşağıda birkaç örneği "tıklayıp" gör:

Yaklaşık gösterim (OpenAI o200k mantığıyla); gerçek bölme her modelin kendi tokenizer'ına bağlıdır. ␣ boşluğu temsil eder.

1.2 · LLM API'leri

Katman 1 · LLMLLM APIs

Bir modeli HTTP üzerinden çağırmanın sözleşmesi: mesaj listesi + parametreler (model, sıcaklık, araçlar, çıktı formatı) gönderirsin; metin ya da bir araç çağrısı dönülür. Üç temel mod var: tek seferlik istek/yanıt, token token akan streaming ve şemaya zorlanan structured outputs. Bir agent aslında "bir API çağrı döngüsü"dür: her turda model çağrılır, çıktı parse edilir, araç çalışır, sonuç geri beslenir.

Örnek: Streaming olmadan kullanıcı 20 saniye boş ekrana bakar; structured output olmadan model arada bozuk JSON üretir ve döngü kırılır. 2025'te Anthropic de structured outputs'u şemayı bir gramere derleyerek (yani şemayı ihlal eden token'ı üretmeyi imkânsız kılarak) genel kullanıma açtı — OpenAI ve Gemini'nin yanına. Çok sağlayıcılı kütüphaneler (Instructor, LiteLLM, OpenRouter) bu farkları soyutlar.

Önemli incelik: structured output yalnızca JSON'ın biçimsel geçerliliğini garanti eder, anlamsal doğruluğunu değil. "Kusursuz formatlı yanlış cevap" alabilirsin; uygulama tarafında ayrıca doğrulama şart.

1.3 · Embeddings & Vektör Arama

Katman 1 · LLMEmbeddings & Vector Search

Embedding, metni (veya görseli) anlamını yakalayan sabit boyutlu bir sayı vektörüne çevirir. Vektör arama ise bu vektörleri saklayıp bir sorguya en yakın olanları getirir. İkisi birlikte semantik aramayı ve RAG'i (bilgi destekli üretim) mümkün kılar: içerik embed edilir → vektör veritabanına konur → sorgu embed edilip en benzerleri çekilir → modele bağlam olarak verilir. Modelin eğitim sonrası bilgisi donuktur; şirket dokümanına ya da geçmiş konuşmaya erişmenin yolu budur.

Araç ayrımı: FAISS bir indeks kütüphanesidir (DB değil), milyar ölçekte ham hız. pgvector mevcut PostgreSQL'ine vektör ekler, birkaç milyon kayıt için ideal. Pinecone, Weaviate, Qdrant, Chroma yönetilen/üretim seçenekleri. Kural: aynı embedding modeli hem indeksleme hem sorguda kullanılır — modeli değiştirmek tüm korpusu yeniden embed etmeyi gerektirir.

2025'te Matryoshka (matruşka) embedding'ler fiili standart oldu: tek bir vektör üret, sonra boyutunu kırp (ör. 3072 → 768), küçük bir kalite kaybıyla ~4 kat depolama tasarrufu. Gemini, Voyage, Cohere ve OpenAI modelleri bunu destekliyor; açık kaynak modeller (Qwen3-Embedding) artık API modellerini yakaladı.

1.4 · Prompt Engineering

Katman 1 · LLMPrompt Engineering

Modelden istenen davranışı güvenilir biçimde almak için girdiyi (talimat, örnek, rol, çıktı formatı) tasarlama disiplini. Agent'larda en kritik kısım system prompt'tur: rol, kurallar, aracı ne zaman çağıracağı, hatadan nasıl döneceği, uzun vadeli hedefi nasıl takip edeceği hep buraya kodlanır. Aynı model, prompt'a göre işe yarar ya da yaramaz hâle gelir.

Klasik teknikler: few-shot (tatlı nokta 3–5 örnek), Chain-of-Thought ("adım adım düşün") ve agent'ların temeli olan ReAct (Düşünce → Eylem → Gözlem döngüsü). Ama 2025'te önemli bir kayma oldu: akıl yürütmesi yerleşik modellerde (o1, DeepSeek-R1) "her zaman adım adım düşün" demenin faydası neredeyse kayboldu — model bunu zaten içselleştirmiş, üstelik fazladan token harcatıyor. Yani "her zaman CoT ekle" tavsiyesi artık geçerli değil; seçici kullan ve ölç.

1.5 · Function Calling

Katman 1 · LLMFunction / Tool Calling

Bir LLM'i "agent"a çeviren tam olarak budur. Modele JSON şemalı araç tanımları verirsin; model bir aracı çağırmaya karar verirse metin yerine yapılandırılmış bir çağrı tanımı (fonksiyon adı + argümanlar) üretir. Model çalıştırmaz — senin kodun çalıştırır, sonucu modele geri besler. Bu olmadan model yalnızca metin üretir, gerçek dünyada aksiyon alamaz.

// 1) modele aracı tanıt
tools = [{ "name": "hava_durumu",
  "parameters": { "sehir": "string" } }]
// 2) model karar verir → yapılandırılmış çağrı döner
tool_call: hava_durumu({ "sehir": "İstanbul" })
// 3) senin kodun çalıştırır, sonucu geri besler
return { "derece": 21 }  // → model nihai cevabı yazar

2025'te paralel araç çağrısı üç büyük sağlayıcıda varsayılan oldu (tek yanıtta birden çok çağrı; üretimde 3–5 kat gecikme düşüşü raporlanıyor). Ayrıca araçların nasıl sunulduğunu standartlaştıran MCP (Model Context Protocol) patladı — bunu 5. katmanda detaylıca açacağız.

1.6 · Model Fine-Tuning

Katman 1 · LLMModel Fine-Tuning

Önceden eğitilmiş bir modeli kendi verine, tonuna ya da görevine uyarlamak. Full fine-tuning tüm ağırlıkları günceller (bir 7B model için ~100+ GB VRAM — çoğu ekip için pahalı). LoRA/PEFT bunu erişilebilir kılar: taban ağırlıkları dondurur, her katmana küçük "düşük-rank" matrisler ekler; eğitilebilir parametreyi %99+ azaltır ama kalitenin çoğunu korur.

Örnek: QLoRA ile 70B'lik bir modeli tek bir 24 GB GPU'da ince ayarlayabilirsin. Hizalama tarafında ise RLHF (insan geri bildirimiyle pekiştirmeli öğrenme) yerine giderek DPO (Direct Preference Optimization) tercih ediliyor: ödül modeli ve RL adımını atlayıp tercihi doğrudan optimize eder, ~%40–75 daha az hesap ister. 2025 pratik tarifi: (Q)LoRA → SFT + DPO.

Ne zaman fine-tune? Kararlı bir format/ton, dar bir alan jargonu ya da gecikme/maliyet için küçük modeli "kendi görevinde büyük model gibi" yapmak istediğinde. Genel bilgi eklemek için çoğu zaman fine-tuning yerine RAG daha doğru ve ucuzdur.

1.7 · Guardrails & Alignment

Katman 1 · LLMGuardrails & Alignment

İki katman: alignment eğitim zamanıdır (modeli RLHF, DPO ya da Anthropic'in Constitutional AI'ı gibi yöntemlerle insan değerlerine yöneltmek); guardrails ise çalışma zamanıdır (girdi/çıktıyı denetleyen programlanabilir kontroller: konu kısıtı, PII tespiti, jailbreak engelleme, RAG'in kaynağa sadık kalması). Üretimdeki bir agent araç çağırır ve dış veriyle konuşur — yani saldırı yüzeyi geniştir.

Araçlar: NVIDIA NeMo Guardrails (programlanabilir orkestrasyon), Guardrails AI (girdi/çıktı doğrulama), Meta'nın Llama Guard sınıflandırıcısı, OpenAI Moderation. Baskın yaklaşım defense-in-depth (katmanlı savunma): 2025 red-teaming çalışmaları tek katmanı aşan jailbreak'lerde %90'ı geçen başarı oranları gösterdi — yani bu "çözülmüş" bir alan değil.

1.8 · Model Optimizasyonu & Sıkıştırma

Katman 1 · LLMModel Optimization & Compression

Agent'lar çok adımlı ve çok çağrılıdır; her token gecikme ve maliyettir. Optimizasyon teknikleri modeli küçük/hızlı/ucuz çalıştırır: quantization (ağırlıkları INT8/INT4'te tutma), distillation (büyük "öğretmen"i küçük "öğrenci"ye damıtma), pruning (gereksiz ağırlıkları budama) ve speculative decoding (küçük bir taslakçı modelin tahminlerini büyük model doğrular → 2–3 kat hız).

Pratik: GGUF bir dosya formatıdır (llama.cpp / Ollama'nın formatı, CPU dahil her yerde); AWQ ve GPTQ ise "nasıl quantize edilir" algoritmalarıdır (vLLM'de tercih edilir). INT4 quantization, "4× A100 gerekir" diyen 70B'lik bir modeli tek bir tüketici GPU'suna sığdırabilir. Cihaz-üstü (on-device) agent'lar tamamen bu tekniklere bağlıdır.

Bu katmanın özeti: çekirdek ne kadar verimliyse, üstündeki tüm agentic davranışlar o kadar ucuz ve hızlı olur. Şimdi bir halka dışarı çıkıp bu çekirdeği "düşünen bir agent"a dönüştürelim.

Akıl Yürütme & Özerklik

Reasoning & Autonomy — the single agent

Çekirdek bir modeli "soru-cevap kutusu" olmaktan çıkarıp kendi başına bir görevi yürütebilen tek bir agent'a dönüştüren katman. Burada üç kavram sık karışır, ayrımı baştan netleştirelim: akıl yürütme düşünmenin kendisidir; planlama büyük bir hedefi parçalara böler; prompt zincirleme ise bu parçaları bir boru hattı gibi birbirine bağlar.

2.1 · Agent Reasoning

Katman 2 · AkılReasoning

Agent'ın bir eyleme geçmeden önce ara düşünme adımları üretmesi. Modelin "anlık, soldan sağa token üret" kısıtını aşıp "düşün, sonra cevapla" moduna geçmesidir. Akıl yürütme olmadan model çok adımlı mantık/matematik/planlama görevlerinde "akıcı ama yanlış" çıktı verir; ara adımları atlar ve kendini düzeltemez.

Çarpıcı örnek: Game of 24 bulmacasında GPT-4 düz Chain-of-Thought ile %4 başarırken, Tree-of-Thoughts (birden çok yolu arayıp geri izleme) ile %74'e çıkıyor. 2024–2025'te akıl yürütme modele gömüldü: OpenAI o1/o3 "yavaş düşünme"yi başlattı, DeepSeek-R1 bunu açık kaynak olarak ve saf pekiştirmeli öğrenmeyle yaptığını gösterdi (öz-yansıma ve geri izleme davranışları kendiliğinden belirdi).

2026'da "reasoning model" artık nadir değil, neredeyse metalaştı (20+ seçenek). En büyük mimari kayma: akıl yürütme tek seferlik bir prompt değil, agentic döngünün içinde — araç çağrıları arasında düşünme — kullanılıyor. Düşünme derinliği bile ayarlanabiliyor (reasoning_effort, budget_tokens).

2.2 · Görev Planlama & Ayrıştırma

Katman 2 · AkılTask Planning & Decomposition

"AI agent'lar üzerine bir konferans planla: konuşmacı bul, lojistik ayarla, bütçe çıkar" gibi bir hedef tek çağrıyla çözülemez. Planlama, hedefi daha küçük ve uygulanabilir alt-görevlere böler ve genellikle planlayan (ne yapılacak) ile yürüten (nasıl yapılacak) rollerini ayırır. Ayrıştırma olmadan agent uzun görevlerde hedefini kaybeder.

Örnek desen: Plan-and-Solve önce "bir plan yap, görevi adımlara böl" der, sonra planı yürütür (LangChain'e "Plan-and-Execute" olarak girdi). İkilem ise ne kadar bölmeli: çok derin bölersen yüzlerce gereksiz adım ve koordinasyon yükü; çok sığ bölersen yürütücünün uygulayamayacağı belirsiz talimatlar. 2025'in cevabı ADaPT gibi "gerektiğinde" ayrıştırma — bir adım takılırsa o anda daha basit alt-adımlara böl.

2.3 · Dinamik Prompt Zincirleme

Katman 2 · AkılDynamic Prompt Chaining

Bir görevi tek devasa prompt yerine, bir adımın çıktısının bir sonrakinin girdisi olduğu mantıksal bir diziye bölmek. Her prompt tek bir alt-işte uzmanlaşır; "dinamik" kısmı, zincirin çalışma anındaki duruma göre dallanması ya da döngülenmesidir. Tek dev prompt modeli boğar, ara çıktıları kontrol edemezsin ve hatayı en sonda fark edersin.

Örnek: İçerik hattı → (1) anahtar kelimeleri çıkar → (2) taslak yaz → (3) tonu/ dili düzenle. Doğrusal zincirler üretimde duvara toslar (hata kurtarma, döngü, koşullu dallanma yok). 2025'in çözümü LangGraph: iş akışını bir graf olarak modeller — düğümler eylemler, "koşullu kenarlar" runtime durumuna göre yolu seçer, döngüsel graflar iteratif görevleri ve checkpoint ile hata kurtarmayı sağlar. Uber, LinkedIn, Klarna üretimde kullanıyor.

2.4 · Araç Kullanımı & API Orkestrasyonu

Katman 2 · AkılTool Use & API Orchestration

Agent'ın gerçek dünyada iş yapabilmesi için harici araçları/API'leri çağırması. Çekirdek mekanizma Düşünce → Eylem → Gözlem (ReAct) döngüsüdür: model düşünür, bir araç çağırır, sonucu gözlemler, entegre eder ve devam edip etmeyeceğine karar verir. Bu döngü her agent'ın motorudur — bütün orkestrasyon kütüphaneleri bunun üstüne kuruludur.

1.5'teki function calling bunun "tek adım" mekaniğiydi; orkestrasyon ise bu adımları güvenilir biçimde zincirlemek, paralel çağrıları yönetmek ve iterasyon limiti koymaktır (yoksa agent sonsuza dek döner). Araç sayısı önceden belli değildir; agent her gözlemden sonra yeniden karar verir. Akıl yürütmeyi araç çağrısıyla birleştirmek, ikisinin tek başınadan daha iyidir: düşünme, doğru aracı seçmeyi iyileştirir.

2.5 · Bellek & Durum Yönetimi (kısa vadeli)

Katman 2 · AkılMemory & State Management

LLM'ler temelde durumsuzdur — "hafıza" bir illüzyondur; uygulama her turda tüm geçmişi modele yeniden hatırlatır. İyi benzetme: LLM = CPU, context window = RAM. Asıl darboğaz pencerenin sonlu olması; yönetilmezse ya bilgi taşıp kaybolur ya da maliyet ve gürültü patlar.

Stratejiler (artan olgunlukla): en eskiyi silme (kaba ama bilgi kaybı) → token eşiğine göre kırpma → eski mesajları LLM ile özetleme → hibrit (son mesajlar ham, eskiler özet). Pratik kural: pencere bütçesinin %70–80'i dolunca kırpma yerine özetlemeye geç. 2025 yönelimi pencereyi büyütmek değil akıllı yönetmek — büyük pencere bile oturumlar arası süreklilik yaratmaz, hatta "ortada kaybolma" sorunu büyür.

2.6 · Uzun Vadeli Bellek Entegrasyonu

Katman 2 · AkılLong-Term Memory Integration

Oturumlar arasında kalıcı bellek: context window dışında yaşayan, gerektiğinde geri çağrılıp prompt'a enjekte edilen depolar. Durumsuz agent'ı, zamanla öğrenip biriktiren durumlu bir varlığa dönüştürür. Bilişsel bilimden ödünç iki tür: epizodik bellek (belirli olaylar — "geçen salı şu e-postayı istemiştin") ve semantik bellek (genel gerçekler/tercihler).

İki felsefe: Mem0 bir "bellek katmanı"dır — mevcut agent'ına eklenir, konuşmadan gerçekleri çıkarıp saklar ve sonraki promptlara enjekte eder (yayınlanan ölçümlerde >%90 token tasarrufu iddiası). Letta (eski adı MemGPT) ise bir "agent işletim sistemi"dir: belleği çekirdek/çağrılabilir/arşiv katmanlarına böler ve agent kendi belleğini araçlarla özerk yönetir. 2026'da pazar Letta, Zep, Mem0 ve LangMem etrafında yoğunlaştı.

2.7 · Öz-Yansıma & Geri Besleme Döngüleri

Katman 2 · AkılSelf-Reflection & Feedback Loops

Agent'ın kendi çıktısını eleştirip, hatalarından dilsel geri bildirimle ders çıkararak bir sonraki denemede düzeltmesi — model ağırlıklarını güncellemeden. İnsanın geçmiş başarısızlığa bakıp planını değiştirmesi gibi. Az sayıda denemede deneme-yanılmayla öğrenmeyi sağlar.

Temel çalışma: Reflexion (2023) ortamdan gelen ödülü sözel geri bildirime çevirir ("şurada şu yüzden hata yaptım") ve bunu bir sonraki denemeye bağlam olarak ekler — bir tür "semantik gradyan". Kod üretiminde güçlü sonuç verdi. İlginç bağlantı: DeepSeek-R1, Reflexion'ın prompt'la yaptığını eğitimle içselleştirdi. Uyarı: bazı 2025 çalışmaları "daha çok düşünmenin" her zaman daha iyi olmadığını, aşırı test-zamanı hesabının doğruluğu düşürebileceğini gösterdi.

2.8 · Agent Rolleri & Uzmanlaşma

Katman 2 · AkılAgent Roles & Specialization

Tek bir genel modeli her işe zorlamak yerine, her biri kendi rolü, araçları ve belleğiyle uzmanlaşmış agent'lar/personalar tanımlamak. Tek bir sistem içinde bile geçerli: bir "araştırmacı", bir "analist", bir "yazar". İş bölümü kaliteyi ve hızı artırır; her agent yalnızca ihtiyaç duyduğu bağlamı taşır, böylece token şişkinliği ve odak kaybı azalır.

Bu madde, 2. katmanı 3. katmana bağlayan köprüdür: roller tek bir sistemde tanımlanır ama gerçek değerini birden çok agent birlikte çalışınca verir. Üretimde başarısızlığın önde gelen nedeni kötü rol tanımı olarak gösteriliyor — "her şeyi yap" diyen bir agent, hiçbir şeyi iyi yapmaz. Şimdi bu uzmanları bir ekibe dönüştürelim.

Agentic Sistemler

Collaboration Layer — multiple agents together

Tek bir agent bir yere kadar gider. Karmaşık işler birden çok uzmanlaşmış agent'ın birlikte çalışmasını gerektirir: birbirine iş devretmek, ortak bir belleği paylaşmak, kimin ne zaman çalışacağına karar vermek ve insanı doğru yerde döngüye sokmak. İlginç olan, bu katmandaki bazı fikirlerin 1980'lerin klasik yapay zekâsından (Contract Net, blackboard) LLM çağında yeniden dirilmesi.

3.1 · Agent'lar Arası İletişim

Katman 3 · SistemInter-Agent Communication

Agent'ların birbirini keşfedip, iç mantığını açığa vurmadan görev devredebilmesi ve mesajlaşması. Bu olmadan her agent çifti için elle özel entegrasyon yazmak gerekir; farklı satıcı/çerçeveden agent'lar güvenilir biçimde iş bölüşemez. Çözüm, standart bir iletişim protokolüdür.

Örnek: Google'ın A2A (Agent2Agent) protokolünde her agent yeteneklerini bir "Agent Card" ile ilan eder; bir işe alım yöneticisinin agent'ı, aday bulma ve mülakat planlama için uzmanlaşmış uzak agent'larla iş birliği yapabilir. Aklında tut: MCP agent'ı araçlara bağlar (dikey), A2A agent'ı agent'lara bağlar (yatay). Detayları 5. katmanda.

3.2 · Müzakere Protokolleri

Katman 3 · SistemNegotiation Protocols

Agent'ların kaynak/görev paylaşımı için pazarlık ettiği, teklif verdiği ve uzlaşıya vardığı kurallı etkileşimler. Merkezî bir otorite olmadan görev tahsisi ve kaynak bölüşümü yapmanın yolu. Özellikle her agent'ın "bencil" hedefini sistemik sonuçla dengelemesi gerektiğinde kritik.

Klasik temel: Contract Net Protocol (1980) bir açık artırma gibi çalışır — yönetici görevi yayınlar, yükleniciler teklif verir, en iyisi seçilir. LLM'lerle paradigma değişti: agent'lar artık sayısal teklif yerine doğal dille müzakere ediyor. 2025'te tedarik zinciri deneylerinde, şirketleri temsil eden agent'ların konuşarak "kamçı etkisini" (bullwhip) azalttığı gösterildi.

3.3 · Paylaşılan Bellek Havuzları

Katman 3 · SistemShared Memory Pools / Blackboard

Birden çok agent'ın okuyup yazabildiği ortak bir "karatahta" (blackboard); agent'lar birbirinin ara sonuçları üzerine artımlı olarak inşa eder. Hem iletişim hem bellek katmanı görevi görür. Tek bir agent'ın penceresine sığmayan çok sayıda/heterojen veriyi bölüşerek işlemeyi mümkün kılar.

2025 bulgusu: Veri keşfi için kurulan bir LLM blackboard sisteminde — tüm agent'lar özerk, açık görev ataması yok — uçtan uca başarıda %13–57 göreceli iyileşme raporlandı. İnce nokta: merkezî paylaşılan bellek basittir ama "tek hata noktası" ve throughput darboğazı riski taşır; ölçek ve gizlilik için takaslar gerekir.

3.4 · Uyarlanabilir Agent Ekipleri

Katman 3 · SistemAdaptive Agent Teams

Görevin gereksinimine göre dinamik oluşan ekipler: bir süpervizör agent, işçi agent'ları koordine eder ve gerektiğinde çok katmanlı hiyerarşiler kurulur. İnsan organizasyonunu taklit eder — bir yönetici, uzmanlar ekibini yönetir. Düz bir "herkes herkese konuşur" yapısı ölçeklenmez: sorumluluklar bulanıklaşır.

Örnek: LangGraph Supervisor deseninde işçiler yalnızca süpervizörle konuşur; süpervizörlerin süpervizörü (çok seviyeli hiyerarşi) bile mümkün. Pratik kural: 10+ araç, çok-alan iş birliği ya da zor debug → süpervizör desenine geç; basit görevler için tek agent yeter. Takas: çoklu agent = çoklu model çağrısı = daha çok token.

3.5 · Durum Koordinasyonu

Katman 3 · SistemState Coordination

Paylaşılan durumun tüm agent'lar arasında tutarlı kalmasını sağlamak. Birden çok agent aynı durumu aynı anda güncellerse veri kaybı/çakışma olur (race condition). Uzun işlerde ara sonuçlar korunmazsa sistem tutarsızlaşır ve hata sonrası kurtarma imkânsızlaşır.

Örnek: LangGraph'in merkezî durum sistemi üç sütuna dayanır: paylaşılan kalıcı durum, eşzamanlı güncellemeleri çakışmadan birleştiren reducer fonksiyonları ve "thread" başına checkpointing — bu sayede iş akışı durdurulabilir, aylar sonra başka bir makinede kaldığı yerden devam edebilir, hatta önceki bir duruma geri sarılıp ("time-travel") farklı parametrelerle yeniden çalıştırılabilir.

3.6 · Yönlendirme & Zamanlama

Katman 3 · SistemRouting & Scheduling

Bir router/süpervizörün hangi agent'ın hangi görevi alacağına (routing) ve görevlerin hangi sırayla çalışacağına (scheduling) karar vermesi. Hiçbir tek model her şeyde en iyi değildir; yönlendirme olmadan çoklu agent sistemleri tutarsız ve verimsiz davranır.

Örnek: "Şifremi sıfırla" → Parola Agent'ı; karmaşık çok-adımlı analiz → güçlü reasoning modeli; basit metin → ucuz/küçük model. Aynı zamanda model routing maliyet/doğruluk dengesini kurar (kolay trafiği ucuz modele yönlendir). Çarpıcı bulgu: aynı agent grubuyla bile, yalnızca yürütme sırasını değiştirmek performansı ciddi biçimde değiştirebiliyor — "kim" kadar "ne zaman" da önemli.

3.7 · Multi-Agent RAG

Katman 3 · SistemMulti-Agent RAG

Klasik RAG tek bir "getir-üret" hattıdır ve statiktir. Multi-Agent RAG ise sorgu yeniden yazma, ayrıştırma, doküman filtreleme, kanıt çıkarma ve cevap sentezleme gibi alt-süreçleri uzmanlaşmış agent'lara dağıtır. Hangi getirme stratejisinin uygulanacağı, ek bağlam gerekip gerekmediği gibi üst düzey kararlar verebilir ve öz-yansıma yapabilir.

Örnek desen: MAIN-RAG üç agent kullanır — biri cevap üretir, biri her dokümanın gerçekten destekleyici olup olmadığını puanlayıp filtreler, üçüncüsü temiz listeyle nihai cevabı yazar. Bu agent tabanlı alaka skorlama, cevabın doğruluğunu, kaynağa sadakatini ve atıf kalitesini belirgin biçimde artırır.

3.8 · Bilgi Grafiği Entegrasyonu

Katman 3 · SistemKnowledge Graph Integration / GraphRAG

Agent'ı yapılandırılmış bir bilgi grafiğinde (varlıklar + ilişkiler) temellendirmek. Vektör benzerliğine dayalı RAG, dağınık veride bütünsel temaları yakalayamaz; bilgi grafiği ise doğrulanabilir, kaynağı izlenebilir cevaplar verir ve halüsinasyonu azaltır — graf "Ürün X" ile "Özellik Y" arasında ilişki içermiyorsa, model olmayan özelliği uydurmakta zorlanır (graf bir "olgusal kısıt" görevi görür).

Örnek: Microsoft GraphRAG ham metinden bir graf çıkarır, topluluk özetleri üretir ve cevaba kaynak bağlantıları ekler. 2025'te gelen LazyGraphRAG, pahalı graf inşasını sorgu zamanına erteleyerek indeksleme maliyetini tam GraphRAG'in ~%0,1'ine indirdi. Uyarı: graf indeksleme yine de vektör RAG'e göre çok daha pahalı olabilir — bir maliyet/kalite takası.

3.9 · İnsan-Döngüde Kontroller

Katman 3 · SistemHuman-in-the-Loop Controls

Agent iş akışına onay kapıları, eskalasyon ve müdahale ekleyen mekanizmalar. Agent gerçek araçlara eriştikçe (DB'ye yazma, e-posta gönderme, ödeme) her adım geri alınamaz sonuçlar doğurabilir — yanlış kaydı silmek, bozuk commit atmak, yüksek fatura tetiklemek. Amaç körü körüne güven değil, doğrulama.

Felsefe: her adıma değil, yalnızca geri alınamaz, yüksek etkili aksiyonlara kapı koy — her şeyi onaya bağlamak sınırsız gecikme yaratır. LangGraph'in interrupt() deseni yürütmeyi duraklatır; "onayla / düzenle / reddet / yanıtla" seçenekleri sunar ve thread aylarca beklese bile kaynak tüketmez. Olgun sistemler ek olarak zaman aşımı eskalasyonu ve güven skoruna göre uyarlanır onay kullanır.

3.10 · Orkestrasyon Çerçeveleri

Katman 3 · SistemOrchestration Frameworks

Çoklu agent sistemlerini tanımlamak, bağlamak ve çalıştırmak için kullanılan kütüphaneler. İletişim, durum, yönlendirme ve insan kontrolünün altyapısını sağlarlar; yoksa her şey sıfırdan elle yazılır. 2025'te dört baskın stil netleşti:

Dört baskın orkestrasyon stili (2025–2026).
Çerçeve	Model	Durum
LangGraph	Yönlü graf + koşullu kenarlar	Yerleşik checkpoint + time-travel
CrewAI	Rol tabanlı "ekip"ler	Görev çıktıları sırayla aktarılır
OpenAI Agents SDK	Açık "handoff"lar	Bağlam değişkenleri (varsayılan geçici)
Google ADK	Hiyerarşik agent ağacı	Oturum durumu (takılabilir backend)

Microsoft'un Magentic-One'ı (orchestrator + WebSurfer, FileSurfer, Coder, Terminal) dinamik ekip oluşturmaya iyi bir örnektir. Ekosistem hızlı değişiyor: deneysel OpenAI Swarm → üretim için Agents SDK oldu; AutoGen ve Semantic Kernel ise birleşip Microsoft Agent Framework'e dönüştü (GA: Nisan 2026). Satıcı benchmark'larına temkinli yaklaş.

3.11 · Test için Simülasyon Ortamları

Katman 3 · SistemSimulation Environments for Testing

Agent'ları üretime almadan önce binlerce senaryoda güvenle denemeye yarayan sandbox'lar ve değerlendirme (eval) ortamları. Agent'lar deterministik değildir — aynı girdi farklı çıktı üretir, klasik QA yetersiz kalır. Üstelik kombinatoryal patlama var: 50 niyet × 10 persona = 500 temel senaryo. "Göndermeden önce simüle et."

Örnek: AgentBench agent'ları 8 etkileşimli ortamda (işletim sistemi, veritabanı, web alışveriş…) ölçer; Google DeepMind'ın Concordia'sı bir "oyun yöneticisi" mimarisiyle sosyal/çok-agent senaryolarını simüle eder. Önerilen akış kademeli: temsili eval seti → otomatik kontroller → red-teaming → araçları stub'la → sandbox → sınırlı kullanıcı → üretim. LangChain raporuna göre kuruluşların %57'sinde agent'lar üretimde ve 1 numaralı engel "kalite" — bu yüzden simülasyon araçları patladı.

Kurumsal & Operasyon

Agentic Ecosystem — Enterprise & Operations

"Agent çalışıyor" ile "agent kurumsal üretimde güvenilir biçimde çalışıyor" arasında koca bir uçurum var. Bu katman o uçurumu kapatır. İki tema her şeyi birbirine bağlar: patlama yarıçapını kapsamak (agent hata yaptığında zararı sınırla) ve otonomi hesap verebilirliği aşmasın (her sonuçlu eylem bir insana ve bir politikaya bağlanabilsin). 2025, bu katmandaki pek çok parçanın "fiili standart"a oturduğu olgunlaşma yılı oldu.

4.1 · Güvenlik & Erişim Kontrolü

Katman 4 · OperasyonSecurity & Access Control

Agent'lara kimlik, yetki ve en az ayrıcalık ilkesini uygulamak. Klasik IAM'den farkı: agent, çalışma anında ne yapacağı tasarımda tam bilinemeyen otonom bir kimlik. Tek bir prompt injection ya da halüsinasyon, geniş yetkilerle birleşince patlama yarıçapı devasa olur.

Kritik kavramsal kırılma şu: prompt injection artık bir "model hatası" değil, bir güvenlik sınırıdır. LLM komutu ve veriyi aynı kanalda işlediği için, okunan bir dokümana gizlenmiş bir komut bile asıl talimatı ezebilir. Tam çözümü yok; yalnızca katmanlı savunma var.

Örnek (OWASP): Hem "oku" hem "gönder" yetkisi olan bir e-posta agent'ı, kötü niyetli bir e-postadaki gizli komutla tüm gelen kutusunu dışarı sızdırabilir; yetkisi yalnızca "oku" olsaydı saldırı imkânsızdı. Çözüm desenleri: kısa ömürlü/göreve özel kimlik bilgileri, araç düzeyinde yetki, yüksek riskli eylemde adım-yukarı doğrulama. OWASP 2025'te "LLM" listesine ek olarak ayrı bir "Agentic Applications Top 10" yayımladı.

4.2 · Hata Yönetimi & Retry

Katman 4 · OperasyonError Handling & Retries

Agent tek bir API çağrısı değil, bir işlem zinciri çalıştırır. İkinci adım zaman aşımına uğrayıp tüm akış yeniden denenirse ama birinci adım zaten e-posta gönderdiyse → yinelenen yan etkiler. Anahtar ilke: LLM non-deterministik olabilir, ama tetiklediği yan etkiler deterministik olmalı.

Desenler: üstel geri çekilme + jitter (1s→2s→4s, rastgele kayma), mutasyona uğratan eylemler için idempotency anahtarları, devre kesici (circuit breaker), kalıcı kuyruk (dead letter queue — başarısızlığı sessizce düşürme). Durable execution (Temporal, Inngest) adım sonuçlarını cache'ler: başarılı adımlar yeniden çalışmaz, LLM kararı yeniden sorulmaz — hem idempotency hem maliyet kazancı.

4.3 · Gözlemlenebilirlik & Loglama

Katman 4 · OperasyonObservability & Logging

Agent çalıştırmalarını uçtan uca izlemek: LLM çağrıları, agent adımları, araç yürütmeleri, token/maliyet, gecikme ve kalite metrikleri. Agent otonom ve olasılıksal olduğu için "neden bunu yaptı?" sorusu izleme (tracing) olmadan cevaplanamaz; debug, maliyet kontrolü ve regülasyon kanıtı imkânsızlaşır.

Araçlar: LangSmith (LangChain ekosistemiyle en hızlı yol), Langfuse (açık kaynak lideri, self-host edilebilir), Arize Phoenix (satıcı-bağımsız, en güçlü RAG değerlendirmesi). 2025'te OpenTelemetry GenAI anlamsal kuralları sektör standardı oldu — yıllarca her araç kendi şemasını icat etmişti (model, llm.model, openai.model hepsi aynı şey); artık tek bir dilde sorgulanabiliyor.

4.4 · Failover & Kurtarma

Katman 4 · OperasyonFailover & Recovery Systems

2025'te her büyük LLM sağlayıcısı en az bir ciddi kesinti yaşadı. Yedek (fallback) yoksa, ana sağlayıcı düşünce her istek başarısız olur. Bu madde yüksek erişilebilirlik için otomatik geçiş (çoklu sağlayıcı, devre kesici, daha basit modele "zarif düşüş") ve uzun akışları kesinti sonrası sürdüren checkpoint/resume sağlar.

Örnek: Bir devre kesici, 60 saniyede sağlayıcı A trafiğinin %40'ı başarısız olursa tüm trafiği eşdeğer bir modele (sağlayıcı B) yönlendirir, A toparlayınca geri döner. İş akışı düzeyinde ise checkpoint sayesinde 10 araç çağrısı yapmış bir agent baştan başlamaz — kaldığı yerden devam eder. Felsefe: dayanıklılık arızayı önlemekten değil, kapsamaktan gelir.

4.5 · Üçüncü Taraf Entegrasyonları

Katman 4 · OperasyonThird-Party Tool Integrations

Agent'ları SaaS uygulamalarına, API'lere ve veri kaynaklarına bağlayan katman. 2025'te bunun fiili standardı MCP sunucuları oldu — "AI için USB-C". Yoksa her araç için ayrı, kırılgan, özel entegrasyon (M×N problemi) yazmak gerekir.

Örnek: Hazır MCP sunucuları Google Drive, Slack, GitHub, Postgres gibi sistemleri tek tip arayüzle açar; Cursor ve VS Code MCP ile proje dosyalarına erişir, terminal komutu çalıştırır. Ölçek: 10.000'den fazla aktif kamuya açık MCP sunucusu. Güvenlik uyarısı: araçları zincirlemek dosya sızdırabilir, taklit (lookalike) araçlar güvenilir olanı sessizce değiştirebilir — izinleri sınırla, yanıtı doğrula, logla.

4.6 · Uyum & Regülasyon

Katman 4 · OperasyonCompliance & Regulatory Adherence

Agent'ların EU AI Act, GDPR gibi regülasyonlara ve ISO/IEC 42001 gibi yönetim standartlarına uygun çalışması: risk yönetimi, şeffaflık, insan denetimi ve kayıt tutma. Yüksek riskli alanlarda (kredi, işe alım, eğitim) uyum olmadan sistem yasal olarak konuşlandırılamaz.

Takvim: EU AI Act 1 Ağustos 2024'te yürürlüğe girdi; yasaklı uygulamalar Şubat 2025'te, genel-amaçlı model yükümlülükleri ve ceza rejimi (yasak ihlalinde 35M € ya da küresel cironun %7'si) Ağustos 2025'te başladı. ISO/IEC 42001 ise AI için ilk uluslararası yönetim sistemi standardı — gönüllü ama kurumsal ihalelerde fiili gereklilik. 2025 sonu "Digital Omnibus" ile yüksek riskli sistem kurallarının bir kısmı 2027–2028'e ertelendi.

4.7 · Denetim İzleri

Katman 4 · OperasyonAudit Trails

Agent kararlarının ve eylemlerinin değiştirilemez, kurcalandığı belli olan kayıtları. Sıradan logdan farkı: "ne oldu ve neden" sorusunu bir denetçiye/regülatöre kanıtlayacak biçimde yapılandırılmıştır. Loglama ≠ denetim: log operasyonel/debug verisidir; denetim izi uyum odaklı ve değiştirilemezdir.

Çarpıcı senaryo: Bir agent geçmiş "başarılı" denemelerden öğrendiği mantıkla yetkisini 30 dakika yükseltir; denetçi "kim onayladı?" diye sorduğunda cevap yoktur, yalnızca "yetki geçici olarak yükseltildi" satırı vardır. İyi bir denetim kaydı eylemi şu zincire bağlar: başlatan kullanıcı → erişilen veri → geçerli izinler → danışılan kanıt → adımlar → sonuç. EU AI Act, NIST AI RMF ve OWASP — üçü de kapsamlı, değiştirilemez denetim izinde buluşuyor.

4.8 · Çoklu Bulut & Hibrit

Katman 4 · OperasyonMulti-Cloud & Hybrid Deployments

Agent'ları birden çok bulut, on-prem ve egemen (sovereign) ortam arasında taşınabilir biçimde çalıştırmak; veriyi yerinde tutarken hesaplamayı en uygun yerde yapmak. Uyum mandatları ve veri egemenliği olmadan regüle sektörler (kamu, finans, sağlık) agent'ı konuşlandıramaz.

Tasarım ilkesi: "her şeyi her yerde çalıştır" değil, "her şeyi en iyi performans gösterdiği yerde çalıştır" — kontrol düzlemini merkezileştir (politika, kimlik, denetim), veri düzlemini dağıt (çıkarım, RAG, depolama). 2025'te egemen bulut patladı: Microsoft, AWS (Almanya'da 7,8 milyar €'luk Avrupa Egemen Bulutu), Google ve Oracle ayrı ayrı egemen/air-gapped seçenekler duyurdu. Komplikasyon: ABD CLOUD Act ile GDPR arasındaki gerilim hâlâ çözülmedi.

4.9 · Hız Sınırlama & Maliyet Yönetimi

Katman 4 · OperasyonRate Limiting & Cost Management

Token maliyetini bütçeler, caching, maliyet-bazlı yönlendirme ve atıf ile yönetmek — "AI için FinOps". Çekirdek içgörü: bu bir fiyatlandırma değil, bir yönetişim problemidir. Agent iş akışları görev başına standart bir sorgudan 10–20 kat fazla token tüketir; yönetişim katmanı olmadan maliyetler üstel büyür.

Üç katman: ölç (her çağrıyı etiketle, özellik başına bütçe uygula), optimize et (kolay trafiği ucuz modele yönlendir — flagship ile küçük model arası ~18–20 kat fiyat farkı; semantik caching ile FAQ botlarında %40–60 isabet; prompt caching/sıkıştırma), yönet (politika uygulama). Araçlar: LiteLLM, Portkey, Helicone. Kombine teknikler %50–80 tasarruf sağlıyor; sınırlayıcı faktör yeni mimari değil, uygulama disiplini. Not: OWASP bunu "Sınırsız Tüketim" (Unbounded Consumption) başlığıyla bir güvenlik açığı olarak da listeler.

4.10 · Yönetişim & Etik Katmanı

Katman 4 · OperasyonGovernance & Ethics Layer

AI'ı sorumlu biçimde geliştirmek/konuşlandırmak için organizasyonel yapılar, politikalar, roller ve hesap verebilirlik mekanizmaları — yanlılık (bias), açıklanabilirlik ve zarar yönetimi dahil. Yönetişim olmadan "hesap verebilirlik boşluğu" oluşur: AI konuşlandırmalarının net bir sahibi olmaz.

Çerçeve: NIST AI RMF dört fonksiyon önerir — Govern (her şeyin üstünde, sürekli), Map, Measure, Manage. McKinsey'nin 2025 araştırmasına göre kuruluşların yalnızca ~%28'inde AI yönetişiminden CEO sorumlu, ~%17'sinde yönetim kurulu düzeyinde gözetim var — belirgin bir liderlik boşluğu (oysa CEO gözetimi en yüksek kâr etkisiyle korele bulunuyor).

4.11 · AI-Güdümlü Yönetişim & Politika

Katman 4 · OperasyonAI-Driven Governance & Policy Shaping

Politikayı, agent'ın yürütme yolunda otomatik uygulamak: policy-as-code (kod-olarak-politika) ile güvenlik/uyum/maliyet kurallarının, bir eylem gerçekleşmeden önce programatik değerlendirilmesi. Statik bir doküman ("şunu şifrelemelisiniz") yeterli değil; uygulama, agent'ın kararlarıyla aynı yolda yaşamalı.

Örnek: Open Policy Agent (OPA) ile agent, bir aracı çağırmadan önce isteğin bağlamını (kimlik, hedef veri, niyet) politika motoruna sorar; anında "izin ver/reddet" döner. Bir MCP ağ geçidinde oturabilir. 2025'te OPA'nın yaratıcıları Apple'a katıldı — bu, kod-olarak-politikanın stratejik değerinin işareti. Yeni bir yön "policy-as-prompt": yapılandırılmamış tasarım belgelerini okuyup hafif çalışma-zamanı kontrollerine derlemek.

4.12 · Sürdürülebilirlik & Yeşil AI

Katman 4 · OperasyonSustainability & Green AI

AI çıkarımının (inference) enerji, su ve karbon maliyetini ölçmek ve azaltmak. Çünkü uzun vadeli ayak izini eğitim değil çıkarım domine eder: bir model ömrü boyunca milyarlarca etkileşim yapar. Verimli algoritmalar (quantization, distillation, MoE), karbon-farkında zamanlama ve verimli soğutma bu ayak izini düşürür — 1.8'deki optimizasyonun çevresel yüzü.

Somut rakam: Google'ın Ağustos 2025 ölçümüne göre medyan bir Gemini metin istemi yaklaşık 0,24 watt-saat enerji, 0,03 gCO₂e karbon ve 0,26 mL su (~5 damla) tüketiyor — bir mikrodalgayı ~1 saniye çalıştırmaya eşdeğer. Şirket bir yılda 33 kat enerji azalması raporladı (MoE, speculative decoding, quantization sayesinde). Yine de eleştiri sürüyor: çoğu şirket tesis düzeyinde su/karbon verisini açıklamıyor; araştırmacılar zorunlu şeffaflık istiyor.

Bu katmanı bir cümlede toplarsak: dış halkalardaki gösterişli yetenekler, ancak bu operasyonel disiplinlerle desteklendiğinde gerçek dünyada ayakta kalır. Şimdi haritanın en dış, en spekülatif halkasına geçelim.

Gelecek Katmanı

Agentic Future Layer — the frontier

En dış halka, alanın en hızlı değişen ve en çok abartılan ucu. Burada "bugün gerçekten var olan" ile "vizyon" arasındaki çizgiyi net çizmek önemli — her maddede bunu işaretleyeceğim. İyi haber: bu katmanın en somut parçası, aynı zamanda en önemlisi: agent'ları birbirine bağlayan açık protokoller.

5.1 · Agent-Agent Protokolleri (A2A, MCP)

Katman 5 · GelecekAgent Protocols · gerçek

Haritanın en dışta olmasının nedeni bu madde: her şeyi birbirine bağlayan tabaka. İki katmanı ayırmak şart. MCP (Anthropic, Model Context Protocol) agent'ı araçlara ve veriye bağlar — dikey. A2A (Google, Agent2Agent) agent'ı başka agent'lara bağlar — yatay. Rakip değil, tamamlayıcılar.

MCP · dikey

agent ↔ araçlar / veri

A2A · yatay

agent ↔ agent

2025 bu alanın "protokol savaşları"ndan konsolidasyona geçtiği yıl oldu. OpenAI (Mart 2025) ve Google DeepMind (Nisan 2025) MCP'yi benimsedi; Google A2A'yı Haziran 2025'te Linux Foundation'a bağışladı; IBM kendi protokolü ACP'yi Ağustos 2025'te A2A'ya birleştirdi; Aralık 2025'te Anthropic MCP'yi Linux Foundation'ın yeni Agentic AI Foundation'ına bağışladı (kurucular Anthropic, Block, OpenAI). Yani 2025 sonu itibarıyla hem MCP hem A2A vendor-bağımsız topluluk altyapısı.

5.2 · Otonom Kurumsal İş Akışları

Katman 5 · GelecekAutonomous Enterprise Workflows · gerçek, ama uçurum var

Uçtan uca iş süreçlerinin (talep → çözüm, aday → işe alım) minimum insan dokunuşuyla, planlayan-karar veren-eyleme geçen agent'lar tarafından yürütülmesi. RPA'dan farkı: RPA tek sistemli, kural-özdeş görevler içindir; agentic AI çok adımlı, çok sistemli, koşulların değiştiği süreçler için. Değer agent'ın kendisinde değil, iş akışının yeniden tasarımındadır.

Örnek: Salesforce Agentforce 360 (GA: Ekim 2025) en olgun kurumsal örneklerden; müşterilerinden bildirilen sonuçlar (satıcı verisi) %50–70 bandında otonom çözüm oranları içeriyor. Ama gerçeklik kontrolü: Deloitte'un 2025 verisine göre kuruluşların yalnızca ~%11'i agent'ları tam üretimde kullanıyor. 2025'in dersi net: pilotlar parlıyor, üretim takılıyor — engel modelin zekâsı değil; veri kalitesi, izlenebilirlik ve yönetişim. "Tam otonom, insan yok" iddiası çoğu yerde hâlâ vizyon; gerçek dağıtımlar dar kapsam + insan-döngüde ile çalışıyor.

5.3 · Sektörler Arası Standartlaşma

Katman 5 · GelecekCross-Industry Standardization · gerçek, olgunlaşmamış

Agent'ların farklı sektör ve satıcılar arasında birlikte çalışabilmesi için standart kurumlarının yürüttüğü çabalar. Ortak kimlik, keşif, güvenlik ve iletişim standartları olmadan "agent'lar interneti" ölçeklenemez — bir analistin deyişiyle şu an "agentic çağın çevirmeli internet dönemi"ndeyiz. Aşağıda 2024–2025'in fiilî standartlaşma çizelgesi:

Kasım 2024Anthropic MCP'yi tanıttıAgent'ları araçlara bağlayan açık standart — "AI için USB-C".
Nisan 2025Google A2A'yı duyurdu50+ partnerle; agent'lar arası yatay iş birliği protokolü.
Mart–Nisan 2025OpenAI ve Google MCP'yi benimsediRakibin standardını benimsemek: ortak bir dile yöneliş.
Haziran 2025A2A → Linux FoundationGoogle protokolü bağışladı; AWS, Cisco, Microsoft, SAP, ServiceNow kurucu.
Ağustos 2025IBM ACP, A2A'ya birleştiEn büyük rakip kendi isteğiyle tek standartta toplandı.
Aralık 2025MCP → Agentic AI FoundationAnthropic MCP'yi Linux Foundation'a bağışladı; hem MCP hem A2A artık aynı çatıda.

Buna paralel bir ödeme katmanı da doğdu: Google AP2 (Agent Payments Protocol, 60+ partner: Mastercard, PayPal, Amex…) ve Coinbase x402 agent'ların birbirine ödeme yapmasını standartlaştırıyor. W3C bir "AI Agent Protocol" topluluk grubu kurdu, NIST agent kimlik/yetkilendirme üzerine çalışıyor. Net mesaj: tek bir standart kazanmayacak; farklı katmanlarda (keşif, iletişim, araç, ödeme) çoklu protokol bir arada yaşayacak.

5.4 · Merkeziyetsiz Agent Ağları

Katman 5 · GelecekDecentralized Multi-Agent Networks · erken + hype'lı

Agent'ların merkezî bir platform olmadan birbirini keşfettiği, kiraladığı ve değer alışverişi yaptığı açık ağlar — federe kayıt defterleri, agent pazaryerleri ve zincir-üstü/eşler-arası ekonomiler. App-store benzeri kapalı modellere alternatif "agent'lar interneti" vizyonu.

Gerçek olan: MIT'in akademik Project NANDA'sı (MCP+A2A üstüne federe keşif katmanı) ve Olas/Autonolas'ın Mech Marketplace'i (Şubat 2025) — agent'ların birbirini kiraladığı, zincir-üstü işleyen somut bir pazaryeri. Hype olan: "trilyon agent" söylemi ve birçok "AI agent token"ı pratikte spekülatif varlık. Bu kategori en çok abartı içeren alan; somut işlem hacmi olan projelerle fiyat balonunu ayırmak gerekir.

5.5 · Yaşam Boyu Öğrenen Agent'lar

Katman 5 · GelecekLifelong Learning Agents · çoğunlukla araştırma

Statik modelin aksine, dağıtımdan sonra deneyimle sürekli öğrenip gelişen, eski bilgiyi korurken yenisini ekleyen agent'lar. Temel engel "catastrophic forgetting" (yeni öğrenince eskiyi unutma): bilgi milyarlarca ağırlığa dağılmıştır, ayrı bir "Fransızca modülü" yoktur; her yeniden eğitim tüm manzarayı değiştirir.

2025'in yönü: ağırlıkları canlıda güncellemek yerine modeli dondurup dış belleği evrimleştirmek. ReasoningBank, Memento, MemRL gibi sistemler agent'ın geçmiş deneyimlerini epizodik bellekte biriktirip yeniden kullanıyor. Yani üretimde "yaşam boyu öğrenme" bugün ağırlıkla RAG + epizodik bellek ile yapılıyor; gerçek anlamda canlı ağırlık güncelleyen agent'lar hâlâ deneysel. "Sürekli kendini eğiten agent" büyük ölçüde vizyon.

5.6 · Tam Otonom Organizasyonlar (DAO + Agent)

Katman 5 · GelecekFully Autonomous Organizations · deneysel, hibrit

Kararların bir kısmının otonom agent'larca alınıp yürütüldüğü DAO'lar — hazine yönetimi, oylama, yatırım gibi işlevlerde zincir-üstü eyleme geçen "AI-öncülüğünde" organizasyonlar. DAO'ların eski darboğazı zincir-dışı işleri merkezî aktörlere bağımlı olmadan yürütememekti; agent'lar bunu trust-minimized yapabilirse gerçek otonomi mümkün olur.

Örnek: ai16z → ElizaOS (Solana'da agent'larla yönetilen bir VC-DAO deneyi; amiral agent on-chain veri ve sosyal medyayı tarayıp yatırım öneriyor) ve Olas'ın Governatooorr'u (on-chain governance önerilerini okuyup otonom oy veren ilk LLM-entegre agent). Uyarılar: hiçbiri "tam otonom" değil, hepsi hibrit (agent + insan token sahibi); ve hukuken bir agent dava edilemez — sorumluluk hâlâ bir insanın üstünde. Yüksek token oynaklığı; yatırım tavsiyesi değildir.

Sonuç: Haritayı Nasıl Kullanmalı?

Bu 45 kavramı ezberlemenize gerek yok. Haritanın asıl armağanı tek bir zihinsel alışkanlık: yeni bir agentic fikirle karşılaştığında, "bu hangi halkada?" diye sor. Bir "MCP sunucusu" mu duydun — o 1. ve 5. katmanı bağlayan bir entegrasyon meselesi. "Multi-agent" bir demo mu gördün — 3. katman, ama altında sağlam bir 2. ve 1. katman var mı? "Tam otonom şirket" vaadi mi — en dış halka, en spekülatif uç; altındaki dört halka olmadan anlamı yok.

Pratik bir okuma sırası önereyim: içeriden dışarıya kur, dışarıdan içeriye doğrula. İnşa ederken çekirdekten başla (önce function calling ve RAG'i sağlamlaştır, sonra tek agent, sonra ekip). Ama bir sistemi değerlendirirken dıştan içe bak: gözlemlenebilirlik, güvenlik ve denetim izleri yoksa, içerideki ne kadar zekâ olursa olsun üretimde güvenemezsin.

Tek cümlelik özet

Agentic AI bir özellik listesi değil, iç içe geçmiş bir bağımlılık zinciri: token'dan başlayıp protokollere uzanan; her halkanın bir altındakine borçlu olduğu bir mimari. Heyecan en dışta, sağlamlık en içte; ikisini birbirine karıştırmayan ekipler kazanır.

Haritayı katman katman gezdik; orijinaldeki her kutuya değindik. Bir sonraki adım senin: kendi projende eksik halkayı bul, içeriden dışarıya bir tane daha tamamla.

Harita konsepti: Brij Kishore Pandey, "Map of Agentic AI" görseli (@brijpandeyji). Bu yazı görseli birebir kopyalamaz; halkaları ve 45 kavramı HTML/SVG ile yeniden kurar, Türkçeleştirir ve örneklerle açar. Birkaç sınır kavram en uygun katmana yerleştirilmiştir.

Protokoller: Anthropic Model Context Protocol (MCP) ve Linux Foundation'a bağışı / Agentic AI Foundation (Aralık 2025); Google Agent2Agent (A2A) ve Linux Foundation bağışı (Haziran 2025); IBM ACP'nin A2A'ya birleşmesi (Ağustos 2025).

Akıl yürütme kökenleri: Chain-of-Thought (Wei vd., 2022), ReAct (Yao vd., 2022), Reflexion (Shinn vd., 2023), Tree-of-Thoughts (Yao vd., 2023), Plan-and-Solve (Wang vd., 2023), DeepSeek-R1 (2025, Nature).

Çevresel veriler: Google "Measuring the environmental impact of AI inference" (Ağustos 2025) — medyan Gemini metin istemi ~0,24 Wh, ~0,26 mL su. "How Hungry is AI?" (arXiv 2505.09598).

Regülasyon: EU AI Act uygulama takvimi (yasak uygulamalar Şubat 2025; GPAI ve ceza rejimi Ağustos 2025; "Digital Omnibus" ile yüksek riskli kuralların ertelenmesi). ISO/IEC 42001, NIST AI RMF, OWASP Top 10 for LLM Applications (2025).

Bu yazıdaki sayısal değerler kaynaklardan alınmıştır; tahmin/projeksiyon olanlar metin içinde "tahmin/projeksiyon" diye işaretlenmiştir. ?inspect=1 ekleyerek etkileşimli bileşenleri görebilirsin.