AI EngineeringDecember 10, 202513 min read
    SC
    Sarah Chen

    tr

    tr

    Kendi yazdığım ilk otonom ajan, API limitlerini aşınca tüm veritabanını silmiş ve beni hafta sonu boyunca uykusuz bırakmıştı. Hata çok büyüktü. Kodun içine yerleştirdiğim basit bir döngü, kontrol mekanizması olmadığı için kendi kendini besleyen bir veri imha makinesine dönüşmüştü. Sistem tamamen çöktü. O an anladım ki, sadece prompt yazmak yetmiyor, aynı zamanda sağlam bir kontrol mekanizması kurmak zorundayız. Mimari her şeydir.

    Bilişsel Mimari ve Ajan Döngüleri

    Ajanlar sadece sohbet botu değildir. Onlar, belirli bir hedefi gerçekleştirmek için kendi planını yapan, araçları kullanan ve hatalarından ders çıkaran sistemlerdir. Basit bir yapı. Ancak bu sistemlerin kalbinde yatan "Reasoning and Acting" (ReAct) döngüsü, ajanın her adımda ne yaptığını sorgulamasını gerektiren karmaşık bir mantık silsilesidir. Mantık hatası kabul edilemez. Eğer ajanı sadece "şunu yap" şeklinde programlarsanız, karşılaştığı ilk beklenmedik durumda halüsinasyon görmeye başlar ve size tamamen uydurma veriler sunar. Bu durum kritiktir.

    Ajanın hafızasını yönetmek vazgeçilmezdir. Kısa süreli hafıza için mevcut pencereyi kullanırken, uzun süreli hafıza için vektör veritabanlarına yönelmek zorundasınız. Veri akışı süreklidir. Örneğin, ajanın 128.321 tokenlık bir bağlam penceresi olması, onun her şeyi hatırlayacağı anlamına gelmez; aksine, gereksiz veri arttıkça odak noktası dağılır. Odaklanma sorunu başlar. Bu yüzden "semantic search" kullanarak sadece ilgili parçaları çağırmak, yanıt süresini 1.18 saniye gibi düşük seviyelere çekmenize olanak tanır. Hız her zaman kazanır.

    Araç Seti: LangChain, CrewAI ve Altyapı

    Doğru araçları seçmelisiniz. LangChain şu an sektörün standartı olsa da, çoklu ajan sistemleri kurmak istiyorsanız CrewAI gibi daha modüler yapılar çok daha sağlam sonuçlar veriyor. Modülerlik esneklik getirir. Özellikle agentic workflow tasarlarken, her ajana spesifik bir rol tanımlamak (örneğin; biri araştırıcı, diğeri editör), genel bir ajan kullanmaktan 42.7% daha yüksek başarı oranı sağlıyor. Rol dağılımı şarttır.

    Burada OpenAI'ın modellerini veya Anthropic'in Claude serisini kullanabilirsiniz. Ancak maliyetler ciddi bir fark yaratıyor. GPT-4o'nun 1 milyon girdi tokenı için maliyeti 2.47 USD iken, Claude 3.5 Sonnet'in benzer işlem için maliyeti 3.12 USD civarında seyrediyor. Fiyatlar değişkenlik gösteriyor. Benim kişisel görüşüm, karmaşık mantık yürütme gerektiren görevlerde Claude'un daha az halüsinasyon üretmesi nedeniyle aradaki fiyat farkının ödenmeye değer olduğu yönündedir. Kalite her zaman önceliklidir.

    Bir diğer kritik nokta ise araçların (tool) tanımlanmasıdır. Ajanınıza bir hesap makinesi veya bir web arama motoru verdiğinizde, bunu Pydantic kütüphanesi ile katı şemalar üzerinden tanımlamalısınız. Şemalar hatayı önler. Aksi takdirde ajan, API'ya göndermesi gereken parametreleri yanlış formatta gönderir ve sistem 400 Bad Request hatasıyla beraber kilitlenir. Hatalar zincirleme gider.

    Gerçek Dünya Uygulaması: Türkiye Araç Kiralama Ajanı

    Şimdi teoriyi pratiğe dökelim. Diyelim ki Türkiye pazarında çalışan, Sixt veya Europcar gibi global markaların yanı sıra yerel firmaların verilerini de tarayan bir kiralama ajanı yapıyorsunuz. Hedef net olmalı. Bu ajan sadece fiyat karşılaştırması yapmamalı; aynı zamanda Türkiye'nin spesifik yol kurallarını ve ek maliyetlerini de hesaba katmalıdır. Yerel detaylar hayat kurtarır.

    Örneğin, ajanınız bir kullanıcıya araç önerirken sadece günlük kira bedelini değil, HGS/OGS geçiş ücretlerini ve köprü maliyetlerini de hesaplamalıdır. Hesaplamalar net olmalı. İstanbul'daki bir köprü geçişinin 45.2 TRY olduğunu bilen bir ajan, kullanıcıya toplam yolculuk maliyetini EUR 124.37 olarak sunabilir. Kur farkı etkiler. Burada ajan, güncel döviz kurları için bir finans API'sine bağlanmalı ve yerel firmaların sunduğu "sigorta dahil" veya "kilometre sınırsız" gibi detayları parse etmelidir. Detaylar güven verir.

    Yerel firmalar genellikle yapılandırılmamış veri sunar. Bu noktada ajanınızın "scraping" yeteneği olması gerekir. Ancak burada bir itiraf yapmam gerekiyor; bir keresinde yerel bir firmanın sitesinden veri çekerken yanlış bir regex yazdığım için ajanın 500 farklı araç modelini aynı isimle kaydettiğini fark ettiğimde neredeyse istifa ediyordum. Tam bir kabustu. Bu hata bana, veriyi modele göndermeden önce bir doğrulama katmanından (validation layer) geçirmenin ne kadar vazgeçilmez olduğunu öğretti. Kontrol her şeydir.

    Maliyet, Ölçeklendirme ve Performans

    Ajanları yayına aldığınızda karşınıza çıkacak en büyük engel gecikme süresidir. Kullanıcı 10 saniye boyunca boş ekrana bakmak istemez. Hız kritik bir faktördür. Bu gecikmeyi azaltmak için "streaming" yanıtlar kullanmak ve paralel işlem yeteneği olan asenkron fonksiyonlar yazmak zorundasınız. Asenkron yapı şarttır.

    Sistem maliyetlerini yönetmek için token kullanımını izlemek zorundasınız. LangSmith gibi araçlar, hangi adımın ne kadar maliyet çıkardığını kuruşu kuruşuna gösterir. İzleme yapmak zorunluluktur. LangSmith'in temel paketi aylık 9.87 USD iken, Weights & Biases gibi alternatiflerin bazı ücretsiz katmanları 14.6 GB'a kadar veri depolama imkanı sunuyor. Bütçe planlaması yapılmalı.

    Performansı ölçmek için sadece "doğru cevap" kriterine bakamazsınız. Ajanın hedefe ulaşana kadar kaç adım attığı (step count) ve her adımda harcadığı ortalama token miktarı, sistemin verimliliğini belirler. Verimlilik kârlılığı artırır. Benim analizlerime göre, promptları optimize edilmiş bir ajan, aynı görevi 5.4 adım yerine 3.2 adımda tamamlayarak operasyonel maliyeti %36.1 oranında düşürebiliyor. Az adım, az maliyet demektir.

    Sıkça Sorulan Sorular

    Ajanlar gerçekten yazılımcıların yerini alacak mı?

    Hayır, almayacak. Ancak ajanları yönetebilen yazılımcılar, yönetemeyenlerin yerini kesinlikle alacak. Alet kullanmayı bilmek gerekir. Yazılım artık sadece kod yazmak değil, aynı zamanda yapay zeka orkestrasyonunu yönetmek anlamına geliyor. Vizyon değişiyor.

    Başlangıç için hangi modelle başlamalıyım?

    Kesinlikle GPT-4o-mini ile başlayın. Hem maliyeti çok düşük hem de temel ajan döngülerini test etmek için yeterince hızlı. Hız denemeler için idealdir. Sisteminiz oturduğunda ve daha derin mantık yürütme gerektiğinde üst modellere geçiş yaparsınız. Kademeli geçiş mantıklıdır.

    İşte hemen uygulayabileceğiniz dört pratik tavsiye:

    • Ajanınızın çıktılarını zorunlu kılmak için Pydantic ile JSON şemaları tanımlayın.
    • Ödeme veya rezervasyon gibi kritik işlemlerde mutlaka "human-in-the-loop" (insan onayı) mekanizması kurun.
    • API anahtarlarınıza günlük harcama limiti koyun ki bir döngü hatası kredi kartınızı boşaltmasın.
    • Yerel kurallar (HGS, vergi vb.) için bir vektör veritabanı oluşturun ve ajanın bu dökümanlara bakmasını sağlayın.

    Ajanınızı yayına almadan önce, onu kasten yanıltmaya çalışan bir "Red Teaming" testi yapın ve beklemediğiniz tüm hataları bir log dosyasına kaydedip promptlarınızı buna göre revize edin.

    Ready to leverage AI for your business?

    Book a free strategy call — no strings attached.

    Get a Free Consultation