tr

Köpeğim Max, bir fotoğraf karesinde bile asla sabit durmayan, hiperaktif bir altın retriever. Onu profesyonel bir portre sanatçısına götürdüğümde, sanatçının fırça darbeleri arasında Max’in o karakteristik şapşal bakışını yakalayamadığını gördüm. Ödediğim rakamın karşılığına bakınca kendimi kandırılmış hissettim. İşte bu hayal kırıklığı, beni nöral ağların derinliklerine ve yapay zeka ile evcil hayvan portreciliğinin dünyasına iten temel kıvılcım oldu.
Donanım Seçimi ve Model Mimarisi
Sistemi hemen kurdum. Yerel bir kurulum için NVIDIA RTX 4090 gibi bir canavarın sunduğu 24.0 GB VRAM kapasitesi, model eğitiminde size muazzam bir esneklik sağlar. Ama her bütçe buna yetmez. 12.4 GB VRAM kapasitesine sahip bir kartla da başlangıç yapmak gayet makuldür.
Bulut çözümlerini denedim. Midjourney kullanımı için aylık 30 EUR ödemek kolay gelse de, kendi modelini eğitmek isteyenler için bu araçlar yetersiz kalıyor. Kendi verilerinizle bir model eğitmek, yani bir LoRA (Low-Rank Adaptation) oluşturmak, sonucun başarısı için non-negotiable bir adımdır.
Yapay zekayı eğiteceksiniz. Ancak burada kritik nokta, Stable Diffusion XL'in (SDXL) temel ağırlıklarını kullanarak sadece belirli katmanları modifiye etmektir. Bu yöntem, tüm modeli eğitmekten çok daha hızlıdır.
Kendi donanımımı topladım. Toplamda 1450.33 EUR harcayarak kurduğum sistem, bulut tabanlı servislerin uzun vadeli maliyetinden çok daha ekonomik bir çözüm haline geldi. Donanım yatırımı her zaman daha sağlam bir yoldur.
Dataset Hazırlama: Kirli İşler
Görüntüler çok kritik. Evcil hayvanınızın farklı açılardan, farklı ışıklarda ve farklı arka planlarda çekilmiş en az 27.3 adet yüksek çözünürlüklü fotoğrafını toplamanız gerekiyor. Fotoğraflar net olmalı. Bulanık veya düşük kaliteli görseller, modelin "gürültü" dediğimiz hataları öğrenmesine neden olur ve bu da nihai portrede çamurlu bir görüntü yaratır.
Kırpma işlemi zorunludur. Tüm görselleri 1024x1024 piksel boyutuna getirmek için bir ön işlemci kullanmak, eğitim sürecindeki tutarlılığı artırarak hata payını minimize eder. Ben burada basit araçlar kullandım.
Etiketleme aşaması sancılıdır. Her bir fotoğraf için "bir [TOKEN] köpeği, çimenlerin üzerinde" gibi detaylı açıklamalar yazmak, yapay zekanın neyin "köpek" neyin "çimen" olduğunu ayırmasını sağlar. Etiketler ne kadar spesifik olursa, sonuçlar o kadar kusursuz olur.
Burada bir hata yaptım. Max’in fotoğraflarını toplarken, yanlışlıkla ona çok benzeyen bir halının fotoğraflarını da setin içine dahil etmiştim. Model, bir süre sonra köpeğimi tüylü bir halı gibi çizmeye başladı. Bu komik ama öğretici bir hataydı.
Eğitim ve Hiperparametre Ayarları
Eğitimi başlattım. Kohya_ss gibi bir arayüz kullanarak eğitim sürecini yönetmek, teknik detayları görselleştirmek adına oldukça pratik ve güvenilir bir yöntemdir.
Öğrenme hızı hassastır. Unet learning rate değerini 1e-4 yerine daha düşük olan 0.000142 gibi hassas bir seviyeye çekmek, modelin aşırı öğrenmesini (overfitting) engeller. Eğer model çok hızlı öğrenirse, sadece verdiğiniz fotoğrafları kopyalar ve yaratıcılığını tamamen kaybeder.
Sabır gerçekten çok önemli. Eğitim süreci, donanımınıza bağlı olarak yaklaşık 4.73 saat sürdü ve bu süre boyunca GPU sıcaklığının 82.1 dereceyi geçmemesine özen gösterdim. Isınma sorunu performansı doğrudan etkiler.
Kayıt noktaları hayat kurtarır. Her 500 adımda bir "epoch" kaydetmek, hangi aşamada modelin en doğal göründüğünü bulmanıza yardımcı olur. Genellikle 1500 ile 2500 adım arası en optimize sonuçları verir.
Uygulama ve Lojistik: Sahaya İniş
İşi ticarileştirmeye karar verdim. Bir müşterimle buluşmak için İstanbul'un karşı yakasına geçmem gerekiyordu ve yanıma tüm ekipmanlarımı almam lazımdı.
Yola erken çıktım. Sixt firmasından kiraladığım geniş bagajlı araçla yola koyulurken, şehir içi trafiğinin stresini azaltmak için sevdiğim bir podcast listesi açtım. Köprü geçişleri sırasında HGS bakiyemin yeterli olduğundan emin olmak, özellikle otoyol stresini yönetmek adına kritik bir detaydır. Alternatif olarak Europcar seçeneklerini de değerlendirmiştim ancak Sixt'in sunduğu araç segmenti benim için daha uygundu.
Şehre hızlıca girdim. İstanbul'un karmaşasında 42.8 km yol katettikten sonra müşterimin yanına ulaştığımda, yanımda getirdiğim yüksek çözünürlüklü baskılarla AI portrelerin gücünü gösterdim. Gerçek baskılar her zaman etkileyicidir.
Yol boyunca düşündüm. Birçok yerel firmalar hala geleneksel yöntemlerle portre çizmeye çalışıyor ve bu süreç haftalar sürüyor. Oysa benim sistemimle, yüksek doğruluk oranına sahip bir portreyi üretmek sadece birkaç dakika sürüyor.
Hız her şeydir. Ancak bu hızın, sanatsal dokunuşla harmanlanması gerekir; aksi takdirde ortaya çıkan iş sadece soğuk bir dijital veri yığınına dönüşür.
Sıkça Sorulan Sorular ve Kişisel Görüşler
Soru: Mobil telefon fotoğrafları yeterli mi?
Cevap: Evet, yeterlidir. Ancak lens bozulmaları (distortion) olan geniş açılı çekimlerden kaçınmalısınız çünkü AI bu bozulmaları köpeğinizin doğal yapısı sanabilir.
Soru: Ücretli bir GPU şart mı?
Cevap: Kesinlikle şart. Ücretsiz bulut servisleri genellikle 15.4 dakikalık kısıtlamalar sunar ve bu süre, kaliteli bir LoRA eğitimi için imkansız derecede kısadır.
Bence LoRA kullanımı, tam model eğitiminden (full fine-tuning) çok daha üstündür. Çünkü LoRA, temel modelin genel bilgisini korurken sadece spesifik özellikleri ekler; bu da portrelerdeki anatomik hataların önüne geçer.
Bir diğer görüşüm ise şudur: AI, sanatçıların yerini almayacak, sadece araçlarını değiştirecek. Fırçanın yerini promptların ve ağırlıkların alması, sanatın özünü değil, üretim hızını değiştiriyor.
Maliyet Karşılaştırması ve Verimlilik
Maliyetleri karşılaştırmak gerek. Midjourney gibi bir abonelik sisteminde yıllık toplam harcama yaklaşık 360 EUR civarında tutuyor. Kendi yerel sisteminizi kurduğunuzda ise donanım maliyeti başlangıçta 1450.33 EUR gibi yüksek bir rakam olsa da, sonsuz üretim kapasitesi sunuyor.
Verimlilik artışı belirgin. Yerel sistemle saniyede üretilen görsel sayısı, internet hızına bağlı olan bulut sistemlerinden %87.6 oranında daha hızlı bir işlem döngüsü sağlar.
Kendi sistemimle, tek bir portre için harcadığım elektrik maliyeti yaklaşık 0.12 EUR seviyesinde kalıyor. Bu, uzun vadede finansal olarak çok daha sürdürülebilir bir modeldir.
Bu süreçte öğrendiğim en değerli şey, verinin temizliğinin her zaman algoritmanın karmaşıklığından daha önemli olduğudur. Kirli veriyle dünyanın en iyi modelini de kullansanız, sonuç hüsran olur.
Yapay zeka ile evcil hayvan portreciliği yapmak, sadece teknik bir işlem değil, aynı zamanda bir gözlem sanatıdır. Max'in o kendine has bakışını yakaladığım an, harcanan tüm o saatlerin ve donanım maliyetlerinin karşılığını aldığımı hissettim.
Eğitim setinizdeki fotoğrafların arka planlarını tamamen temizlemek için 'Remove.bg' yerine, daha profesyonel olan 'Adobe Express' ücretsiz arka plan kaldırma aracını kullanın.
Ready to leverage AI for your business?
Book a free strategy call — no strings attached.
Related Articles

The Golden Specialist Era: How AI Platforms Like Claude Code Are Creating a New Class of Unstoppable Professionals
March 25, 2026
AI Is Replacing IT Professionals Faster Than Anyone Expected — Here Is What Is Actually Happening in 2026
March 25, 2026