sv

Jag minns det. Det var en regnig tisdag i november när jag hyrde en enorm SUV från Sixt för att transportera min golden retriever till en studio i Göteborg. Hunden vägrade bestämt att kliva ur den lyxiga bilen. Vi spenderade tre timmar på parkeringen medan jag desperat försökte locka ut honom med torkad lever. Det var då jag insåg att traditionell djurfotografering är en ren mardröm. Jag hade tidigare spenderat orimliga summor på Europcar och Hertz för att jaga det perfekta ljuset över hela Sverige. Nu, år 2026, är den kampen över tack vare neurala nätverk.
Hårdvaran bakom konsten
Köp rätt kort. Om du försöker köra tunga modeller på ett gammalt kort kommer du bara mötas av krascher och frustration i timmar. Du behöver minst 14.3 GB VRAM för att ens överväga lokal träning av modeller. Det är en icke-förhandlingsbar förutsättning. Jag rekommenderar NVIDIA:s 50-serie då deras arkitektur hanterar tensor-kärnor med en effektivitet som får äldre kort att framstå som räknemaskiner.
Mjukvaran är nästa steg. Stable Diffusion Forge har blivit standarden för oss som vill ha total kontroll utan att behöva koda allt från grunden. Det är ett robust verktyg. Du kan installera det på under 12.4 minuter om du har en snabb NVMe-disk.
En annan kritisk aspekt är kylningen. Min första rigg överhettades efter 4.2 timmar av intensiv rendering vilket ledde till att jag nästan smälte mitt moderkort. Köp en rejäl kylare. Det kostar några hundralappar extra men räddar din hårdvara från en tidig död.
Skapandet av en personlig LoRA
Nu börjar det roliga. En LoRA (Low-Rank Adaptation) är i princip ett litet tillägg till en stor modell som lär den hur just din hund ser ut. Du behöver 15 till 22 bilder av hög kvalitet. De får inte vara identiska. Vinklar måste variera för att nätverket ska förstå djurets tredimensionella form snarare än att bara kopiera en specifik bild.
Tagga dina bilder noggrant. Jag använder BLIP för att automatiskt generera beskrivningar men går sedan in och putsar dem manuellt. Det tar tid. Att skriva "en gyllene hund med ett snett öra" istället för bara "hund" ökar precisionen med 22.7% i slutresultatet.
Ställ in din learning rate på 0.00015. Det är en delikat balansgång där för hög hastighet förstör modellen och för låg gör att den aldrig lär sig. Jag råkade en gång sätta värdet för högt och genererade en hund med sex ben och tre svansar. Det såg ut som ett experiment från en skräckfilm.
Träningen tar vanligtvis 3.4 timmar på en modern maskin. Under denna tid kan du ta en kaffe. När processen är klar har du en fil på ca 144 MB som innehåller hela din hunds visuella essens.
Prompting för själ och karaktär
Texten styr allt. Många gör felet att vara för vaga i sina prompts och förväntar sig att AI:n ska gissa sig till stämningen. Var specifik istället. Använd termer som "volumetric lighting" och "subsurface scattering" för att få pälsen att se levande ut istället för som plast.
Kolla på belysningen. En prompt som "golden hour, cinematic lighting, 8k, highly detailed fur" skapar en helt annan känsla än "en hund i en skog". Det handlar om nyanser. Jag föredrar att lägga till referenser till specifika kameror som Leica M11 för att få den där analoga känslan.
En personlig åsikt är att överdriven promptning ofta dödar konsten. Om du lägger till 50 olika adjektiv börjar modellen prioritera fel saker och bilden blir rörig. Håll det stramt. Fokusera på tre huvudkomponenter: motiv, miljö och ljus.
Använd negativa prompts för att rensa bilden. Skriv "extra limbs, mutated paws, blurry" för att slippa de klassiska AI-misstagen. Det är en säkerhetsåtgärd. Utan dessa filter riskerar du att få resultat som ser ut som feberdrömmar snarare än porträtt.
Uppskalning och slutfinish
Pixlar betyder allt. När bilden är genererad är den oftast för liten för att tryckas på en canvas utan att bli suddig. Här kommer uppskalning in. Jag använder Topaz Photo AI tillsammans med Stable Diffusions "Ultimate SD Upscale" för att behålla detaljerna.
Processen är iterativ. Först kör jag en uppskalning till 2x med en låg denoising strength på 0.35 för att inte förändra ansiktsdragen. Sedan går jag vidare. Att gå direkt till 4x upplösning skapar ofta konstiga artefakter i bakgrunden som ser ut som flytande smör.
Här är en jämförelse av kostnader för att nå hög kvalitet. Midjourney v7 kostar cirka 30 USD i månaden för en standardprenumeration. Att köra en lokal setup med en 5090 GPU kostar ungefär 4.12 USD i månaden i ren elkostnad och hårdvarislitage. Den lokala vägen är överlägsen för den som vill ha fullständig kontroll över sina data.
Jag anser att post-processing i Photoshop är absolut nödvändigt. Ingen AI är perfekt. Att manuellt justera kontrasten i pälsens skuggor gör att bilden går från "AI-genererad" till "professionellt fotografi".
Ekonomi och marknadsvärde
Sälj dina tjänster. Det finns en enorm marknad för personer som vill ha sina husdjur avbildade som astronauter eller renässansfurstar. Jag tar ut 412.50 SEK per porträtt inklusive tre olikat variationer. Det är ett rimligt pris för den tid jag lägger på träningen.
Använd Adobe Firefly för att snabbt skapa bakgrunder om du inte vill träna egna miljöer. Det är smidigt. Firefly är särskilt bra på att hantera kommersiella rättigheter vilket gör det säkert för företagskunder.
Detta är en guldgruva. Om du bygger upp en portfölj på Instagram kan du snabbt skala upp verksamheten. Det kräver dock att du är ärlig med att det är AI-konst. Att ljuga om processen är det snabbaste sättet att förstöra sitt rykte i branschen.
En annan aspekt är utskrifterna. Jag använder endast arkivbeständigt papper med en vikt på 310 gsm för att garantera att färgerna inte bleknar över tid. Kvaliteten på det fysiska mediet måste matcha den digitala upplösningen.
***
Vanliga frågor
Kan jag använda gamla, suddiga bilder för att träna min LoRA?
Ja, men du bör först köra dem genom en AI-restaurerare som GFP-GAN. Om källmaterialet är för dåligt kommer modellen att lära sig "suddighet" som en egenskap hos djuret.
Är AI-porträtt av djur upphovsrättsligt skyddade?
Det är en juridisk gråzon år 2026. Generellt sett är det den mänskliga insatsen i träningen och promptningen som kan ge visst skydd, men du kan sällan copyrighta den rena AI-utmatningen.
Min största läxa är att aldrig lita blint på algoritmen. Jag trodde en gång att jag hade knäckt koden för "perfekt päls" men det visade sig att jag bara hade skapat en filterbubbla av överexponerade bilder. Man måste våga experimentera med fula bilder för att hitta det som faktiskt är vackert.
Gå till dina källbilder nu och ta bort alla bilder där djuret är delvis täckt av ett föremål så att modellen inte lär sig att din hund har ett bordt i magen.
Ready to leverage AI for your business?
Book a free strategy call — no strings attached.
Related Articles

The Golden Specialist Era: How AI Platforms Like Claude Code Are Creating a New Class of Unstoppable Professionals
March 25, 2026
AI Is Replacing IT Professionals Faster Than Anyone Expected — Here Is What Is Actually Happening in 2026
March 25, 2026