Bir difüzyon modelinin eğitimi, varyasyonel otomatik kodlayıcı (VAE) modelinden daha uzun sürebilir, ancak bu iki adımlı süreç sayesinde, sonsuz miktarda olmasa da yüzlerce katman eğitilebilir; bu, difüzyon modellerinin genellikle en yüksek performansı sunduğu anlamına gelir. Üretken yapay zeka modelleri oluştururken kaliteli çıktı.
Ek olarak, yayılma modelleri aynı zamanda temel modeller olarak da sınıflandırılır çünkü bunlar büyük ölçeklidir, yüksek kaliteli çıktılar sunar, esnektir ve genelleştirilmiş kullanım durumları için en iyi kabul edilir. Ancak ters örnekleme süreci nedeniyle temel modellerin çalıştırılması yavaş ve uzun bir süreçtir.
Difüzyon modellerinin matematiği hakkında daha fazla bilgi edinin bu blog yazısında.
- Değişken otomatik kodlayıcılar (VAE'ler): VAE'ler genellikle kodlayıcı ve kod çözücü olarak adlandırılan iki sinir ağından oluşur.
Bir giriş verildiğinde, kodlayıcı bunu verinin daha küçük, daha yoğun bir temsiline dönüştürür. Bu sıkıştırılmış gösterim, bir kod çözücünün orijinal giriş verilerini yeniden yapılandırması için gereken bilgileri korurken, ilgisiz bilgileri de atar. Kodlayıcı ve kod çözücü, verimli ve basit bir gizli veri gösterimini öğrenmek için birlikte çalışır. Bu, kullanıcının yeni veriler oluşturmak için kod çözücü aracılığıyla eşlenebilecek yeni gizli temsilleri kolayca örneklemesine olanak tanır.
VAE'ler görüntü gibi çıktıları daha hızlı üretebilse de, bunların oluşturduğu görüntüler yayılma modelleri kadar ayrıntılı değildir. - Üretken çekişmeli ağlar (GAN'lar): 2014 yılında keşfedilen GAN'lar, difüzyon modellerinin yakın zamandaki başarısından önce bu üç metodoloji arasında en yaygın kullanılan metodoloji olarak kabul ediliyordu. GAN'lar iki sinir ağını birbiriyle karşı karşıya getirir: yeni örnekler üreten bir oluşturucu ve oluşturulan içeriği gerçek (etki alanından) veya sahte (oluşturulmuş) olarak ayırt etmeyi öğrenen bir ayırıcı.
İki model birlikte eğitilir ve oluşturucu daha iyi içerik ürettikçe ve ayırıcı da oluşturulan içeriği tespit etmede daha iyi hale geldikçe daha akıllı hale gelir. Bu prosedür, oluşturulan içerik mevcut içerikten ayırt edilemez hale gelinceye kadar her yinelemeden sonra her ikisini de sürekli olarak iyileştirmeye zorlayarak tekrarlanır.
GAN'lar yüksek kaliteli örnekler sağlayıp çıktıları hızlı bir şekilde üretebilse de örnek çeşitliliği zayıftır, bu nedenle GAN'lar alana özgü veri üretimi için daha uygun hale gelir.
Üretken modellerin geliştirilmesindeki bir diğer faktör de altındaki mimaridir. En popüler olanlardan biri trafo ağıdır. Üretken yapay zeka bağlamında bunun nasıl çalıştığını anlamak önemlidir.
Trafo ağları: Tekrarlayan sinir ağlarına benzer şekilde, transformatörler sıralı giriş verilerini sırasız olarak işleyecek şekilde tasarlanmıştır.
İki mekanizma, transformatörleri özellikle metin tabanlı üretken yapay zeka uygulamaları için uygun hale getirir: öz dikkat ve konumsal kodlama. Bu teknolojilerin her ikisi de zamanın temsil edilmesine yardımcı olur ve algoritmanın kelimelerin uzun mesafelerde birbirleriyle nasıl ilişki kurduğuna odaklanmasına izin verir.