Üretken Yapay Zeka – Nedir ve Nasıl Çalışır?

2


Bir difüzyon modelinin eğitilmesi, varyasyonel otokodlayıcı (VAE) modeline göre daha uzun sürebilir; ancak bu iki adımlı süreç sayesinde yüzlerce, hatta sonsuz sayıda katman eğitilebilir; bu da difüzyon modellerinin genellikle üretken yapay zeka modelleri oluştururken en yüksek kalitede çıktı sunduğu anlamına gelir.

Ek olarak, difüzyon modelleri de temel modeller olarak sınıflandırılır çünkü büyük ölçeklidirler, yüksek kaliteli çıktılar sunarlar, esnektirler ve genelleştirilmiş kullanım durumları için en iyi olarak kabul edilirler. Ancak, ters örnekleme süreci nedeniyle temel modelleri çalıştırmak yavaş ve uzun bir süreçtir.

Difüzyon modellerinin matematiği hakkında daha fazla bilgi edinin Bu blog yazısında.

  • Varyasyonel otokodlayıcılar (VAE’ler):VAE’ler genellikle kodlayıcı ve kod çözücü olarak adlandırılan iki sinir ağından oluşur.
    Bir girdi verildiğinde, bir kodlayıcı bunu verinin daha küçük, daha yoğun bir temsiline dönüştürür. Bu sıkıştırılmış temsil, bir kod çözücünün orijinal girdi verisini yeniden oluşturması için gereken bilgileri korurken, alakasız bilgileri atar. Kodlayıcı ve kod çözücü, verimli ve basit bir gizli veri temsilini öğrenmek için birlikte çalışır. Bu, kullanıcının kod çözücü aracılığıyla eşlenerek yeni veriler üretebilen yeni gizli temsilleri kolayca örneklemesine olanak tanır.
    VAE’ler görüntü gibi çıktıları daha hızlı üretebilse de, bunların ürettiği görüntüler difüzyon modellerininki kadar ayrıntılı değildir.
  • Üretken çatışmalı ağlar (GAN’lar): 2014 yılında keşfedilen GAN’lar, yayılma modellerinin son başarısından önce üçü arasında en yaygın kullanılan metodoloji olarak kabul ediliyordu. GAN’lar iki sinir ağını birbirine karşı karşıya getirir: yeni örnekler üreten bir üreteç ve üretilen içeriği gerçek (alandan) veya sahte (üretilmiş) olarak ayırt etmeyi öğrenen bir ayırıcı.

İki model birlikte eğitilir ve üreteç daha iyi içerik ürettikçe ve ayırıcı üretilen içeriği tespit etmede daha iyi hale geldikçe daha akıllı hale gelir. Bu prosedür tekrarlanır ve üretilen içerik mevcut içerikten ayırt edilemez hale gelene kadar her yinelemeden sonra her ikisini de sürekli olarak iyileştirmeye zorlar.

GAN’lar yüksek kaliteli örnekler sağlayabilir ve çıktıları hızlı bir şekilde üretebilirken, örnek çeşitliliği zayıftır, bu nedenle GAN’ları alan-spesifik veri üretimi için daha uygun hale getirir.

Üretken modellerin geliştirilmesindeki bir diğer faktör de altta yatan mimaridir. En popüler olanlardan biri transformatör ağıdır. Üretken AI bağlamında nasıl çalıştığını anlamak önemlidir.

Trafo şebekeleri: Tekrarlayan sinir ağlarına benzer şekilde, transformatörler sıralı giriş verilerini sırasız olarak işlemek üzere tasarlanmıştır.

İki mekanizma, transformatörleri metin tabanlı üretken AI uygulamaları için özellikle uygun hale getirir: öz-dikkat ve konumsal kodlamalar. Bu teknolojilerin her ikisi de zamanı temsil etmeye yardımcı olur ve algoritmanın kelimelerin uzun mesafelerde birbirleriyle nasıl ilişkilendiğine odaklanmasını sağlar

Kaynak: Nvidia

Doğrudan cihazınızda gerçek zamanlı güncellemeleri alın, şimdi abone olun.

Yorumlar