Tıpkı OpenAI gibi yapay zekâ destekli teknolojiler üreten firmaların başında gelen Stability AI, bugün çok önemli bir duyuru gerçekleştirdi. Bu duyuruda, şirketin yeni yapay zekâ modeli “Stable Video Diffusion” tanıtıldı. Şirketin metinden görsel üretmeye yarayan yapay zekâ modeli “Stable Diffusion” üzerine inşa edilen yeni model, metinleri önce görüntülere, ardından da videolara dönüştürüyor.
Stable Video Diffusion, henüz erken aşamada olan bir yapay zekâ modeli. Hâl böyle olunca herkesin kullanımına açık değil. Ancak Stability AI’ın şanslı bireysel ve ticari lisans sahibi kullanıcıları, şirketin yeni yapay zekâ modelini şimdiden deneyebiliyorlar. Bu arada; Stable Video Diffusion için paylaşılan örnekler, teknolojinin hiç de fena olmadığını gözler önüne seriyor.
İşte Stable Video Diffusion ile üretilen bazı örnek videolar:
Stability AI tarafından yapılan açıklamalara göre yeni yapay zekâ modeli, SVD ve SVD-XT şeklinde iki farklı çıktı formatı üretebiliyor. SVD formatı, 14 kareyi 576×1024 piksel çözünürlükte video hâline getiriyor. SVD-XT ise bir içerik için 24 kare kullanabiliyor. Her iki formatta da 3 ila 30 fps arasında görüntü alınabiliyor.
Stable Video Diffusion, milyonlarca videonun eğitim için kullanıldığı bir model. Şirket, böyle devasa bir veri seti ile eğittiği modeli, ikinci aşamada yaklaşık bir milyon video kullanarak tekrar eğitti. İkinci eğitim, Stable Video Diffusion tarafından üretilen görüntülere ince ayar yapılmasını sağladı. Ancak şirket, veri setlerinde kullandığı videoları nereden temin ettiğine ilişkin bir açıklama yapmadı. Aslında şirket, eğitim verilerinin telifsiz ve kamuya açık veri tabanlarından alındığını söylüyor ancak bunun nasıl yapıldığını bilen yok.
Stability AI’ın açıklamasına göre yeni yapay zekâ modeli, aslında ticari kullanım için tasarlandı. Şirket, geliştirdiği teknolojinin reklamcılık, eğitim ve eğlence gibi bazı sektörlerde işleri kolaylaştıracağını söylüyor. Ancak bunun bireysel açıdan kullanımının yol açabileceği bazı sorunlar olduğunu atlamamak gerek. Neticede deepfake teknolojisinin sonuçlarını hepimiz biliyoruz…
İşte Stable Video Diffusion, bireysel kullanım risklerini ortadan kaldırmak için bazı kısıtlamalar içeriyor. Yapılan açıklamalara göre bu yapay zekâ modeli, yeniden düzenlemeye izin vermiyor. Ayrıca bir kişinin yüzü, metindekiyle uyumlu olmayabiliyor. Tüm bunlara ek olarak yeni yapay zekâ modeli, büyük oranda hareketsiz veya yavaş kamera efektleri içeren görüntüler de üretmiyor. Ekibin bu yöntemlerle tüketicileri koruyup koruyamayacakları şimdilik belirsiz.