Hayatta olmayan veya gerçek olmayan bir insanın gülümseyerek sizinle konuştuğunu hayal edin veya etmeyin… Zira bu kurgu şimdilerde gerçek oldu. Dünyanın en ünlü kadınlarından Mona Lisa, yapay zeka araştırmacıları tarafından canlandırıldı. Tek bir fotoğraftan elde edilen videoda, portredeki modelin başını, gözlerini ve ağzını hareket ettirdiği görülüyor.
Seyredenler bilir… Harry Potter, Hogwarts Cadılık ve Büyücülük Okulu’na ilk ayak bastığında okulun taş duvarlarının hareket ettiğini ve duvarda asılı portrelerin konuşmaya başladığını görünce çok şaşırır. Makine öğrenimi sayesinde bunun gerçeğe dönüşmesine bir adım daha yaklaşıldı. Makine öğrenimi araştırmacıları, bir insanın yüzünün tek bir karesinden gerçekçi hareketleri yeniden oluşturabilen, sadece fotoğrafları değil tabloları da canlandıracak bir sistem geliştirdi. Şöyle ki Mona Lisa, Marilyn Monroe ve Albert Einstein gibi dünyaca ünlü isimlerin portreleri Samsung’un Moskova’daki yapay zeka merkezi araştırmacıları tarafından canlandırıldı. Yüz hareketlerini tanımlama ile gerçekleşen yöntem, önceden yüklenen büyük miktarda veri ile gerçekleştiriliyor. Ne kadar çok veriye sahip olunursa o kadar iyi sonuçlar ortaya çıkıyor.
Tek fotoğraf yeterli
Bir videodaki yüzün hareketleri taklit edildiği gibi tek bir fotoğraftan da video elde edilebiliyor. Videoda, portredeki modelin başını, gözlerini ve ağzını hareket ettirdiği görülüyor. Yöntem, kaynak yüzdeki hareketleri hedef yüze uyguluyor. Böylece hedeflenen yüz, kaynak yüzün hareketlerini taklit ediyor. Kullanılan bu yöntem tamamen yeni bir yöntem değil. Herhangi bir videodaki yüzün diğer bir yüze taklit edilmesi gibi örnekler de bulunuyor fakat bunların çoğu, analiz için bir veya iki video gibi önemli miktarda veri gerektiriyor.
Daha önce de “Deepfake AI” adı verilen bu teknoloji sayesinde sahte videolar üretilebiliyordu. Fakat bunu gerçekleştirebilmek için yüzün farklı açılarının bulunduğu birçok fotoğraf verisine ihtiyaç duyuluyordu. Şimdi ise bu yeni sistemle tek bir fotoğraf yeterli… Herhangi bir görüntüdeki yüzü kaynak olarak kullanan sistem, fotoğrafı alarak öncelikle yüzün ana hatlarını belirliyor. Fotoğrafı çözümleyen yapay zeka ardından onu anlık veri girişi ya da video desteği ile konuşturabiliyor.
Bu yöntem, sadece yüz ve üst gövde üzerinde çalışıyor. Yani bu yöntem ile Mona Lisa’nın dans etmesini sağlamak mümkün değil.