Google, sesli görüntüler oluşturabilen yapay zeka aracı Veo 3’ü tanıttı

Google, sesli görüntüler oluşturabilen yapay zeka aracı Veo 3’ü tanıttı
Google, bu yılki I/O geliştirici konferansındaki en son medya oluşturma modellerini duyurdu. Bunlar ortasında en dikkat alımlı olanı tahminen de Veo 3 oldu. Bu model, sesli videolar üretebilen birinci sürüm olma özelliğini taşıyor.

Veo 3

Model örneğin, kuşların ötüşlerinin duyulduğu bir görüntü yahut art planda trafik seslerinin olduğu bir sokağın görüntüsünü oluşturabiliyor. Google, Veo 3’ün ayrıyeten gerçek dünya fiziğinde ve dudak senkronizasyonunda hayli başarılı olduğunu belirtiyor. Şu anda model sadece ABD’deki Gemini Ultra aboneleri için Gemini uygulamasında ve kurumsal kullanıcılar için Vertex AI’da kullanılabiliyor. Ayrıca, Google’ın yeni AI sinema üretim aracı olan Flow da içinde yer alıyor.

Flow

Flow, sinematik klipler ve sahneler oluşturmak için Veo, Imagen ve Gemini’yi bir ortaya getiriyor. Kullanıcılar istedikleri son çıktıyı doğal lisanda tanım ettiğinde Flow bu tanıma uygun içerikler üretebiliyor. Yeni araç, şimdilik sadece ABD’deki Google AI Pro ve Ultra abonelerine sunulacak, lakin şirket yakında daha fazla ülkede kullanılabilir hale getirmeyi planlıyor.

Google, büsbütün yeni bir görüntü üretim modeli çıkarmış olsa da, Veo 2’yi şimdi gözden çıkarmış değil. Kullanıcılar, Veo 2’ye insan, sahne, tarz ve obje görselleri vererek bunları Flow içinde üretilecek içerikler için referans olarak kullanabilecek. Ayrıca Flow içinde sahneleri döndürme, belli objelere yakınlaştırma üzere kamera kontrolü özelliklerine de erişebilecekler. Kullanıcılar görüntülerin çerçevesini dikeyden yataya genişletebilecek yahut içeriklerinden objeleri ekleyip çıkarabilecekler.

Imagen 4

Google ayrıyeten aktiflikte en son görsel oluşturma modeli Imagen 4’ü tanıttı. Şirket, Imagen 4’ün karmaşık kumaşlar ve hayvan kürkü üzere ince detayları epey uygun bir netlikte işlediğini ve hem fotogerçekçi hem de soyut manzaralar oluşturmada epey başarılı olduğunu söylüyor. Ayrıca, evvelki sürümlere nazaran tipografi oluşturma konusunda da çok daha düzgün. Imagen 4, farklı en-boy oranlarında ve 2K çözünürlüğe kadar imgeler oluşturabiliyor. Imagen 4 artık Gemini uygulaması, Vertex AI ve Docs ve Slides dahil Workspace uygulamalarında kullanılabiliyor. Google ayrıyeten Imagen 3’ten 10 kat daha süratli olan Imagen 4’ün bir versiyonunu yakında” yayınlayacağını duyurdu.

Related Articles