Teknoloji devlerinin yapay zeka yarışlarında her gün yeni bir araçla tanışıyoruz. Bu yetenek son olarak Meta'dan ses odaklı bir yapay zeka aracı olarak geldi.

Facebook AI Research (FAIR) laboratuvarında çalışan araştırmacılar tarafından Meta'nın web sitesinde tanıtılan Audiobox, bu alandaki önceki çalışma Voicebox'un üzerine inşa edilen ses üretimi için yeni bir temel araştırma modeli olarak tanımlanıyor.

Türksat 6A bu gece yörüngesine fırlatılacak Türksat 6A bu gece yörüngesine fırlatılacak

Audiobox, ses girdileri ve doğal dil metin istemlerinin bir kombinasyonunu kullanarak sesler ve ses efektleri üretebiliyor. Bu da çok çeşitli kullanım durumları için özel ses oluşturmayı kolaylaştırıyor. 

Klonlanmış bir sesin söylemesini istediğiniz bir cümleyi veya oluşturmak istediğiniz bir sesin açıklamasını yazmanız yeterli oluyor, bu adımdan sonra geri kalan işlemi Audiobox tek başına hallediyor.

Kullanıcılar ayrıca kendi seslerini kaydedebiliyor ve Audiobox tarafından klonlanmasını sağlayabiliyorlar. 

Meta ayrıca, siren sesi ya da oynayan çocuklar gibi daha fazla ortam sesi ve ses efekti üretmek için bir model ailesi oluşturduğunu ve bunların hepsinin kendi kendini denetleyen model Audiobox SSL üzerine inşa edildiğini belirtiyor.

SSL, verilerin halihazırda etiketlenmiş olabileceği denetimli öğrenmenin aksine, yapay zeka algoritmalarının etiketlenmemiş veriler için kendi etiketlerini oluşturmak üzere atandığı bir derin öğrenme tekniği olarak tanımlanıyor. 

Meta, Audiobox'un interaktif demolarında bunun bir araştırma demosu olduğunu ve herhangi bir ticari amaç için kullanılamayacağını açıkladı.

Şunu da belirtmeden geçmeyelim; geçtiğimiz hafta tanıtılan yeni Imagine by Meta AI görüntü oluşturma web uygulaması gibi, Audiobox da açık kaynak kodlu değil.