Google’ın Yeni Yapay Zekası İnsan Sesini Mükemmel Şekilde Taklit Ediyor

Google’ın Yeni Yapay Zekası

Geçtiğimiz günlerde gerçekçi bir sese sahip olan ve derin bir sinir ağına sahip Wavenet ile ilgili bazı haberler paylaşıldı. Şu anda sistem tüm platformlara Google Asistan için uyumlu hale getirildi.

Gerçekçi insan konuşmasını sentezlemek için kullanabileceği derin bir sinir ağına sahip olan WaveNeti Google Asistanla kullanıma sunuluyor. Konuşmayı sentezleyebilmek için AI iki farklı tekniği harmanlıyor.

Birleştirici olarak kullandığı text-to-speech (TTS), bir insandan gelen kayıt parçalarını bir araya getirebiliyor. Kullanılan bu yöntemin dezavantajı, sesin tonlamalarında değişimler meydana geldiğinde ses kütüphanelerinin değiştirilmesi gerekliliği.

Diğer teknik ise parametrik TTS olarak adlandırılıyor. AI konuşmayı üretebilmek için biz dizi parametre kullanıyor.

Ancak konuşma bazı zamanlar doğal olmayan robotik bir biçim alabiliyor. WaveNet, konvolüsyonel bir sinir ağı kullanılarak geliştirilen bir sisteme dayalı olarak sıfırdan dalga formu üretmektedir.

Bu sistemin başlangıç aşamasında hangi dalga formlarının daha gerçekçi, hangilerinin daha yapay olduğunun belirlenebilmesi için çeşitli konuşma örnekleri kullanıldı.

Bu sayede sentezleme platformu eğitilmiş oldu. Bu çalıma konuşma sentezleyicisine dudakların hareketi gibi detaylar da dahil olmak üzere doğal tonlama üretme imkanı sundu.

Sisteme yüklenen örneklere bağlı olarak farklı veri setlerini kullanan yapay zeka farklı bir aksan ve benzersiz bir ses ortaya çıkardı.

Sistemin en büyük sorunu başlangıç aşamasında önemli bir işlem gücü istemesi ve yavaş olmasıydı. Son 12 ay boyunca sistem üzerinde çalışan mühendisler yapay zekayı ilk halinden 1000 kat hızlı bir forma getirdi.

Kaynak: http://beyinsizler.net/googlein-yeni-yapay-zekasi-insan-sesini-mukemmel-sekilde-taklit-ediyor/