Metin Okuma teknolojisi, konuşma bozukluğu olan kişiler için benzersiz ve özelleştirilmiş bir ses üretiyor. Ayrıntılar haberimizde
Xiaomi’nin “Own My Voice” projesi, konuşma bozukluğu olanların benzersiz ve özelleştirilmiş seslere sahip olmalarına olanak tanıyor. Xiaomi, erişilebilirlik alanına yönelik geliştirdiği ileri düzey algoritma uygulamasını ve konuşma teknolojisini tanıttı. Xiaomi AI Lab’ın geliştirdiği spontane tarzındaki Metin Okuma teknolojisi, konuşma bozukluğu olan kişiler için benzersiz ve özelleştirilmiş bir ses üretiyor.
Konuşma bozukluğu çeken kişiler, monoton bir elektronik ses yerine “kendi seslerini” kullanarak başkalarıyla iletişim kurabiliyor.
Projenin gerekçesi
İnsanları önemseyen Xiaomi, teknoloji inovasyonlarıyla insanların farklı ihtiyaçlarını karşılamaya çalışıyor. Konuşma bozukluğu olan birçok kişinin günlük iletişimde benzersiz seslere sahip olma isteğini gören Xiaomi, kullanıcıların kendi seslerine sahip olmaları için “Own My Voice” proje ekibini kurdu.
200’den fazla gönüllüyle çalıştı
Xiaomi, konuşma bozukluğu çeken kişi için en uygun ve kişiselleştirilmiş sesin oluşturulabilmesi adına şirket bünyesinde 200’den fazla gönüllüyle birlikte çalıştı. Gönüllülerin bağışladığı seslerin özelliklerini konuşma bozukluğu çeken kişilerin sesleriyle eşleştirmek için ses izi eşleştirme algoritması kullanıldı. Bu yaklaşımla, konuşma bozukluğu çeken kişinin ses referansının temel sesi olarak en uygun ses bulundu. Kişiselleştirme ve kişisel gizlilik göz önünde bulundurularak seçilen gerçek ses, yeni ve orijinal bir ses oluşturmak için karmaşık bir akustik modifikasyonla manipüle edildi.
Daha sonra, yapay zeka modelini eğitmek için spontane tarzda metin okuma teknolojisi kullanılarak, yeni sesin kademeli olarak bir insanın duygularını ve tonunu doğru bir şekilde ifade edebilen doğal bir ritim ve tonlama kazanması sağlandı.
Projenin önemi
Projenin omurgasını, Xiaomi AI Lab bünyesinde çalışan bir grup konuşma teknolojisi uzmanı oluşturuyor. 2017’den bu yana, Uluslararası Akustik, Konuşma ve Sinyal İşleme Konferansı (ICASSP) gibi en iyi uluslararası konferanslarda konuşma üzerine 37 bildiri yayımladılar.
Spontane tarzda Metin Okuma teknolojisi, sentezlenen sesi tonlama, duraklatma, hız ve diğer özellikler bağlamında gerçek bir insan sesi haline getiriyor. bu, elektronik sesin monoton ve doğal olmayan hissini daha doğal bir sesle değiştiriyor. Şu an bu teknoloji, Xiaomi’nin yapay zeka destekli sesli asistanı Xiaoai ile donatılan birçok akıllı cihazda kullanılıyor.
Tekno Safari YouTube kanalına abone olmak için tıklayın!