Google, konuşma engelli kişilerin ihtiyaçlarına hizmet edebilecek gelişmiş konuşma tanıma sistemlerinin geliştirilmesine yardımcı olmak için Konuşma Erişilebilirlik Projesi’ne katıldığını duyurdu.
Konuşma tanıma, web sitelerine, konuşma çevirisine, sesli yardımcılara ve işletim cihazlarına erişmek için kullanılır.
Ancak, diğer nedenlerin yanı sıra, bir kullanıcının konuşma düzeni Lou Gehrig hastalığı, Parkinson hastalığı veya Down Sendromu’ndan etkileniyorsa sesle etkinleştirilen cihazların ve hizmetlerin çalışması zor olabilir.
Proje, standart olmayan konuşma kalıplarına sahip olanlar için konuşma tanımayı çalıştırma zorluğunu çözmek için birlikte çalışabilen beş teknoloji şirketini bir araya getiren bir proje oluşturarak bu durumu değiştirmeyi amaçlıyor.
Proje önce İngilizce ile çalışacak, ardından diğer dillere yayılacak.
Konuşma Erişilebilirlik Projesi web sitesi şunları açıkladı:
“…çeşitli, temsili veriler olmadan, ML modelleri çeşitli konuşmaları nasıl anlayacaklarını öğrenemez. Bu proje, bu makine öğrenimi modellerini daha etkin bir şekilde eğitmek için gereken veri kümesini oluşturarak bunu değiştirmeyi amaçlıyor.”
Erişilebilirliği Geliştirmek İçin Yeni Proje
Konuşma Erişilebilirlik Projesi, Illinois Üniversitesi ve sesle etkinleştirilen teknolojiyi daha geniş bir grup insan için erişilebilir kılacak bir teknoloji oluşturmak için birlikte çalışan beş teknoloji şirketi tarafından yürütülen yeni bir programdır.
Aşağıdaki şirketler yeni girişimin üyeleridir:
- Amazon
- Apple
- Meta
- Microsoft
Proje web sitesi çözecekleri sorunu belirttiler:
“Ses yardımcıları ve çeviri araçları gibi günümüzün konuşma tanıma sistemleri, genellikle engellilerle ilişkilendirilen çeşitli konuşma kalıplarına sahip kişileri her zaman tanımaz.
Buna Lou Gehrig hastalığı veya Amyotrofik Lateral Skleroz, Parkinson hastalığı, serebral palsi ve Down sendromundan etkilenen konuşma dahildir.
Aslında, bu ve diğer topluluklardaki birçok kişi en son konuşma tanıma araçlarından yararlanamayabilir.”
Konuşma Tanıma Erişilebilirliğine Çözüm
Konuşma Erişilebilirlik Projesi, farklı ses kalıplarından örnekler toplayacak ve anonim bir veri kümesi oluşturacaktır.
Bu veri kümesi daha sonra, şu anda yetersiz hizmet verilen çeşitli ses kalıplarını daha iyi anlayabilen makine öğrenimi modelleri oluşturmak için kullanılacaktır.
Euphonia Projesi
Google, 2019’da Project Euphonia adlı kendi AI tabanlı erişilebilirlik girişimini başlattı. Bu proje, Google’ın standart dışı konuşulan İngilizceyi anlayabilmek için konuşma tanımayı uyarlamasına yardımcı oldu.
Bu proje, Google projesindeki 2.000’den fazla katılımcının konuşma kalıbı kayıtlarını topladı.
Google’ın Konuşma Erişilebilirlik Projesi’ne katkılarından biri, Project Euphonia’daki katılımcıların yeni erişilebilirlik projesine konuşma kalıbı örneklerine anonim olarak katkıda bulunmalarını kolaylaştırmaktır.
Google’ın duyurusu:
Umudumuz, bu veri setlerini araştırma ve geliştirme ekiplerinin kullanımına sunarak, engelliler de dahil olmak üzere herkes için iletişim sistemlerinin geliştirilmesine yardımcı olabiliriz.”
Gelişmiş Konuşma Tanıma
Bu yeni proje, standart olmayan konuşma kalıplarına sahip olanlara hizmet edebilecek teknolojinin yaratılmasında bir kilometre taşıdır.
Bu yeni projeyi heyecanlandıran şey, beş teknoloji şirketinin hepsinin ayrı silolarda çalışmak yerine konuşma tanıma sorunlarını çözmek için birlikte çalışacak olması.
Yetersiz hizmet alan topluluklar için cihazlara ve İnternete erişimin iyileştirilmesi herkesin yararınadır.