Pazartesi, Eylül 25, 2023
Ana Sayfa Haber Google, Apple, Meta, Amazon ve Microsoft Ses Tanıma'yı Geliştirmek İçin Katılıyor

Google, Apple, Meta, Amazon ve Microsoft Ses Tanıma’yı Geliştirmek İçin Katılıyor

- Advertisement -
- Advertisement -

Google, konuşma engelli kişilerin ihtiyaçlarına hizmet edebilecek gelişmiş konuşma tanıma sistemlerinin geliştirilmesine yardımcı olmak için Konuşma Erişilebilirlik Projesi’ne katıldığını duyurdu.

Konuşma tanıma, web sitelerine, konuşma çevirisine, sesli yardımcılara ve işletim cihazlarına erişmek için kullanılır.

Ancak, diğer nedenlerin yanı sıra, bir kullanıcının konuşma düzeni Lou Gehrig hastalığı, Parkinson hastalığı veya Down Sendromu’ndan etkileniyorsa sesle etkinleştirilen cihazların ve hizmetlerin çalışması zor olabilir.

Proje, standart olmayan konuşma kalıplarına sahip olanlar için konuşma tanımayı çalıştırma zorluğunu çözmek için birlikte çalışabilen beş teknoloji şirketini bir araya getiren bir proje oluşturarak bu durumu değiştirmeyi amaçlıyor.

Proje önce İngilizce ile çalışacak, ardından diğer dillere yayılacak.

Konuşma Erişilebilirlik Projesi web sitesi şunları açıkladı:

“…çeşitli, temsili veriler olmadan, ML modelleri çeşitli konuşmaları nasıl anlayacaklarını öğrenemez. Bu proje, bu makine öğrenimi modellerini daha etkin bir şekilde eğitmek için gereken veri kümesini oluşturarak bunu değiştirmeyi amaçlıyor.”

Erişilebilirliği Geliştirmek İçin Yeni Proje

Konuşma Erişilebilirlik Projesi, Illinois Üniversitesi ve sesle etkinleştirilen teknolojiyi daha geniş bir grup insan için erişilebilir kılacak bir teknoloji oluşturmak için birlikte çalışan beş teknoloji şirketi tarafından yürütülen yeni bir programdır.

Aşağıdaki şirketler yeni girişimin üyeleridir:

  • Amazon
  • Apple
  • Google
  • Meta
  • Microsoft

Proje web sitesi çözecekleri sorunu belirttiler:

“Ses yardımcıları ve çeviri araçları gibi günümüzün konuşma tanıma sistemleri, genellikle engellilerle ilişkilendirilen çeşitli konuşma kalıplarına sahip kişileri her zaman tanımaz.

Buna Lou Gehrig hastalığı veya Amyotrofik Lateral Skleroz, Parkinson hastalığı, serebral palsi ve Down sendromundan etkilenen konuşma dahildir.

Aslında, bu ve diğer topluluklardaki birçok kişi en son konuşma tanıma araçlarından yararlanamayabilir.”

Konuşma Tanıma Erişilebilirliğine Çözüm

Konuşma Erişilebilirlik Projesi, farklı ses kalıplarından örnekler toplayacak ve anonim bir veri kümesi oluşturacaktır.

Bu veri kümesi daha sonra, şu anda yetersiz hizmet verilen çeşitli ses kalıplarını daha iyi anlayabilen makine öğrenimi modelleri oluşturmak için kullanılacaktır.

Euphonia Projesi

Google, 2019’da Project Euphonia adlı kendi AI tabanlı erişilebilirlik girişimini başlattı. Bu proje, Google’ın standart dışı konuşulan İngilizceyi anlayabilmek için konuşma tanımayı uyarlamasına yardımcı oldu.

Bu proje, Google projesindeki 2.000’den fazla katılımcının konuşma kalıbı kayıtlarını topladı.

Google’ın Konuşma Erişilebilirlik Projesi’ne katkılarından biri, Project Euphonia’daki katılımcıların yeni erişilebilirlik projesine konuşma kalıbı örneklerine anonim olarak katkıda bulunmalarını kolaylaştırmaktır.

Google’ın duyurusu:

Umudumuz, bu veri setlerini araştırma ve geliştirme ekiplerinin kullanımına sunarak, engelliler de dahil olmak üzere herkes için iletişim sistemlerinin geliştirilmesine yardımcı olabiliriz.”

Gelişmiş Konuşma Tanıma

Bu yeni proje, standart olmayan konuşma kalıplarına sahip olanlara hizmet edebilecek teknolojinin yaratılmasında bir kilometre taşıdır.

Bu yeni projeyi heyecanlandıran şey, beş teknoloji şirketinin hepsinin ayrı silolarda çalışmak yerine konuşma tanıma sorunlarını çözmek için birlikte çalışacak olması.

Yetersiz hizmet alan topluluklar için cihazlara ve İnternete erişimin iyileştirilmesi herkesin yararınadır.

BENZER YAZILAR

Avatar Nedir?

Avatar Nedir? Genel olarak konuşursak, avatar bir kişinin veya fikrin vücut bulmuş halidir. Bununla birlikte, bilgisayar dünyasında bir avatar, özellikle çevrimiçi bir kullanıcıyı temsil eden bir karaktere atıfta...

Quad-Core Nedir?

Quad-Core Nedir? Dört çekirdekli bir CPU, tek bir çipte dört işlem çekirdeğine sahiptir. Çift çekirdekli CPU’ya benzer, ancak yönergeleri aynı anda işleyebilen (iki yerine) dört...

Yaratıcı Aklın Sentezi – Server Tanilli (Kitap Özeti)

Yaratıcı Aklın Sentezi - Server Tanilli (Kitap Özeti) Giriş bölümünde felsefenin anlamı ve amacı üzerinde durulmuştur. Felsefenin, insan zekasının bu en anlamlı uğraşın amacı, doğa, toplum...
- Advertisment -

POPÜLER YAZILAR

Pixel Saatinizi Her Ne pahasına olursa olsun Koruyun, Çünkü Google Onu Sizin Yerinize Tamir Etmeyecektir

Google, Pixel Watch'unuzun ekranı kırılırsa tamir edilemeyeceğini doğruladı. Bunun nedeni, şirketin resmi olarak saatin yedek ekranlarını satmaması ve şu anda işleri onarmak için üçüncü...

Galaxy S24 Ultra, Samsung’un Cihazdan Çıkardığı İddiasıyla 10x Optik Yakınlaştırmanın Sonunu İşaretleyebilir

Galaxy S24 Ultra rahatlıkla gelecek yılın en iyi akıllı telefonlarından biri olacak ve bu kesin. Samsung'un her yıl cihazlarıyla sayı yapma alışkanlığı var. Bu yıl,...

iPhone 15 Ön Siparişleri Artık 799 Dolardan Başlayarak 1.599 Dolara Kadar Başlıyor

Apple, yalnızca Amerika Birleşik Devletleri'nde değil, dünya çapında 40'tan fazla ülkede dört iPhone 15 modelinin tamamı için resmi olarak ön sipariş almaya başladı. Bilmeyenler için,...

Intel 14. Nesil Core i9-14900K, Core i7-14700K, Core i5-14600K CPU’lar Kanadalı Perakendeci Tarafından Listelendi, Maliyeti Yalnızca 13. Nesle Göre %3 Daha Yüksek

Kanadalı Perakendeci, PC-Kanada Intel'in 14. Nesil Core i9-14900K, Core i7-14700K ve Core i5-14600K CPU'larını ön fiyatlarla listeledi. Kanadalı Perakendeci Tarafından Listelenen Intel 14. Nesil CPU'lar:...