
Robotlara yönelik yeni yapay zeka algoritması, sürekli olarak en son teknolojiye sahip sistemlerden daha iyi performans gösteriyor.
kuzeybatı Üniversitesi mühendisler, akıllı robotlar için özel olarak tasarlanmış yeni bir yapay zeka (AI) algoritması geliştirdi. Yeni yöntem, robotların karmaşık becerileri hızla ve güvenilir bir şekilde öğrenmesine yardımcı olarak, otonom arabalar, teslimat drone’ları, ev asistanları ve otomasyon dahil olmak üzere bir dizi uygulama için robotların pratikliğini ve güvenliğini önemli ölçüde artırabilir.
Maksimum Difüzyon Güçlendirmeli Öğrenme (MaxDiff RL) olarak adlandırılan algoritmanın başarısı, robotları çeşitli deneyimler kazanmak için çevrelerini mümkün olduğunca rastgele keşfetmeye teşvik etme yeteneğinde yatmaktadır. Bu “tasarlanmış rastgelelik”, robotların kendi çevrelerine ilişkin topladığı verilerin kalitesini artırır. Ayrıca, daha yüksek kaliteli veriler kullanılarak simüle edilmiş robotlar daha hızlı ve daha verimli öğrenme sağlayarak genel güvenilirliklerini ve performanslarını artırdı.

MaxDiff RL’nin Üstün Performansı
Northwestern’in yeni algoritmasını kullanan simüle edilmiş robotlar, diğer yapay zeka platformlarıyla karşılaştırıldığında sürekli olarak en son teknolojiye sahip modellerden daha iyi performans gösterdi. Yeni algoritma o kadar iyi çalışıyor ki, robotlar yeni görevleri öğreniyor ve bunları tek bir denemede başarıyla gerçekleştiriyor; ilk seferde doğruyu yapıyor. Bu, deneme yanılma yoluyla daha yavaş öğrenmeyi mümkün kılan mevcut yapay zeka modelleriyle keskin bir tezat oluşturuyor.
Çalışmayı yöneten Northwestern’den Thomas Berrueta, “Diğer yapay zeka çerçeveleri biraz güvenilmez olabilir” dedi. “Bazen bir görevi tamamen yerine getirirler, ancak diğer zamanlarda tamamen başarısız olurlar. Bizim çerçevemizle, robot görevi çözebildiği sürece, robotunuzu her açtığınızda ondan tam olarak yapması istenen şeyi yapmasını bekleyebilirsiniz. Bu, giderek yapay zekaya bağımlı hale gelen bir dünyada hayati önem taşıyan robot başarılarını ve başarısızlıklarını yorumlamayı kolaylaştırıyor.”
Berrueta, Northwestern’de Başkanlık Üyesi ve doktora derecesine sahiptir. McCormick Mühendislik Okulu’nda makine mühendisliği adayı. McCormick’te makine mühendisliği profesörü ve Berrueta’nın danışmanı olan robot bilimi uzmanı Todd Murphey, gazetenin kıdemli yazarıdır. Berrueta ve Murphey makaleyi kendisi de doktora sahibi olan Allison Pinosky ile birlikte yazdılar. Murphey’nin laboratuvarındaki aday.
Bedensiz Bağlantısızlık
Makine öğrenimi algoritmalarını eğitmek için araştırmacılar ve geliştiriciler, insanların dikkatle filtreleyip düzenlediği büyük miktarda büyük veri kullanıyor. Yapay zeka, optimum sonuçlara ulaşana kadar deneme yanılma yöntemini kullanarak bu eğitim verilerinden öğrenir.
Bu süreç, ChatGPT ve Google Gemini (eski adıyla Bard) gibi bedensiz sistemler için iyi işliyor olsa da robotlar gibi bedenlenmiş yapay zeka sistemleri için işe yaramıyor. Bunun yerine robotlar, insan küratörlerin lüksüne gerek kalmadan verileri kendi başlarına topluyor.
Murphey, “Geleneksel algoritmalar robotikle iki farklı şekilde uyumlu değil” dedi. “Öncelikle, bedensiz sistemler, fiziksel yasaların geçerli olmadığı bir dünyanın avantajlarından yararlanabilir. İkincisi, bireysel başarısızlıkların hiçbir sonucu yoktur. Bilgisayar bilimi uygulamaları için önemli olan tek şey çoğu zaman başarılı olmasıdır. Robotikte tek bir başarısızlık felaketle sonuçlanabilir.”
Bu kopukluğu çözmek için Berrueta, Murphey ve Pinosky, robotların hareket halindeyken yüksek kaliteli veri toplamasını sağlayan yeni bir algoritma geliştirmeyi hedefledi. MaxDiff RL, özünde, ortamları hakkında kapsamlı ve çeşitli veriler toplamak için robotlara daha rastgele hareket etme komutunu verir. Robotlar, kendilerinin oluşturduğu rastgele deneyimler aracılığıyla öğrenerek yararlı görevleri gerçekleştirmek için gerekli becerileri kazanır.
İlk Kez Doğruyu Yapmak
Yeni algoritmayı test etmek için araştırmacılar onu mevcut, en son teknoloji modellerle karşılaştırdılar. Bilgisayar simülasyonlarını kullanan araştırmacılar, simüle edilmiş robotlardan bir dizi standart görevi yerine getirmelerini istedi. MaxDiff RL kullanan robotlar genel olarak diğer modellere göre daha hızlı öğreniyordu. Ayrıca görevleri diğerlerinden çok daha tutarlı ve güvenilir bir şekilde yerine getirdiler.
Belki daha da etkileyici: MaxDiff RL yöntemini kullanan robotlar genellikle tek bir denemede bir görevi doğru şekilde yerine getirmeyi başardı. Ve bu, hiçbir bilgi olmadan başladıkları zaman bile oldu.
Berrueta, “Robotlarımız daha hızlı ve daha çevikti; öğrendiklerini etkili bir şekilde genelleme ve yeni durumlara uygulama becerisine sahipti” dedi. “Robotların sonsuz deneme yanılma süresine sahip olamayacağı gerçek dünya uygulamaları için bu çok büyük bir avantaj.”
MaxDiff RL genel bir algoritma olduğundan çeşitli uygulamalar için kullanılabilir. Araştırmacılar bunun, alanı geride bırakan temel sorunlara değineceğini ve sonuçta akıllı robotikte güvenilir karar almanın önünü açacağını umuyorlar.
Pinosky, “Bunun yalnızca hareket eden robotik araçlar için kullanılması gerekmiyor” dedi. “Aynı zamanda, mutfakta bulaşık makinesini nasıl dolduracağını öğrenen robot kol gibi sabit robotlar için de kullanılabilir. Görevler ve fiziksel ortamlar daha karmaşık hale geldikçe, öğrenme sürecinde somutlaştırmanın rolü daha da önemli hale gelir. Bu, daha karmaşık, daha ilginç görevleri yerine getiren gerçek sistemlere doğru atılmış önemli bir adımdır.”
Referans: “Maksimum yayılım takviyeli öğrenme” 2 Mayıs 2024.
Çalışma, ABD Ordusu Araştırma Ofisi (bağış numarası W911NF-19-1-0233) ve ABD Deniz Araştırmaları Ofisi (bağış numarası N00014-21-1-2706) tarafından desteklenmiştir.
0 Yorumlar