Bilim ve Teknoloji

Google Ses Arama Geliştiriyor | Sesleri Aramak Ne Kadar Zor?

Paylaş

Google’ın bir blog makalesinde yayınladığı erken test sonuçları, ses aramanın yapılmasının göründüğünden daha zor olduğunu gösteriyor.

Bu testlerin ayrıntıları, KQED’deki dijital stratejik ortaklıklardan sorumlu Kıdemli Başkan Yardımcısı Tim Olson tarafından kaleme alınan bir makalede paylaşılıyor.

Google, sesi daha kolay bulunabilir hale getirmek için ortak bir çaba içinde KQED ile ortaklık yapmaktadır.

Bir yapay zeka hizmetleri sağlayıcısı olan KUNGFU.AI’nin yardımıyla Google ve KQED, sesi hızlı ve hatasız bir şekilde nasıl yazıya dökeceklerini belirlemek için testler yaptı.

Google Ses Arama

Ses Aramanın Zorlukları

Ses aramayı bir olasılık haline getirmenin önündeki en büyük engel, sesin aranmadan ve sıralanmadan önce metne dönüştürülmesi gerektiğidir.

Şu anda sesi hızlı bir şekilde bulunmasını sağlayacak şekilde doğru bir şekilde yazmanın bir yolu yoktur.

Dünya çapında bir ölçekte ses aramanın mümkün olmasının tek yolu, otomatik transkripsiyonlardır. Manuel transkripsiyonlar, yayıncılardan önemli ölçüde zaman ve çaba gerektirir.

KQED’den Olson, özellikle işitsel haberlerin endekslenmesi söz konusu olduğunda, ses transkripsiyonları için doğruluk çubuğunun yüksek olması gerektiğine dikkat çekiyor. Konuşmadan metne alanında şimdiye kadar yapılan ilerlemeler şu anda bu standartları karşılamıyor.

Konuşmadan Metne Teknolojisinin Sınırları

Google, en son konuşmadan metne araçlarını bir ses haber koleksiyonuna uygulayarak KQED ve KUNGFU.AI ile testler yaptı.

Yapay zekanın uygun isimleri (adlandırılmış varlıklar olarak da bilinir) tanımlama yeteneğinde sınırlamalar keşfedildi.

Adlandırılmış varlıkların bazen doğru bir şekilde tanımlanabilmesi için bağlamın anlaşılması gerekir ki bu yapay zekada her zaman bulunmaz.

Adı geçen varlıklar anlaşılmadığında, AI ne söylendiğine dair en iyi tahminini yapar. Ancak bu, web araması için kabul edilemez bir çözümdür, çünkü yanlış bir çeviri yazı, söylenenlerin tüm anlamını değiştirebilir.

Gelecek ne getirecek?

Teknolojiyi geliştirildiğinde geniş çapta erişilebilir hale getirme planlarıyla sesli arama konusunda çalışmalar devam edecek.

Google Haber ve Yayıncılık İş Ortağı Lideri David Stoller, bu proje üzerinde çalışma tamamlandığında teknolojinin açıkça paylaşılacağını söylüyor.

Google Yeni Girişimi’nin temellerinden biri, zor sorunlara yeni yaklaşımlar geliştirmektir. Tamamlandığında, bu teknoloji ve ilgili en iyi uygulamalar açık bir şekilde paylaşılacak ve beklenen etkiyi büyük ölçüde artıracak. “

Google Ses Arama

KQED’den Olson, günümüzün makine öğrenimi modellerinin hatalarından ders almadığını, insanların devreye girmesi gerekebileceğini söylüyor.

Sonraki adım, haber odalarının yaygın transkripsiyon hatalarını tanımlayarak makine öğrenimi modellerini iyileştirmeye yardımcı olduğu bir geri bildirim döngüsünü test etmektir.

Yakın gelecekte, bu konuşmadan metne modellerdeki iyileştirmelerin sesi metne daha hızlı dönüştürmeye ve sonuçta insanların sesli metinleri daha etkili bir şekilde bulmalarına yardımcı olacağından eminiz.”

 

Kaynak: Google

Tags: , , ,
Kitap Okumak Bizim İçin Neden Önemli?
Duchamp’ın Pisuvarı Sanatı Nasıl Değiştirdi?

En Çok Okunan

Bunlarda İlginizi Çekebilir

Menü