Windows Speech Recognition

Ses tanıma yazılımları uzun süredir piyasada dolaşıyor. Ancak bu yazılımların hem maddi açıdan hem de kullanım kolaylığı açısından iyi yerlere gelmesinin mazisi o kadar da uzun değil. İlk çıkan,  yazılımların, kullanıcıların asıl ihtiyaçlarını çok da karşılamayan temel sürümlerinin yüzlerce dolar; tam özellikli sürümlerin ise binlerce doları bulduğu günlerden bugün çözümlerin her gün kullandığımız işletim sistemlerinin içine entegre edildiği bir noktaya geldik. İşte tam bu noktada, Windows Vista ile birlikte gelen Speech Recognition (Konuşma Tanımı) özelliğinin ayrıntılarına geçmeden önce açıklığa kavuşturmamız gereken bir nokta var.

Ses tanıma (voice recognition) ile konuşma tanıma (speech recognition) birbirinden farklı kavramlar. Ses tanıma, bugün hemen tüm cep telefonlarında dahi bulunan ve kullanıcının önceden kaydettiği ses parçasını, o an söylenen ses parçasıyla eşleştirip o parçaya karşılık gelen işlevi yerine getirmeyi içeriyor. Yani siz önce telefona “Takvim” diyerek sesinizi tanıtıyorsunuz, o kelimeyi söylediğinizde ne yapacağını belirtiyorsunuz ve daha sonra size ne zaman “Takvim” deseniz, telefonunuz size takvimi açıyor. Peki, sesi sizden çok farklı olan bir arkadaşınız sizin telefonunuza seslendiğinde ne oluyor? Telefonunuz bu sesi tanımıyor ve görevini yerine getiremiyor. Konuşma tanıma ise bugün bazı otomatik yanıt sistemlerinde de kullanıldığı üzere, ses yerine söylenene odaklanan bir teknoloji. Burada ifadeyi söyleyen değil ifadenin ne olduğuna odaklanılıyor ve söylenenler yazıya dökülüyor veya karşılık gelen işlem gerçekleştiriliyor.

İşte Windows Vista ile birlikte sunulan Speech Recognition özelliği, sizin söylediklerinizi tanıyıp size yardımcı oluyor. Alışması biraz zaman alsa da yeterli zamanı ayırmanız halinde Speech Recognition özelliği size konuşarak belge oluşturma ve düzenlemenin yanı sıra bilgisayarınızın çoğu işlevini kontrol etme imkanı sunuyor.

Başlamadan herkesin kafasında canlanan ilk soruya yanıt verelim. Speech Recognition özelliği şu an için Türkçeyi desteklemiyor. Her ne kadar yazıldığı gibi okunan bir dil olması nedeniyle Türkçenin bu yazılım için bir avantaj olacağını düşünsek de olayın ticari boyutu göz önüne alındığında Microsoft’u yaptığı seçimlerden dolayı suçlamamamız gerektiğini düşünüyorum.
Speech Recognition özelliğini kullanmaya başlamadan önce yaklaşık bir saat kadar zaman ayırıp kurulumunu yapmanız gerekiyor. Kurulum süreci; mikrofonlu kulaklığınızı veya mikrofonunuzu tanıma, bir eğitimi geçme ve yazılımı, konuşma şeklinizi tanıyacak şekilde eğitme adımlarından oluşuyor. Başlamak için şu adımları uygulayın:
  • Control Panel’ı açıp “Speech Recognition Options”ı tıklayın. Açılan panelde konuşma tanımayı başlatma, mikrofonunuzu yapılandırma, eğitimi başlatma, yazılımı eğitme ve komutları öğrenmenize yardımcı olacak konuşma başvuru kartını açma seçenekleri bulunur.
  • “Set up microphone”u çift tıklayın. Mikrofonun sisteminizde düzgün şekilde çalıştığından emin olmak için verilen talimatları uygulayın. Burada şunu belirtmekte fayda var: Teoride bu özellik her mikrofonla kullanılabiliyor gibi görünse de, ses kartınıza takılan standart mikrofonlar, konuşma tanıma özelliğinin ihtiyacı olan ses kalitesini tam olarak sağlayamıyor. USB’ye takılan kulaklıklı mikrofonları veya yalnızca mikrofonları tercih etmeniz daha iyi sonuçlar almanızı sağlayacaktır.
  • “Speech Recognition Options” paneline dönüp “Start Speech Recognition” seçeneğini çift tıklayın. Speech Recognition uygulamasını ilk çalıştırdığınızda ilk kurulum ve eğitim adımları gerçekleştirilir. Yaklaşık yarım saat süren ilk eğitim, bir yandan konuşma tanıma ile kullanmanız gereken komutları öğretirken diğer yandan yazılımı, sesinizi tanıyacak şekilde eğitir. Eğitim sizden papağan gibi aynı şeyleri tekrarlamanızı istediğinde, sesinizi tanımaya çalıştığını unutmayın.
  • “Speech Recognition Options” ekranından “Train your computer to better understand you” Seçeneğini belirleyin. Bu adımda oldukça uzun bir metni birden fazla şekilde okumanız istenecek. Bu uygulamanın da amacı bilgisayarın ses örneği veritabanını genişletmek, tanımayı geliştirmek ve hataları azaltmaktır.
  • Sorulduğunda programın “Documents” klasörünü taramasına izin verin. Konuşma Tanıma özelliği, sık kullandığınız kelimeleri veritabanına ekleyerek ifadenizden tam çıkaramadığı kelimenin hangisi olduğuna karar vermek için belgelerinizde hangi sözcüğü kaç kere kullanmış olduğunuza bakar.

Kurulumu sessiz bir yerde yapmanız en iyisidir. Her şeyden önce, yazılımı eğitirken sesinizin duyulmasını ve yalnızca kendi sesinizin duyulmasını istersiniz. Daha da önemlisi, bilgisayarınızla konuştuğunuzu gören insanlar siz pek de iyi gözle bakmayabilir.

Kurulumu tamamladıktan sonra modern konuşma tanıma uygulamasının nimetlerinden faydalanmaya başlayabilirsiniz. Ayrıntılarını yazılımın eğitim aşamasında tamamladığınız temel özelliklerle ilgili birkaç ipucunu aşağıda bulabilirsiniz:

  • Speech Recognition özelliğini sessiz bir yerde kullanın. Mikrofonunuz çok iyi değilse, çevrenizdeki gürültüleri yakalar ve metne dönüştürmeye çalışır.
  • Düşünme aşamasında Speech Recognition özelliğini kapatın. Speech Recognition özelliği “stop listening” dediğinizde uyku moduna geçer, “start listening” dediğinizde yeniden kulağını size verir. Genellikle birinin sizi dinlediğini bilmek acele etmenize ve bu nedenle kendinizi gergin hissetmenize neden olduğundan düşünme aralarında bu özelliği uyku moduna geçirmek kendinizi daha rahat hissetmenizi sağlar. Dahası, özelliği açık bıraktığınızda program hareketlerinizin sonunda çıkan sesleri ve hatta nefes alıp verişlerinizi bile metne dönüştürmeye çalışır.
  • Yüksek sesle ve net konuşun. Bu şekilde kendinizi topluluk karşısında konuşuyormuş gibi hissedebilirsiniz. Kendinizi “10. Yıl Nutku”nu okuyormuş gibi düşünün.
  • Kodlayın. Yazılımın sözlüğüne yeni bir kelime eklediğinizde veya başka kelimelerle karışabilecek bir kelime söylediğinizde istediğiniz sonucu alamamanız söz konusu. Bunun için “spell it” dedikten sonra kelimeyi yavaş yavaş ve harf harf söylemeniz yeterli.
  • Çalışmayı aksatmayın. Yazılımı daha rahat kullanabilir hale geldikten sonra konuşma şekliniz değişecek, daha açık ve net konuşacaksınız ve daha hızlı düşünmeye başlayacaksınız. Yine de belirli aralıklarla eğitimi tekrar gözden geçirmenizi, belgelerinizin taranarak yeni kelimelerin bulunmasını sağlamanız önerilir.
  • Sabırlı olun. İlk birkaç denemenizde çok fazla hatayla karşılaşmak sizi yıldırmasın. Zamanla ve çalışarak çok daha iyi olacaksınız.

Bu saydıklarımın hepsi konuşma tanımayı engelli olma durumunun halinde kullanmak için geçerli olan nedenler. Bu özelliği hakkını vererek kullanmak için sesinizi kontrol edebilmeniz ve düzenli pratik yaparak yazılımı kendinize alıştırmanız gerekir. Bu özellik size ayrıca söylediklerinizi karşınızda görmeniz nedeniyle aslında düzgün cümle kurmanın ne kadar zor olduğunu da göstererek sizi bu yönde de eğitir. Bu özelliği kullanarak aldığınız kısa notları bir konuşma haline getirebilir, bunu yaparken kulağa hoş gelmeyen yerleri atabilirsiniz. Gün içinde dijital kayıt cihazı kullanıyorsanız aldığınız kayıtları yazıya dökmek için bu özelliği kullanabilir, zamandan büyük ölçüde tasarruf edebilirsiniz.

Çok çok uzun zaman önce Mike, havalı siyah arabası KITT’e lafını hiç esirgemeden komutlarını sıralarken o teknolojilerin bir gün gerçeğe dönmesi ve günlük hayata girmesi çok kişinin hayallerini süsleyen bir şeydi. Siz de Speech Recognition ile bilgisayarınızın bir dediğinizi iki etmemesini sağlayabilir, topluluk önünde konuşma alıştırmaları yapabilir, kayıtları deşifre etmek için geçirdiğiniz zamanın siz kalan kısmında ne yapacağınızı planlamaya başlayabilirsiniz.

Mehmet Lütfi Pişirici

Hiç yorum yok:

Yorum Gönder