DikteAPIF20 kullanılıyorken konuşmaların tanınabilmesi için sistemin kullanıcının sesiyle eğitilmesi gerekiyor mu?

Hayır. DikteAPIF20 sahip oluğu genel ses veritabanı ile bayan, erkek ve çocuk ayrımı yapmaksızın konuşmaların tanınmasını gerçekleştirebilecek yetenektedir.


DikteAPIF20 kullanarak konuşma tanıma yeteneği kazandırdığım yazılım içerisinde tanınmasını istediğim kelimelerin sisteme tanıtılmasını nasıl sağlayabilirim.
IsolatedRecognitionAddWord metodunu kullanarak istediğiniz kelimeyi sisteme tanıtabilirsiniz. Burada dikkat etmeniz gereken mümkün mertebe bu kelimelerin Türkçe seslendirilişini(okunuşunu) parametre olarak veriyor olmanızdır. Xanax kelimesi zanaks olarak okunduğu gibi "plan" kelimesi de pilan olarak okunur. Bu kelimeleri sisteme IsolatedRecognitionAddWord('zanaks') ve IsolatedRecognitionAddWord('pilan') olarak tanıtmalısınız.

Örnek kodları inceledim. Ancak örnek kodların sadece PowerBuilder, Delphi, .net c++, .net C-Sharp, .net Java-Sharp ve .net VisualBasic için geliştirilmiş olduğunu gördüm. Bunlardan başka uygulama geliştirme araçlarında da DikteAPI bileşenlerini kullanabilir miyim?
Bahse konu bileşenler DikteAPI dll kütüphanesinin daha rahat kullanılabilmesi için geliştirilmiştir. DikteAPI bileşenlerini, ActiveX kullanabildiğiniz tüm uygulama geliştirme araçlarında kullanabileceğiniz gibi uygulama geliştirme aracınızda DikteAPI dll kütüphanesini doğrudan kullanmak suretiyle de   formlarınıza kolaylıkla konuşma tanıma yeteneği kazandırabilirsiniz.

DikteAPI Windows işletim sistemi harici işletim sistemlerinde kullanılabilir mi?
DikteAPI Windows işletim sisteminde çalışacak şekilde geliştirilmiştir. Diğer işletim sistemlerinde doğrudan çalışmaz.

DikteAPI ile uygulamam arasında gerçekleşen arka plan etkileşimleri hakkında bilgi istiyorum.
Konuşmaların işlenmesi ve tanınması süreci DikteAPI dll kütüphanesi marifetiyle gerçekleştirilmektedir. DikteAPI dll kütühanesi, konuşmaların tanınması süreci tamamlandığında "Initialize" metodu ile kendisine daha önce tanıtılan tutamak bilgisine(Handle) WM_USER+1 mesajını yollar. Uygulamanızda Şayet DikteAPI bileşenlerini (DikteAPIOCX.ocx vs.) kullanıyorsanız bileşen bu mesajı aldığında bir olay(event) tetikler ve konuşmaların yazı olarak karşılığı  tetiklenen eventin ilgili koduna otomatik olarak aktarılır.Şayet doğrudan DikteAPI dll kütüphanesini kullanıyorsanız "Initialize" fonksiyonu üzerinden sisteme tanıttığınız Handle bilgisine yollanan WM_USER+1 mesajını yakalayıp "GetLastRecognizedString" fonksiyonu üzerinden konuşmanın yazı olarak karşılığını alabilirsiniz.

Yazılımımda DikteAPI kullanarak daha önce oluşturulmuş ses kayıtlarında bulunan konuşmaların yazıya çevrilmesini sağlayabilir miyim?
Hayır. DikteAPI gerçek zamanlı konuşma tanıma teknolojisi üzerine kuruludur.

Bütünleşik DikteAPI içeren yazılımın kullanıcısının ses tonu (gribal enfeksiyon gibi sesi etkileyen rahatsızlıklar sonucu) değiştiğinde tanıma performansı azalır mı?
İhmal edilebilir miktarda performansta azalma olabilir.

Bütünleşik DikteAPI içeren yazılımın kullanıcıları arasında ses tonu birbirine yakın olanlar aynı kullanıcı üzerinden sistemi kullandığında konuşma tanıma performansı azalır mı?
Her insanın gırtlak yapısı farklıdır. (Ses kısılması gibi rahatsızlıklar bu yapıyı değiştirmez.) Bu nedenle farklı kullanıcıların aynı kullanıcı üzerinden sistemi kullanması durumunda tanıma performansı büyük oranda düşer.

Bütünleşik DikteAPI içeren yazılımın kullanıcıları yakın mesafede (yan yana) çalışmak zorundalar. Bu durum sistemin performansını ne ölçüde etkiler?
Şayet gürültü önleyici yetenekte mikrofonlar kullanılıyorsa kullanıcılar bir birlerinin konuşmalarından etkilenmezler. Diğer durumlarda etkileşimden kaynaklı problemlerin oluşmasına engel olmak için yazılımınızda DikteAPI kütüphanesinde bulabileceğiniz SetVADTreshold() ve SetMicSensitivity() metotlarını kullanıma açmanızı öneririz.

Bütünleşik DikteAPI içeren yazılımı bir bilgisayar üzerinde aynı anda kaç kişi kullanabilir?
DikteAPI, kullanıcı bilgisayarının sistem kaynaklarını kullanarak aynı anda sadece bir kişinin konuşmalarını  yazıya çevirebilecek yetenekte geliştirilmiştir.

DikteAPI kullanarak konuşma tanıma yeteneği kazandırdığım yazılım için dağıtacağım mikrofonun kalitesi tanıma performansını etkiler mi?

Temel olarak konuşma tanıma sistemlerinde mikrofonun önemli bir yeri vardır. Kaliteli mikrofon kullanılması tanıma başarısını artırır.

Bununla birlikte uygulamanızın kullandığı kelime kapasitesine bağlı olarak dağıtacağınız mikrofonlara yönelik testlerinizi gerçekleştirmenizin ardından daha az kalitede mikrofonların kullanılmasını tercih edebilirsiniz.

Sistemin kullanıcının sesi ile eğitilmesi ile ilgili aşamada kullanılan mikrofonun daha sonra değişmesi durumunda tanıma performansında, uygulamanızın kullanabileceği kelime kapasitesi ile ters orantılı olacak şekilde bir düşüş gözlenebilir.

Lütfen dağıtacağınız mikrofonun belirlenmesi aşamasında bizimle irtibata geçin.


Bütünleşik DikteAPI içeren yazılımın kullanıcısı konuşmasının hatalı tanındığı durumlarda nasıl bir yol izlemeli?

DikteAPI kütüphanesi bütünleşik öğrenme mekanizmaları içerir. WordListUpdateWord(), BuildGrammer(), TrainGrammer() gibi tanınacak kelime kapasitesini genişletebilmenizi ve düzenleyebilmenizi sağlayan fonksiyonların yanında, TrainLastDetectedSpeech(), StartRecordingAdaptationUtterances() ve AcousticAdaptation() gibi kullanıcının sesi ile sistemi eğitebilmenize yardımcı olacak fonksiyonları da tanıma hatalarını gidermek amacıyla kullanılabilecek şekilde yazılımınızda kullanıma açabilirsiniz.


DikteAPI kullanarak konuşma tanıma yeteneği kazandırdığım yazılımın kullanıcı ses eğitimi süreci ile ilgili bilgi istiyorum?

Bu süreç yazılımınızın kullanım amacına göre değişen tanınacak kelime kapasitesine bağlı olacak şekilde her biri 3-4 kelimeden oluşan 40 ila 500 cümle arasında ses kaydının DikteAPInin içerdiği bütünleşik kayıt fonksiyonu marifetiyle alınması sürecidir. 20bini aşkın kelime kapasitesi kullanımına yönelik geliştirilen DikteAPI uygulamalarında 500 cümle ile tanıma başarısının %95in üzerine çıktığı ve bunun yanında bin kelime kapasitesi kullanımına yönelik geliştirilen DikteAPI uygulamalarında 40 cümle ile söz konusu %95 başarı oranının kolayca yakalandığı görülmüştür.


DikteAPI ile konuşma tanıma süreci nasıl gerçekleşiyor?

Konuşma tanıma sistemindeki tanıma algoritmalarının çalışabilmesi için sistemin eğitilmiş olması gerekir.

DikteAPI 2 tip eğitim içerir:
1) Akustik Eğitim : Sistem sesleri ve bu seslere karşılık gelen metinleri öğrenir.
2) Dilbilgisi Eğitimi : Sistem kelimeleri ve kelime dizilişlerini öğrenir.

Akustik eğitim kullanıcıdan alınan ses kayıtları ve bu kayıtlara karşılık gelen metinler sisteme verilerek gerçekleştirilir. Dilbilgisi eğitimi ise bütünleşik DikteAPI içeren uygulamanın ihtiyaç duyduğu kelimelerin içinde bulunduğu metin dosyaları sisteme verilerek gerçekleştirilir.

Her insanın sesinin diğerlerinden farklı olması nedeniyle kullanıcıyı sisteme adapte edebilmek adına ondan bir dizi ses kaydı alınır. Alınan bu sesler kendilerine ait metinlerle birlikte sisteme verilerek adaptasyon işlemi gerçekleştirilir. Bu şekilde DikteAPI’nin hafızasındaki Akustik bilgi, sistem kullanıcının sesini tanıyacak şekilde güncellenir. Ses ve gramer eğitimi gerçekleştirilmiş bir sistemde, kullanıcı mikrofona konuştuğunda tanıma algoritmaları akustik olarak algılanan sese en çok benzeyen kelimeleri seçer ve her bir kelimenin yine akustik olarak olasılığını hesaplar.Akustik değerlendirme sonucu seçilen aday kelimelerden hangilerinin gramer olarak uygun olduğu belirlenir, her birine bir gramer olasılığı atanır ve akustik değerlendirmenin işlemci yükünü azaltmak için sonraki kelimeler triGram yapılar kullanılarak tahmin edilir. Döngünün sonunda en yüksek olasılığı olan dizi, tanınan kelime dizisi olur ve Dikte bu diziyi ekrana yazar.


DikteAPIye kelimeleri ve kelime dizilişlerini nasıl öğretebilirim?

word, rtf ve txt uzantılı metin dosyalarının içerisinde bulunan kelimeler ve bu kelimelerin kullanım istatistikleri DikteAPInin içerdiği bütünleşik fonksiyonlar marifetiyle kolayca sisteme öğretilebilmektedir. Dikkat edilmesi gereken husus DikteAPInin Türkçe konuşma tanıma teknolojisi üzerine kurulu olduğu ve bu nedenle okunuşları yazılışlarından farklı olan kelimelerin okunuşlarının girilmesi gerektiğidir.


DikteAPI için izlediğiniz fiyat politikası hakkında bilgi istiyorum.

DikteAPI her bir kullanıcı için lisanslanır ve tüm Türkiye’de DikteAPI kullanıcı lisansı fiyatları kullanıcı sayısına göre belirlenir.


DikteAPISunucu yazılımının geliştirilme amacı ve işlevi hakkında bilgi istiyorum.

Ağa bağlı bir sunucu bilgisayar üzerinde çalışan DikteAPISunucu yazılımı, tanıma sırasında kullanılan verilerin kontrolünü üstlenerek, kullanıcının ağa bağlı her hangi bir bilgisayarda ek bir işlem yapmaksızın çalışmaya devam edebilmesine olanak sağlar.

Gramer oluşturma, akustik adaptasyon ve otomatik yedekleme üniteleri ile DikteAPISunucu, kelime listesi yönetimini ve uygulamanın DikteAPI ile ilgili kısmının dağıtımını otomatik olarak tek bir merkezden gerçekleştirerek kurumsal uygulamalarda yönetim ve kullanım kolaylığını da beraberinde getirir.


Oracle Forms ile geliştirdiğim yazılımımda konuşma tanıma yapılan bir ekranda iken başka bir ekran açtığımda uygulamam hata veriyor.
Diğer ekran açılmadan hemen önce konuşma tanıma işlemlerinin PauseSpeechRecognition metodu ile durdurulması gerekmektedir.

Sadece bir ekrana yerleştirdiğim DikteAPI bileşeni ile yazılımımda bulunan diğer ekranlarda da konuşma tanıma işlemi yapabilirmiyim?
Konuşma tanıma yapılması istenen ekranların tümünde ayrıca bir DikteAPI bileşeninin oluşturması ve her bir bileşen için ilgili ekran açıldığında Initialize metodunun çağırılması en uygun çözüm olacaktır.

Yazılımımda bulunan ekranların tümüne DikteAPI bileşeni yerleştirmem sistem kaynaklarını tüketir mi?
DikteAPI ye ihtiyaç duyduğu sistem kaynağı bir defaya mahsus tahsis edilir. Diğer ekranlara eklenen DikteAPI bileşeni için sistem kaynaklarında fazladan bir kullanım söz konusu olmayacaktır. Bununla birlikte her yeni ekran için yeniden StartSpeechRecognition metodunun çağırılmaması, StartSpeechRecognition metodunun sadece kullanıcı değiştiğinde çağırılması gerektiği unutulmamalıdır.