Gerçek Zamanlı Mülakat Konuşmadan Metne Nasıl Çalışır
By Aaron Cao · Updated 2026-05-19
Mikrofonunuz ve sistem sesiniz aynı anda yakalanır, konuşma tanıma motoru tarafından neredeyse gerçek zamanlı olarak metne dönüştürülür ve AI modeline beslenerek cevap önerileri oluşturulur — bunların tümü yalnızca sizin görebileceğiniz özel bir katmanda görüntülenir.
İşi Yapan İki Ses Akışı
Gerçek zamanlı mülakat transkripsiyonu aynı anda iki ayrı ses akışının yakalanmasına bağlıdır:
- Sistem sesi (loopback) — Zoom, Google Meet veya Microsoft Teams üzerinden gelen mülakatçının sesi.
- Mikrofon sesi — konuşurken kendi sesiniz.
SubcueAI'nin yerel masaüstü uygulaması, macOS ve Windows'ta mevcut standart işletim sistemi ses API'lerini kullanarak her iki akışı aynı anda yakalar. Yakalama OS düzeyinde gerçekleştiği için — toplantı uygulamasının içinde değil — hiçbir tarayıcı eklentisi veya toplantı botu gerekmez. Birleştirilmiş akış daha sonra konuşma tanıma motoruna iletilir.
Ham Sesten Metne: Transkripsiyon İşlem Hattı
Ses yakalandıktan sonra, tam bir cümleyi beklemek yerine kısa, örtüşen ses parçalarıyla çalışan akışlı konuşmadan metne işlem hattından geçer. Bu yaklaşım gecikmeyi düşük tutar — genellikle konuşmadan okunabilir metne birkaç saniye sürer.
- Ses Etkinliği Algılama (VAD) sessizliği filtreler, böylece motor yalnızca konuşma içeren kareleri işler, gürültüyü azaltır ve işlem süresini tasarruf eder.
- Akustik modelleme ses özelliklerini fonemlere, ardından kelimelere eşler ve büyük konuşma veri kümeleri üzerinde eğitilmiş bir sinir ağı kullanır.
- Dil modelleme kelime dizilerini olasılığa göre sıralar, mülakatlarda yaygın olan teknik kelime dağarcığı ve özel isimler için doğruluğu artırır.
Sonuç, konuşma ilerledikçe sürekli güncellenen kayan bir transkripttir.
Transkriptten AI Cevap Önerilerine
Canlı transkript, SubcueAI'nin cevap öneri katmanına girdidir. Sistem, cümle yapısı ve noktalama ipuçlarına dayanarak bir soru sorulduğunu algıladığında, ilgili bağlamı önerilen bir yanıt oluşturan büyük bir dil modeline (LLM) gönderir.
- Öneriler SubcueAI'nin kayan yerel katmanında görünür, yalnızca ekranınızda görünür — toplantı penceresine paylaşılmaz.
- Katman, ekran paylaşım bölgesi dışında kalacak şekilde tasarlanmıştır, böylece ekranınızı paylaşan katılımcılar tarafından görünmez.
- Herhangi bir öneriyi okuyabilir, uyarlayabilir veya yok sayabilirsiniz; araç düşünmenizi desteklemek içindir, kelimesi kelimesine senaryo oluşturmak için değil.
Katmanı mülakatınızdan önce konumlandırma konusunda rehberlik için kurulum eğitimine bakın.
Gecikme, Doğruluk ve Dürüst Sınırlamalar
Gerçek zamanlı transkripsiyon kalitesi, herhangi bir uygulamanın tam kontrolü dışında kalan birkaç faktöre bağlıdır:
- Mikrofon kalitesi ve arka plan gürültüsü — kulaklık mikrofonu, yerleşik dizüstü mikrofonuna göre doğruluğu önemli ölçüde artırır.
- İnternet bağlantısı — AI çıkarım adımı bulut destekliyse, ağ gecikmesi yanıt süresine eklenir.
- Aksanlar ve konuşma hızı — modern sinirsel konuşma modelleri geniş bir aksan yelpazesini ele alır ancak mükemmel değildir.
- Denetlenen veya kaydedilen mülakatlar — SubcueAI'nin katmanı yerel ve özeldir, ancak ekran kaydedilen veya denetlenen ortamlarda katman dikkatlice konumlandırılmaz veya gizlenmezse kayıtta görünebilir. Herhangi bir yardım aracını kullanmadan önce belirli mülakatınızın kurallarını her zaman inceleyin.
Gizlilik ve mülakatçıların ne görebileceği hakkında daha geniş bir bakış için güvenlik ve gizlilik sayfasına gidin.