Gerçek Zamanlı Mülakat Konuşmadan Metne Nasıl Çalışır

By Aaron Cao · Updated 2026-05-19

Mikrofonunuz ve sistem sesiniz aynı anda yakalanır, konuşma tanıma motoru tarafından neredeyse gerçek zamanlı olarak metne dönüştürülür ve AI modeline beslenerek cevap önerileri oluşturulur — bunların tümü yalnızca sizin görebileceğiniz özel bir katmanda görüntülenir.

İşi Yapan İki Ses Akışı

Gerçek zamanlı mülakat transkripsiyonu aynı anda iki ayrı ses akışının yakalanmasına bağlıdır:

  • Sistem sesi (loopback) — Zoom, Google Meet veya Microsoft Teams üzerinden gelen mülakatçının sesi.
  • Mikrofon sesi — konuşurken kendi sesiniz.

SubcueAI'nin yerel masaüstü uygulaması, macOS ve Windows'ta mevcut standart işletim sistemi ses API'lerini kullanarak her iki akışı aynı anda yakalar. Yakalama OS düzeyinde gerçekleştiği için — toplantı uygulamasının içinde değil — hiçbir tarayıcı eklentisi veya toplantı botu gerekmez. Birleştirilmiş akış daha sonra konuşma tanıma motoruna iletilir.

Ham Sesten Metne: Transkripsiyon İşlem Hattı

Ses yakalandıktan sonra, tam bir cümleyi beklemek yerine kısa, örtüşen ses parçalarıyla çalışan akışlı konuşmadan metne işlem hattından geçer. Bu yaklaşım gecikmeyi düşük tutar — genellikle konuşmadan okunabilir metne birkaç saniye sürer.

  • Ses Etkinliği Algılama (VAD) sessizliği filtreler, böylece motor yalnızca konuşma içeren kareleri işler, gürültüyü azaltır ve işlem süresini tasarruf eder.
  • Akustik modelleme ses özelliklerini fonemlere, ardından kelimelere eşler ve büyük konuşma veri kümeleri üzerinde eğitilmiş bir sinir ağı kullanır.
  • Dil modelleme kelime dizilerini olasılığa göre sıralar, mülakatlarda yaygın olan teknik kelime dağarcığı ve özel isimler için doğruluğu artırır.

Sonuç, konuşma ilerledikçe sürekli güncellenen kayan bir transkripttir.

Transkriptten AI Cevap Önerilerine

Canlı transkript, SubcueAI'nin cevap öneri katmanına girdidir. Sistem, cümle yapısı ve noktalama ipuçlarına dayanarak bir soru sorulduğunu algıladığında, ilgili bağlamı önerilen bir yanıt oluşturan büyük bir dil modeline (LLM) gönderir.

  • Öneriler SubcueAI'nin kayan yerel katmanında görünür, yalnızca ekranınızda görünür — toplantı penceresine paylaşılmaz.
  • Katman, ekran paylaşım bölgesi dışında kalacak şekilde tasarlanmıştır, böylece ekranınızı paylaşan katılımcılar tarafından görünmez.
  • Herhangi bir öneriyi okuyabilir, uyarlayabilir veya yok sayabilirsiniz; araç düşünmenizi desteklemek içindir, kelimesi kelimesine senaryo oluşturmak için değil.

Katmanı mülakatınızdan önce konumlandırma konusunda rehberlik için kurulum eğitimine bakın.

Gecikme, Doğruluk ve Dürüst Sınırlamalar

Gerçek zamanlı transkripsiyon kalitesi, herhangi bir uygulamanın tam kontrolü dışında kalan birkaç faktöre bağlıdır:

  • Mikrofon kalitesi ve arka plan gürültüsü — kulaklık mikrofonu, yerleşik dizüstü mikrofonuna göre doğruluğu önemli ölçüde artırır.
  • İnternet bağlantısı — AI çıkarım adımı bulut destekliyse, ağ gecikmesi yanıt süresine eklenir.
  • Aksanlar ve konuşma hızı — modern sinirsel konuşma modelleri geniş bir aksan yelpazesini ele alır ancak mükemmel değildir.
  • Denetlenen veya kaydedilen mülakatlar — SubcueAI'nin katmanı yerel ve özeldir, ancak ekran kaydedilen veya denetlenen ortamlarda katman dikkatlice konumlandırılmaz veya gizlenmezse kayıtta görünebilir. Herhangi bir yardım aracını kullanmadan önce belirli mülakatınızın kurallarını her zaman inceleyin.

Gizlilik ve mülakatçıların ne görebileceği hakkında daha geniş bir bakış için güvenlik ve gizlilik sayfasına gidin.

SSS

SubcueAI mülakatçıyı ve beni aynı anda transkribe eder mi?

Evet. SubcueAI mikrofonunuzu ve toplantının sistem sesini (loopback) iki ayrı akış olarak yakalar, böylece konuşmanın her iki tarafı da gerçek zamanlı olarak transkribe edilir — AI'ye öneri oluşturmadan önce tam bağlam sağlar.

Bir soru sorulduktan sonra cevap önerisi almak ne kadar sürer?

Gecikme, ses parçası boyutu, konuşma tanıma hızı ve AI çıkarım süresine bağlıdır. Tipik koşullarda öneriler, transkriptte soru algılandıktan birkaç saniye içinde görünür — cevap vermeye başlamadan önce faydalı olacak kadar hızlıdır.

Konuşmadan metne makinenizde yerel olarak mı yoksa bulutta mı çalışır?

SubcueAI, ses yakalamayı yerel olarak gerçekleştiren yerel bir masaüstü uygulamasıdır. Bazı AI çıkarım adımları bir bulut çağrısı içerebilir. Veri işleme ve cihazınızdan neyin çıktığı hakkında en güncel ayrıntılar için güvenlik sayfasını kontrol edin.

Transkripsiyon Zoom, Google Meet ve Microsoft Teams'te çalışır mı?

Evet. SubcueAI sesi işletim sistemi düzeyinde yakaladığı için herhangi bir toplantı uygulamasına bağlanmak yerine, Zoom, Google Meet ve Microsoft Teams ile birlikte çalışır ve bu platformlarda entegrasyon veya eklenti gerektirmez.

Mülakatçı transkripsiyonu veya önerileri görebilir veya duyabilir mi?

Hayır. Transkript ve katman yalnızca yerel ekranınızda görüntülenir. Toplantı uygulaması diğer katılımcılara yalnızca kamera beslemenizi ve mikrofon sesinizi iletir — makinenizde çalışan diğer pencereler veya uygulamalar hakkında görünürlüğü yoktur, katman görünürken tam ekranınızı paylaşmadığınız sürece.

İlgili sorular

← Daha fazlası: Nasıl çalışır