AI इंटरव्यू असिस्टेंट सिस्टम ऑडियो कैसे कैप्चर करते हैं?

द्वारा Aaron Cao · अपडेट

AI इंटरव्यू असिस्टेंट सिस्टम ऑडियो कैसे कैप्चर करते हैं?
AI इंटरव्यू असिस्टेंट आपके कंप्यूटर पर स्थानीय रूप से ऑपरेटिंग सिस्टम के ऑडियो APIs का उपयोग करके सिस्टम ऑडियो कैप्चर करते हैं — Zoom, Google Meet, या Teams से आउटपुट स्ट्रीम को टैप करके — जबकि एक अलग माइक्रोफ़ोन स्ट्रीम आपकी आवाज़ कैप्चर करती है। कॉल में कोई मीटिंग बॉट शामिल नहीं होता।

AI इंटरव्यू असिस्टेंट आपके कंप्यूटर पर स्थानीय रूप से ऑपरेटिंग सिस्टम के ऑडियो APIs का उपयोग करके सिस्टम ऑडियो कैप्चर करते हैं — Zoom, Google Meet, या Teams से आउटपुट स्ट्रीम को टैप करके — जबकि एक अलग माइक्रोफ़ोन स्ट्रीम आपकी आवाज़ कैप्चर करती है। कॉल में कोई मीटिंग बॉट शामिल नहीं होता।

इंटरव्यू संदर्भ में "सिस्टम ऑडियो" का क्या मतलब है

वीडियो इंटरव्यू में आपकी मशीन पर दो अलग-अलग ऑडियो स्ट्रीम होती हैं:

  • माइक्रोफ़ोन इनपुट — आपकी अपनी आवाज़, माइक द्वारा कैप्चर की गई।
  • सिस्टम ऑडियो आउटपुट — वह सब कुछ जो आपका कंप्यूटर स्पीकर के माध्यम से चला रहा है, जिसमें Zoom, Google Meet, या Microsoft Teams से आने वाली इंटरव्यूअर की आवाज़ भी शामिल है।

बातचीत का अनुसरण करने के लिए AI इंटरव्यू असिस्टेंट को दोनों स्ट्रीम की आवश्यकता होती है: इंटरव्यूअर के प्रश्न (सिस्टम ऑडियो) और आपके उत्तर (माइक्रोफ़ोन)। केवल एक तरफ कैप्चर करने से आंशिक ट्रांसक्रिप्ट और कमज़ोर सुझाव मिलते हैं।

macOS और Windows पर सिस्टम ऑडियो कैसे कैप्चर किया जाता है

सिस्टम ऑडियो कैप्चर ऑपरेटिंग-सिस्टम के ऑडियो APIs पर निर्भर करता है, न कि मीटिंग ऐप पर। सटीक तंत्र प्लेटफ़ॉर्म के अनुसार भिन्न होता है:

  • macOS — आधुनिक संस्करण Core Audio के माध्यम से प्रोसेस और सिस्टम ऑडियो टैप उजागर करते हैं। पुराने तरीकों में वर्चुअल ऑडियो डिवाइस (लूपबैक ड्राइवर) का उपयोग होता था जो सिस्टम आउटपुट को इनपुट के रूप में वापस रूट करते हैं।
  • Windows — Windows Audio Session API (WASAPI) loopback कैप्चर का समर्थन करता है, जो किसी एप्लिकेशन को चुने गए आउटपुट डिवाइस से बजने वाली किसी भी चीज़ को रिकॉर्ड करने देता है।

किसी भी तरह से, कैप्चर आपके डिवाइस पर स्थानीय रूप से होता है। असिस्टेंट को Zoom या Teams के "अंदर" होने की आवश्यकता नहीं है; यह ऑडियो को तब पढ़ता है जब मीटिंग ऐप पहले से ही इसे प्लेबैक के लिए डीकोड कर चुका होता है। आप पूरी पाइपलाइन के बारे में SubcueAI homepage या tutorial पर अधिक पढ़ सकते हैं।

SubcueAI ड्यूल ऑडियो कैप्चर को कैसे अपनाता है

SubcueAI macOS और Windows के लिए एक नेटिव डेस्कटॉप ऐप है। यह ड्यूल ऑडियो कैप्चर का उपयोग करता है: एक स्ट्रीम आपके माइक्रोफ़ोन के लिए और एक स्ट्रीम मीटिंग ऐप से आने वाले सिस्टम ऑडियो के लिए। दोनों स्ट्रीम ट्रांसक्राइब की जाती हैं ताकि असिस्टेंट बता सके कि किसने क्या कहा।

  • कोई मीटिंग बॉट प्रतिभागी के रूप में कॉल में शामिल नहीं होता।
  • Zoom, Google Meet, या Teams में कोई ब्राउज़र प्लगइन या एक्सटेंशन इंस्टॉल नहीं किया जाता।
  • सुझाव आपकी अपनी स्क्रीन पर फ्लोटिंग लोकल ओवरले में दिखाई देते हैं।

क्योंकि ओवरले स्थानीय रूप से रेंडर होता है, यह उस वीडियो स्ट्रीम का हिस्सा नहीं है जो आप इंटरव्यूअर को भेजते हैं। इसके पीछे के डिज़ाइन विकल्पों के बारे में अधिक जानकारी के लिए, देखें About SubcueAI या यह विकल्पों से कैसे तुलना करता है

सिस्टम-ऑडियो कैप्चर की ईमानदार सीमाएँ

सिस्टम-ऑडियो कैप्चर आपके अपने व्यक्तिगत कंप्यूटर पर काम करता है। यह इन स्थितियों में नहीं बदलता कि इंटरव्यूअर क्या देख सकता है:

  • स्क्रीन शेयरिंग — यदि आप अपनी पूरी स्क्रीन शेयर करते हैं, तो कोई भी स्थानीय ओवरले विंडो इंटरव्यूअर को दिखाई देती है।
  • स्क्रीन रिकॉर्डिंग या प्रॉक्टर्ड परीक्षाएँ — रिकॉर्डिंग टूल्स और प्रॉक्टरिंग सॉफ़्टवेयर ऑडियो टैप करने के तरीके की परवाह किए बिना ओवरले और चालू प्रक्रियाओं को कैप्चर कर सकते हैं।
  • कंपनी-प्रबंधित या लॉक्ड-डाउन डिवाइस — IT नीतियाँ थर्ड-पार्टी ऐप्स को इंस्टॉल करने या ऑडियो APIs तक पहुँच से रोक सकती हैं।
  • केवल-हेडफ़ोन सेटअप — यदि मीटिंग ऐप ऑडियो को Bluetooth हेडसेट पर इस तरह रूट करता है जिसे OS उजागर नहीं करता, तो लूपबैक कैप्चर असंगत हो सकता है।

क्या देखा जा सकता है और क्या नहीं इसके बारे में अधिक संदर्भ के लिए, देखें Security

सामान्य प्रश्न

क्या AI इंटरव्यू असिस्टेंट को इंटरव्यूअर को सुनने के लिए मीटिंग में बॉट की आवश्यकता होती है?

नहीं। सिस्टम ऑडियो आपके कंप्यूटर पर OS-स्तर के ऑडियो APIs (macOS पर Core Audio, Windows पर WASAPI loopback) के माध्यम से स्थानीय रूप से कैप्चर किया जाता है। मीटिंग ऐप को स्वयं संशोधित करने की आवश्यकता नहीं है, और किसी बॉट को प्रतिभागी के रूप में शामिल नहीं होना पड़ता।

क्या Zoom, Google Meet, या Teams पता लगा सकते हैं कि सिस्टम ऑडियो कैप्चर किया जा रहा है?

मीटिंग ऐप्स आम तौर पर यह नहीं बता सकते कि कोई अन्य स्थानीय एप्लिकेशन सिस्टम ऑडियो आउटपुट पढ़ रहा है, क्योंकि यह उनकी प्रक्रिया के बाहर होता है। हालाँकि, वे कुछ भी देख सकते हैं जो आप स्क्रीन शेयर के माध्यम से शेयर करना चुनते हैं या जो रिकॉर्डिंग या प्रॉक्टरिंग टूल कैप्चर करता है।

SubcueAI को ऑडियो कैप्चर करने के लिए किन अनुमतियों की आवश्यकता है?

macOS पर, माइक्रोफ़ोन एक्सेस और हाल के macOS संस्करणों में पेश की गई सिस्टम-ऑडियो अनुमति। Windows पर, माइक्रोफ़ोन एक्सेस और आपके आउटपुट डिवाइस पर loopback कैप्चर का उपयोग करने की अनुमति। /tutorial पर ट्यूटोरियल इन्हें देने की प्रक्रिया से गुज़ारता है।

क्या ड्यूल ऑडियो कैप्चर Bluetooth हेडफ़ोन के साथ काम करता है?

आमतौर पर हाँ, लेकिन यह इस पर निर्भर करता है कि OS आउटपुट डिवाइस को कैसे उजागर करता है। वायर्ड हेडफ़ोन और डिफ़ॉल्ट सिस्टम आउटपुट सबसे विश्वसनीय हैं। यदि ऑडियो रूटिंग असामान्य है, तो मीटिंग ऐप के स्पीकर को डिफ़ॉल्ट डिवाइस पर स्विच करने से आम तौर पर कैप्चर समस्याएँ हल हो जाती हैं।

क्या कैप्चर किया गया ऑडियो कहीं अपलोड किया जाता है?

SubcueAI रीयल-टाइम ट्रांसक्रिप्ट और सुझाव तैयार करने के लिए ऑडियो को प्रोसेस करता है। डेटा हैंडलिंग और रिटेंशन के बारे में विवरण /security पृष्ठ पर वर्णित हैं; यह तय करने से पहले कि टूल आपकी स्थिति के अनुकूल है या नहीं, इसकी समीक्षा करें।

संबंधित प्रश्न

← और देखें: यह कैसे काम करता है