Jak asystenci rozmów rekrutacyjnych AI przechwytują dźwięk systemowy?
Autor: Aaron Cao · Zaktualizowano

Asystenci rozmów rekrutacyjnych oparci na AI przechwytują dźwięk systemowy lokalnie na Twoim komputerze, korzystając z audio API systemu operacyjnego — odczytując strumień wyjściowy z Zoom, Google Meet lub Teams — podczas gdy oddzielny strumień mikrofonu rejestruje Twój głos. Żaden bot nie dołącza do spotkania.
Co oznacza „dźwięk systemowy" w kontekście rozmowy rekrutacyjnej
W trakcie wideorozmowy na Twoim komputerze istnieją dwa odrębne strumienie audio:
- Wejście mikrofonowe — Twój własny głos rejestrowany przez mikrofon.
- Wyjście dźwięku systemowego — wszystko, co komputer odtwarza przez głośniki, w tym głos rekrutera dochodzący z Zoom, Google Meet lub Microsoft Teams.
Asystent rozmów rekrutacyjnych AI potrzebuje obu strumieni, aby śledzić rozmowę: pytań rekrutera (dźwięk systemowy) i Twoich odpowiedzi (mikrofon). Przechwytywanie tylko jednej strony skutkuje niepełną transkrypcją i słabszymi sugestiami.
Jak dźwięk systemowy jest przechwytywany na macOS i Windows
Przechwytywanie dźwięku systemowego opiera się na audio API systemu operacyjnego, a nie na samej aplikacji do spotkań. Dokładny mechanizm różni się w zależności od platformy:
- macOS — nowoczesne wersje udostępniają tap'y na dźwięk procesowy i systemowy przez Core Audio. Starsze podejścia wykorzystywały wirtualne urządzenia audio (sterowniki loopback), które kierują wyjście systemu z powrotem jako wejście.
- Windows — Windows Audio Session API (WASAPI) obsługuje przechwytywanie loopback, co pozwala aplikacji nagrywać wszystko, co jest odtwarzane na wybranym urządzeniu wyjściowym.
W obu przypadkach przechwytywanie odbywa się lokalnie na Twoim urządzeniu. Asystent nie musi być „wewnątrz" Zoom ani Teams; odczytuje dźwięk już po tym, jak aplikacja do spotkań zdekodowała go do odtworzenia. Więcej o całym potoku przeczytasz na stronie głównej SubcueAI lub w samouczku.
Jak SubcueAI podchodzi do podwójnego przechwytywania dźwięku
SubcueAI to natywna aplikacja desktopowa dla macOS i Windows. Wykorzystuje podwójne przechwytywanie dźwięku: jeden strumień dla Twojego mikrofonu i jeden strumień dla dźwięku systemowego pochodzącego z aplikacji do spotkań. Oba strumienie są transkrybowane, dzięki czemu asystent rozróżnia, kto co powiedział.
- Żaden bot spotkania nie dołącza do rozmowy jako uczestnik.
- Żaden plugin przeglądarki ani rozszerzenie nie jest instalowane w Zoom, Google Meet ani Teams.
- Sugestie pojawiają się w pływającej, lokalnej nakładce na Twoim własnym ekranie.
Ponieważ nakładka renderowana jest lokalnie, nie jest częścią strumienia wideo, który wysyłasz do rekrutera. Więcej o decyzjach projektowych stojących za tym rozwiązaniem znajdziesz w O SubcueAI lub jak wypada na tle alternatyw.
Uczciwe ograniczenia przechwytywania dźwięku systemowego
Przechwytywanie dźwięku systemowego działa na Twoim własnym komputerze osobistym. Nie zmienia tego, co rekruter może zaobserwować w następujących sytuacjach:
- Udostępnianie ekranu — jeśli udostępniasz cały ekran, dowolne okno lokalnej nakładki jest widoczne dla rekrutera.
- Nagrywanie ekranu lub egzaminy z proctoringiem — narzędzia do nagrywania i oprogramowanie proctoringowe mogą rejestrować nakładki i działające procesy niezależnie od sposobu przechwytywania dźwięku.
- Urządzenia zarządzane przez firmę lub zablokowane — polityki IT mogą blokować instalację aplikacji firm trzecich lub dostęp do audio API.
- Konfiguracje wyłącznie ze słuchawkami — jeśli aplikacja do spotkań kieruje dźwięk do zestawu Bluetooth w sposób, którego system operacyjny nie udostępnia, przechwytywanie loopback może być niespójne.
Więcej kontekstu o tym, co jest, a co nie jest obserwowalne, znajdziesz w sekcji Bezpieczeństwo.
FAQ
Czy asystent rozmów rekrutacyjnych AI potrzebuje bota w spotkaniu, aby słyszeć rekrutera?
Czy Zoom, Google Meet lub Teams mogą wykryć, że dźwięk systemowy jest przechwytywany?
Jakich uprawnień potrzebuje SubcueAI do przechwytywania dźwięku?
Czy podwójne przechwytywanie dźwięku działa ze słuchawkami Bluetooth?
Czy przechwycony dźwięk jest gdzieś przesyłany?
Powiązane pytania
- Czym jest generator odpowiedzi na rozmowy kwalifikacyjne z AI i jak działa?
- Jak AI generuje sugestie odpowiedzi w czasie rzeczywistym podczas rozmowy kwalifikacyjnej na żywo?
- Ile opóźnienia dodaje asystent AI do rozmów kwalifikacyjnych podczas rozmowy na żywo?
- Czy asystent AI do rozmów kwalifikacyjnych może transkrybować zarówno rekrutera, jak i kandydata?
- Czym jest copilota wywiadu i jak działa?
- Czym jest asystent wywiadu AI i jak działa?