Wie erfassen KI-Interview-Assistenten System-Audio?
Von Aaron Cao · Aktualisiert am

KI-Interview-Assistenten erfassen System-Audio lokal auf Ihrem Computer über die Audio-APIs des Betriebssystems — sie greifen den Ausgabestream von Zoom, Google Meet oder Teams ab — während ein separater Mikrofon-Stream Ihre Stimme aufzeichnet. Kein Meeting-Bot tritt dem Anruf bei.
Was „System-Audio" im Interview-Kontext bedeutet
In einem Videointerview gibt es zwei unterschiedliche Audiostreams auf Ihrem Rechner:
- Mikrofoneingang — Ihre eigene Stimme, vom Mikrofon erfasst.
- System-Audioausgabe — alles, was Ihr Computer über die Lautsprecher wiedergibt, einschließlich der Stimme des Interviewers, die aus Zoom, Google Meet oder Microsoft Teams kommt.
Ein KI-Interview-Assistent benötigt beide Streams, um dem Gespräch zu folgen: die Fragen des Interviewers (System-Audio) und Ihre Antworten (Mikrofon). Wird nur eine Seite erfasst, entsteht ein lückenhaftes Transkript und die Vorschläge fallen schwächer aus.
Wie System-Audio unter macOS und Windows erfasst wird
Die System-Audio-Erfassung stützt sich auf die Audio-APIs des Betriebssystems statt auf die Meeting-App selbst. Der genaue Mechanismus unterscheidet sich je nach Plattform:
- macOS — moderne Versionen stellen Prozess- und System-Audio-Taps über Core Audio bereit. Ältere Ansätze nutzten virtuelle Audiogeräte (Loopback-Treiber), die die Systemausgabe wieder als Eingang einspeisen.
- Windows — die Windows Audio Session API (WASAPI) unterstützt Loopback-Erfassung, mit der eine Anwendung aufzeichnen kann, was auf einem gewählten Ausgabegerät wiedergegeben wird.
In beiden Fällen erfolgt die Erfassung lokal auf Ihrem Gerät. Der Assistent muss nicht „innerhalb" von Zoom oder Teams laufen; er liest das Audio, nachdem die Meeting-App es bereits zur Wiedergabe dekodiert hat. Mehr über die gesamte Pipeline erfahren Sie auf der SubcueAI homepage oder im tutorial.
Wie SubcueAI duale Audioerfassung angeht
SubcueAI ist eine native Desktop-App für macOS und Windows. Sie nutzt duale Audioerfassung: einen Stream für Ihr Mikrofon und einen Stream für das System-Audio aus der Meeting-App. Beide Streams werden transkribiert, sodass der Assistent erkennen kann, wer was gesagt hat.
- Kein Meeting-Bot tritt dem Anruf als Teilnehmer bei.
- Kein Browser-Plugin oder Erweiterung wird in Zoom, Google Meet oder Teams installiert.
- Vorschläge erscheinen in einem schwebenden lokalen Overlay auf Ihrem eigenen Bildschirm.
Da das Overlay lokal gerendert wird, ist es nicht Teil des Videostreams, den Sie an den Interviewer senden. Mehr zu den Designentscheidungen dahinter finden Sie unter About SubcueAI oder how it compares to alternatives.
Ehrliche Grenzen der System-Audio-Erfassung
Die System-Audio-Erfassung funktioniert auf Ihrem eigenen persönlichen Computer. Sie ändert nicht, was ein Interviewer in folgenden Situationen beobachten kann:
- Bildschirmfreigabe — wenn Sie Ihren gesamten Bildschirm teilen, ist jedes lokale Overlay-Fenster für den Interviewer sichtbar.
- Bildschirmaufnahme oder überwachte Prüfungen — Aufzeichnungstools und Proctoring-Software können Overlays und laufende Prozesse erfassen, unabhängig davon, wie das Audio abgegriffen wird.
- Unternehmensverwaltete oder gesperrte Geräte — IT-Richtlinien können verhindern, dass Drittanbieter-Apps installiert werden oder auf Audio-APIs zugreifen.
- Nur-Kopfhörer-Setups — wenn die Meeting-App Audio an ein Bluetooth-Headset auf eine Weise weiterleitet, die das Betriebssystem nicht offenlegt, kann die Loopback-Erfassung inkonsistent sein.
Mehr Kontext dazu, was beobachtbar ist und was nicht, finden Sie unter Security.
FAQ
Benötigt ein KI-Interview-Assistent einen Bot im Meeting, um den Interviewer zu hören?
Können Zoom, Google Meet oder Teams erkennen, dass System-Audio erfasst wird?
Welche Berechtigungen benötigt SubcueAI, um Audio zu erfassen?
Funktioniert die duale Audioerfassung mit Bluetooth-Kopfhörern?
Wird das erfasste Audio irgendwohin hochgeladen?
Verwandte Fragen
- Was ist ein KI-Interview-Antwortgenerator und wie funktioniert er?
- Wie generiert eine KI Antwortvorschläge in Echtzeit während eines Live-Vorstellungsgesprächs?
- Wie viel Latenz fügt ein KI-Interview-Assistent während eines Live-Interviews hinzu?
- Kann ein KI-Interview-Assistent sowohl den Interviewer als auch den Kandidaten transkribieren?
- Was ist ein Interview-Copilot und wie funktioniert er?
- Was ist ein KI-Interview-Assistent und wie funktioniert er?