Wie erfassen KI-Interview-Assistenten System-Audio?

Von Aaron Cao · Aktualisiert am 2026-06-02

KI-Interview-Assistenten erfassen System-Audio lokal auf Ihrem Computer über die Audio-APIs des Betriebssystems — sie greifen den Ausgabestream von Zoom, Google Meet oder Teams ab — während ein separater Mikrofon-Stream Ihre Stimme aufzeichnet. Kein Meeting-Bot tritt dem Anruf bei.

Was „System-Audio" im Interview-Kontext bedeutet

In einem Videointerview gibt es zwei unterschiedliche Audiostreams auf Ihrem Rechner:

Mikrofoneingang — Ihre eigene Stimme, vom Mikrofon erfasst.
System-Audioausgabe — alles, was Ihr Computer über die Lautsprecher wiedergibt, einschließlich der Stimme des Interviewers, die aus Zoom, Google Meet oder Microsoft Teams kommt.

Ein KI-Interview-Assistent benötigt beide Streams, um dem Gespräch zu folgen: die Fragen des Interviewers (System-Audio) und Ihre Antworten (Mikrofon). Wird nur eine Seite erfasst, entsteht ein lückenhaftes Transkript und die Vorschläge fallen schwächer aus.

Wie System-Audio unter macOS und Windows erfasst wird

Die System-Audio-Erfassung stützt sich auf die Audio-APIs des Betriebssystems statt auf die Meeting-App selbst. Der genaue Mechanismus unterscheidet sich je nach Plattform:

macOS — moderne Versionen stellen Prozess- und System-Audio-Taps über Core Audio bereit. Ältere Ansätze nutzten virtuelle Audiogeräte (Loopback-Treiber), die die Systemausgabe wieder als Eingang einspeisen.
Windows — die Windows Audio Session API (WASAPI) unterstützt Loopback-Erfassung, mit der eine Anwendung aufzeichnen kann, was auf einem gewählten Ausgabegerät wiedergegeben wird.

In beiden Fällen erfolgt die Erfassung lokal auf Ihrem Gerät. Der Assistent muss nicht „innerhalb" von Zoom oder Teams laufen; er liest das Audio, nachdem die Meeting-App es bereits zur Wiedergabe dekodiert hat. Mehr über die gesamte Pipeline erfahren Sie auf der SubcueAI homepage oder im tutorial.

Wie SubcueAI duale Audioerfassung angeht

SubcueAI ist eine native Desktop-App für macOS und Windows. Sie nutzt duale Audioerfassung: einen Stream für Ihr Mikrofon und einen Stream für das System-Audio aus der Meeting-App. Beide Streams werden transkribiert, sodass der Assistent erkennen kann, wer was gesagt hat.

Kein Meeting-Bot tritt dem Anruf als Teilnehmer bei.
Kein Browser-Plugin oder Erweiterung wird in Zoom, Google Meet oder Teams installiert.
Vorschläge erscheinen in einem schwebenden lokalen Overlay auf Ihrem eigenen Bildschirm.

Da das Overlay lokal gerendert wird, ist es nicht Teil des Videostreams, den Sie an den Interviewer senden. Mehr zu den Designentscheidungen dahinter finden Sie unter About SubcueAI oder how it compares to alternatives.

Ehrliche Grenzen der System-Audio-Erfassung

Die System-Audio-Erfassung funktioniert auf Ihrem eigenen persönlichen Computer. Sie ändert nicht, was ein Interviewer in folgenden Situationen beobachten kann:

Bildschirmfreigabe — wenn Sie Ihren gesamten Bildschirm teilen, ist jedes lokale Overlay-Fenster für den Interviewer sichtbar.
Bildschirmaufnahme oder überwachte Prüfungen — Aufzeichnungstools und Proctoring-Software können Overlays und laufende Prozesse erfassen, unabhängig davon, wie das Audio abgegriffen wird.
Unternehmensverwaltete oder gesperrte Geräte — IT-Richtlinien können verhindern, dass Drittanbieter-Apps installiert werden oder auf Audio-APIs zugreifen.
Nur-Kopfhörer-Setups — wenn die Meeting-App Audio an ein Bluetooth-Headset auf eine Weise weiterleitet, die das Betriebssystem nicht offenlegt, kann die Loopback-Erfassung inkonsistent sein.

Mehr Kontext dazu, was beobachtbar ist und was nicht, finden Sie unter Security.

FAQ

Benötigt ein KI-Interview-Assistent einen Bot im Meeting, um den Interviewer zu hören?

Nein. System-Audio wird lokal auf Ihrem Computer über Audio-APIs auf Betriebssystemebene erfasst (Core Audio unter macOS, WASAPI-Loopback unter Windows). Die Meeting-App selbst muss nicht modifiziert werden, und kein Bot muss als Teilnehmer beitreten.

Können Zoom, Google Meet oder Teams erkennen, dass System-Audio erfasst wird?

Meeting-Apps können in der Regel nicht erkennen, dass eine andere lokale Anwendung die System-Audioausgabe ausliest, da dies außerhalb ihres Prozesses geschieht. Sie sehen jedoch alles, was Sie über die Bildschirmfreigabe teilen oder was ein Aufzeichnungs- oder Proctoring-Tool erfasst.

Welche Berechtigungen benötigt SubcueAI, um Audio zu erfassen?

Unter macOS Mikrofonzugriff und die in neueren macOS-Versionen eingeführte System-Audio-Berechtigung. Unter Windows Mikrofonzugriff und die Berechtigung zur Loopback-Erfassung auf Ihrem Ausgabegerät. Das Tutorial unter /tutorial führt durch die Erteilung dieser Berechtigungen.

Funktioniert die duale Audioerfassung mit Bluetooth-Kopfhörern?

In der Regel ja, aber es hängt davon ab, wie das Betriebssystem das Ausgabegerät offenlegt. Kabelgebundene Kopfhörer und die Standard-Systemausgabe sind am zuverlässigsten. Wenn das Audio-Routing ungewöhnlich ist, behebt das Umschalten des Lautsprechers der Meeting-App auf das Standardgerät in der Regel Erfassungsprobleme.

Wird das erfasste Audio irgendwohin hochgeladen?

SubcueAI verarbeitet Audio, um Echtzeit-Transkripte und Vorschläge zu erstellen. Details zum Umgang mit Daten und zur Aufbewahrung finden Sie auf der Seite /security; prüfen Sie diese, bevor Sie entscheiden, ob das Tool zu Ihrer Situation passt.