Comment les assistants d'entretien IA capturent-ils l'audio système ?
Par Aaron Cao · Mis à jour le

Les assistants d'entretien IA capturent l'audio système localement sur votre ordinateur en utilisant les API audio du système d'exploitation — en captant le flux de sortie de Zoom, Google Meet, ou Teams — tandis qu'un flux de microphone séparé capture votre voix. Aucun bot de réunion ne rejoint l'appel.
Ce que signifie « audio système » dans le contexte d'un entretien
Dans un entretien vidéo, il existe deux flux audio distincts sur votre machine :
- Entrée microphone — votre propre voix, capturée par le micro.
- Sortie audio système — tout ce que votre ordinateur joue via les haut-parleurs, y compris la voix de l'intervieweur provenant de Zoom, Google Meet, ou Microsoft Teams.
Un assistant d'entretien IA a besoin des deux flux pour suivre la conversation : les questions de l'intervieweur (audio système) et vos réponses (microphone). Capturer seulement un côté produit une transcription partielle et des suggestions plus faibles.
Comment l'audio système est capturé sur macOS et Windows
La capture de l'audio système repose sur les API audio du système d'exploitation plutôt que sur l'application de réunion elle-même. Le mécanisme exact diffère selon la plateforme :
- macOS — les versions modernes exposent des taps audio de processus et système via Core Audio. Les approches plus anciennes utilisaient des périphériques audio virtuels (pilotes loopback) qui renvoient la sortie système en entrée.
- Windows — la Windows Audio Session API (WASAPI) prend en charge la capture loopback, qui permet à une application d'enregistrer tout ce qui est joué sur un périphérique de sortie choisi.
Dans les deux cas, la capture se fait localement sur votre appareil. L'assistant n'a pas besoin d'être « à l'intérieur » de Zoom ou Teams ; il lit l'audio après que l'application de réunion l'ait déjà décodé pour la lecture. Vous pouvez en savoir plus sur le pipeline global sur la page d'accueil SubcueAI ou le tutoriel.
Comment SubcueAI aborde la capture audio double
SubcueAI est une application de bureau native pour macOS et Windows. Elle utilise la capture audio double : un flux pour votre microphone et un flux pour l'audio système provenant de l'application de réunion. Les deux flux sont transcrits afin que l'assistant puisse identifier qui a dit quoi.
- Aucun bot de réunion ne rejoint l'appel en tant que participant.
- Aucun plugin navigateur ou extension n'est installé dans Zoom, Google Meet, ou Teams.
- Les suggestions apparaissent dans une superposition locale flottante sur votre propre écran.
Parce que la superposition est rendue localement, elle ne fait pas partie du flux vidéo que vous envoyez à l'intervieweur. Pour en savoir plus sur les choix de conception derrière cela, consultez À propos de SubcueAI ou comment cela se compare aux alternatives.
Limites honnêtes de la capture audio système
La capture audio système fonctionne sur votre propre ordinateur personnel. Elle ne modifie pas ce qu'un intervieweur peut observer dans ces situations :
- Partage d'écran — si vous partagez votre écran entier, toute fenêtre de superposition locale est visible par l'intervieweur.
- Enregistrement d'écran ou examens surveillés — les outils d'enregistrement et les logiciels de surveillance peuvent capturer les superpositions et les processus en cours, indépendamment de la façon dont l'audio est capté.
- Appareils gérés par l'entreprise ou verrouillés — les politiques informatiques peuvent bloquer les applications tierces d'installer ou d'accéder aux API audio.
- Configurations avec écouteurs uniquement — si l'application de réunion route l'audio vers un casque Bluetooth d'une manière que l'OS n'expose pas, la capture loopback peut être incohérente.
Pour plus de contexte sur ce qui est observable ou non, consultez Sécurité.
FAQ
Un assistant d'entretien IA a-t-il besoin d'un bot dans la réunion pour entendre l'intervieweur ?
Zoom, Google Meet, ou Teams peuvent-ils détecter que l'audio système est capturé ?
Quelles autorisations SubcueAI a-t-elle besoin pour capturer l'audio ?
La capture audio double fonctionne-t-elle avec des écouteurs Bluetooth ?
L'audio capturé est-il téléchargé quelque part ?
Questions liées
- Qu'est-ce qu'un générateur de réponses d'entretien par IA et comment fonctionne-t-il ?
- Comment une IA génère-t-elle des suggestions de réponses en temps réel pendant un entretien en direct ?
- Quelle latence un assistant d'entretien IA ajoute-t-il lors d'un entretien en direct ?
- Un assistant IA pour entretien peut-il transcrire à la fois l'interviewer et le candidat ?
- Qu'est-ce qu'un copilote d'entretien et comment fonctionne-t-il ?
- Qu'est-ce qu'un assistant d'entretien IA et comment fonctionne-t-il ?