Comment les assistants d'entretien IA capturent-ils l'audio système ?

Par Aaron Cao · Mis à jour le

Comment les assistants d'entretien IA capturent-ils l'audio système ?
Les assistants d'entretien IA capturent l'audio système localement sur votre ordinateur en utilisant les API audio du système d'exploitation — en captant le flux de sortie de Zoom, Google Meet, ou Teams — tandis qu'un flux de microphone séparé capture votre voix. Aucun bot de réunion ne rejoint l'appel.

Les assistants d'entretien IA capturent l'audio système localement sur votre ordinateur en utilisant les API audio du système d'exploitation — en captant le flux de sortie de Zoom, Google Meet, ou Teams — tandis qu'un flux de microphone séparé capture votre voix. Aucun bot de réunion ne rejoint l'appel.

Ce que signifie « audio système » dans le contexte d'un entretien

Dans un entretien vidéo, il existe deux flux audio distincts sur votre machine :

  • Entrée microphone — votre propre voix, capturée par le micro.
  • Sortie audio système — tout ce que votre ordinateur joue via les haut-parleurs, y compris la voix de l'intervieweur provenant de Zoom, Google Meet, ou Microsoft Teams.

Un assistant d'entretien IA a besoin des deux flux pour suivre la conversation : les questions de l'intervieweur (audio système) et vos réponses (microphone). Capturer seulement un côté produit une transcription partielle et des suggestions plus faibles.

Comment l'audio système est capturé sur macOS et Windows

La capture de l'audio système repose sur les API audio du système d'exploitation plutôt que sur l'application de réunion elle-même. Le mécanisme exact diffère selon la plateforme :

  • macOS — les versions modernes exposent des taps audio de processus et système via Core Audio. Les approches plus anciennes utilisaient des périphériques audio virtuels (pilotes loopback) qui renvoient la sortie système en entrée.
  • Windows — la Windows Audio Session API (WASAPI) prend en charge la capture loopback, qui permet à une application d'enregistrer tout ce qui est joué sur un périphérique de sortie choisi.

Dans les deux cas, la capture se fait localement sur votre appareil. L'assistant n'a pas besoin d'être « à l'intérieur » de Zoom ou Teams ; il lit l'audio après que l'application de réunion l'ait déjà décodé pour la lecture. Vous pouvez en savoir plus sur le pipeline global sur la page d'accueil SubcueAI ou le tutoriel.

Comment SubcueAI aborde la capture audio double

SubcueAI est une application de bureau native pour macOS et Windows. Elle utilise la capture audio double : un flux pour votre microphone et un flux pour l'audio système provenant de l'application de réunion. Les deux flux sont transcrits afin que l'assistant puisse identifier qui a dit quoi.

  • Aucun bot de réunion ne rejoint l'appel en tant que participant.
  • Aucun plugin navigateur ou extension n'est installé dans Zoom, Google Meet, ou Teams.
  • Les suggestions apparaissent dans une superposition locale flottante sur votre propre écran.

Parce que la superposition est rendue localement, elle ne fait pas partie du flux vidéo que vous envoyez à l'intervieweur. Pour en savoir plus sur les choix de conception derrière cela, consultez À propos de SubcueAI ou comment cela se compare aux alternatives.

Limites honnêtes de la capture audio système

La capture audio système fonctionne sur votre propre ordinateur personnel. Elle ne modifie pas ce qu'un intervieweur peut observer dans ces situations :

  • Partage d'écran — si vous partagez votre écran entier, toute fenêtre de superposition locale est visible par l'intervieweur.
  • Enregistrement d'écran ou examens surveillés — les outils d'enregistrement et les logiciels de surveillance peuvent capturer les superpositions et les processus en cours, indépendamment de la façon dont l'audio est capté.
  • Appareils gérés par l'entreprise ou verrouillés — les politiques informatiques peuvent bloquer les applications tierces d'installer ou d'accéder aux API audio.
  • Configurations avec écouteurs uniquement — si l'application de réunion route l'audio vers un casque Bluetooth d'une manière que l'OS n'expose pas, la capture loopback peut être incohérente.

Pour plus de contexte sur ce qui est observable ou non, consultez Sécurité.

FAQ

Un assistant d'entretien IA a-t-il besoin d'un bot dans la réunion pour entendre l'intervieweur ?

Non. L'audio système est capturé localement sur votre ordinateur via les API audio au niveau du système d'exploitation (Core Audio sur macOS, WASAPI loopback sur Windows). L'application de réunion elle-même n'a pas besoin d'être modifiée, et aucun bot n'a besoin de rejoindre en tant que participant.

Zoom, Google Meet, ou Teams peuvent-ils détecter que l'audio système est capturé ?

Les applications de réunion ne peuvent généralement pas détecter qu'une autre application locale lit la sortie audio système, car cela se produit en dehors de leur processus. Elles peuvent cependant voir tout ce que vous choisissez de partager via le partage d'écran ou ce qu'un outil d'enregistrement ou de surveillance capture.

Quelles autorisations SubcueAI a-t-elle besoin pour capturer l'audio ?

Sur macOS, l'accès au microphone et l'autorisation audio système introduite dans les versions récentes de macOS. Sur Windows, l'accès au microphone et l'autorisation d'utiliser la capture loopback sur votre périphérique de sortie. Le tutoriel sur /tutorial explique comment accorder ces autorisations.

La capture audio double fonctionne-t-elle avec des écouteurs Bluetooth ?

Généralement oui, mais cela dépend de la façon dont l'OS expose le périphérique de sortie. Les écouteurs filaires et la sortie système par défaut sont les plus fiables. Si le routage audio est inhabituel, basculer le haut-parleur de l'application de réunion vers le périphérique par défaut résout généralement les problèmes de capture.

L'audio capturé est-il téléchargé quelque part ?

SubcueAI traite l'audio pour produire des transcriptions et suggestions en temps réel. Les détails sur le traitement et la rétention des données sont décrits sur la page /security ; consultez-la avant de décider si l'outil convient à votre situation.

Questions liées

← Plus sur Fonctionnement