AI 面试助手能同时转录面试官和候选人吗?

作者 Aaron Cao · 更新于

能。通过同时采集系统音频(扬声器中传来的面试官声音)和麦克风,AI 面试助手可以实时转录对话双方的内容。SubcueAI 通过原生双声道音频采集实现这一功能——无需任何会议机器人加入。

为何转录双方需要两个音频源

如果你曾尝试用单个麦克风录制面试,你一定遇到过这个问题:自己的声音清晰响亮,但面试官——通过扬声器或耳机传来的声音——却微弱、有回声,甚至完全听不清。要清晰地转录双方声音,需要两个独立的音频源。

AI 面试助手通过同时采集两路音频来解决这一问题:系统音频(电脑播放的一切声音,包括面试官在 Zoom、Google Meet 或 Microsoft Teams 中的声音)和你的麦克风(你自己的回答)。每路音频独立转录,这样每句话都能归属到正确的说话人,而不是混成一段难以辨别的录音。

SubcueAI 如何同时采集面试官和你的声音

SubcueAI 是一款运行在 macOSWindows 上的原生桌面应用——不是浏览器插件,也不是加入会议的机器人。在 macOS 上,它通过操作系统的屏幕录制音频 API 采集系统音频;在 Windows 上,它使用系统回环设备。麦克风则通过常规输入设备并行采集。

试想一位后端工程师正在通过 Zoom 面试高级职位:招聘经理的问题以系统音频形式传入,候选人的口头回答以麦克风音频形式传入,SubcueAI 实时转录两路内容。由于两路音频保持独立,转录结果呈现为有标注的对话,而非一段混杂的文字。

采集完全在本地完成,显示转录内容的浮动窗口也只存在于你的桌面上。安装说明提供了快速上手的步骤。

说话人分离、延迟与准确性

将面试官和候选人保持在独立音频通道上,不仅让转录更整洁——还能让助手判断应该响应哪一轮对话。面试官通道上的问题是回答建议应该针对的内容;你自己的通道是上下文,而非新的提示。

  • 说话人标注自然源于双源设计,因为每路音频都有明确的归属者。
  • 延迟取决于语音转文字的处理路径;流式转录在对方说话时即返回部分文字。
  • 准确性在系统音频信号干净时表现最佳——好的耳机和安静的环境对两路音频都有帮助。

完整的从采集到建议的处理流程,请参阅工作原理专题页。

双路转录不适用的情形

双侧转录的前提是音频确实能到达你电脑的输出和输入设备。它并不适用于所有情况,如实说明如下:

  • 在你无法控制的企业管理设备上,你可能根本无法安装桌面应用。
  • 监考环境和远程监控软件可能会限制后台应用或屏幕活动。
  • 如果对方那侧正在进行屏幕录制,那段录制与你的助手在本地所做的事情无关。
  • 线下面试中,音频根本不经过你的电脑,因此不在系统音频采集的范围内。

SubcueAI 专为你在自己设备上进行的远程面试而构建;其局限性在可检测性专题页中有详细说明。

常见问题

面试官的声音也会被转录吗,还是只有我的声音?

双方都会。面试官的声音作为系统音频(电脑播放的内容)采集,你的声音作为麦克风音频采集,因此转录结果显示对话双方的内容。

我需要会议机器人或浏览器扩展才能使用吗?

不需要。SubcueAI 是一款原生桌面应用,在本地采集系统音频和麦克风音频——没有任何东西加入通话,也没有浏览器插件。

它能识别谁说了什么吗?

能。由于面试官和候选人的声音分别来自两路独立音频流,每一行转录内容都已有明确的归属者,因此说话人标注是内置功能。

这在 Zoom、Google Meet 和 Microsoft Teams 上都有效吗?

有效。系统音频采集与会议平台无关,因此无论通话运行在 Zoom、Google Meet 还是 Microsoft Teams 上,面试官的声音都能被转录。

它能转录线下面试双方的声音吗?

不能。系统音频采集仅在音频经过你的电脑时有效。线下面试中,你并不在通话中,因此不在支持范围内。

相关问题

← 更多关于 工作原理