AI 面試助理如何擷取系統音訊?
作者 Aaron Cao · 更新於

AI 面試助理會透過作業系統的音訊 API 在你的電腦本機端擷取系統音訊——擷取來自 Zoom、Google Meet 或 Teams 的輸出串流——同時以另一條麥克風串流擷取你的聲音。不會有任何會議機器人加入通話。
在面試情境下「系統音訊」指什麼
在視訊面試中,你的電腦上有兩條不同的音訊串流:
- 麥克風輸入——你自己的聲音,由麥克風擷取。
- 系統音訊輸出——你電腦透過喇叭播放的所有聲音,包括來自 Zoom、Google Meet 或 Microsoft Teams 的面試官聲音。
AI 面試助理需要這兩條串流才能跟上對話:面試官的問題(系統音訊)和你的回答(麥克風)。只擷取其中一邊會產生不完整的逐字稿與較弱的建議。
在 macOS 與 Windows 上如何擷取系統音訊
系統音訊擷取仰賴作業系統的音訊 API,而非會議應用程式本身。確切的機制因平台而異:
- macOS——較新版本透過 Core Audio 提供處理程序和系統音訊的擷取點。較舊的做法則使用虛擬音訊裝置(loopback 驅動程式),把系統輸出再導回成輸入。
- Windows——Windows Audio Session API(WASAPI)支援 loopback 擷取,讓應用程式可以錄製從所選輸出裝置播放出來的任何內容。
無論哪種方式,擷取都發生在你裝置的本機端。助理不需要「進入」Zoom 或 Teams 之中;它在會議應用程式已將音訊解碼以供播放之後讀取音訊。你可以在 SubcueAI homepage 或 tutorial 上閱讀更多關於整體流程的資訊。
SubcueAI 如何處理雙音訊擷取
SubcueAI 是一款適用於 macOS 與 Windows 的原生桌面應用程式。它使用雙音訊擷取:一條串流用於你的麥克風,另一條串流用於來自會議應用程式的系統音訊。兩條串流都會被轉錄,使助理能夠分辨誰說了什麼。
- 沒有會議機器人以參與者身分加入通話。
- 沒有任何瀏覽器外掛或擴充功能安裝到 Zoom、Google Meet 或 Teams 中。
- 建議出現在你自己螢幕上的本機浮動疊加層中。
因為疊加層是在本機渲染的,所以它不屬於你傳送給面試官的視訊串流。關於此設計選擇背後的更多內容,請見 About SubcueAI 或 how it compares to alternatives。
系統音訊擷取的誠實限制
系統音訊擷取在你自己的個人電腦上運作。它並不會改變面試官在以下情況中能觀察到的內容:
- 螢幕分享——如果你分享整個螢幕,任何本機疊加視窗對面試官都會是可見的。
- 螢幕錄影或受監考考試——錄影工具與監考軟體可以擷取疊加層與執行中的處理程序,無論音訊是如何被擷取的。
- 公司管理或受限制的裝置——IT 政策可能會阻擋第三方應用程式安裝或存取音訊 API。
- 只使用耳機的設定——如果會議應用程式以作業系統未公開的方式將音訊路由到藍牙耳機,loopback 擷取可能會不穩定。
關於什麼是、什麼不是可被觀察的更多背景,請見 Security。
常見問題
AI 面試助理需要在會議中放一個機器人才能聽到面試官嗎?
不需要。系統音訊是透過作業系統層級的音訊 API(macOS 上的 Core Audio、Windows 上的 WASAPI loopback)在你的電腦本機端擷取。會議應用程式本身不需要被修改,也不需要任何機器人以參與者身分加入。
Zoom、Google Meet 或 Teams 能偵測到系統音訊正在被擷取嗎?
會議應用程式通常無法察覺另一個本機應用程式正在讀取系統音訊輸出,因為這發生在它們的處理程序之外。但是,它們可以看到任何你選擇透過螢幕分享而分享的內容,或被錄影、監考工具所擷取的內容。
SubcueAI 擷取音訊需要哪些權限?
在 macOS 上,需要麥克風存取權,以及近期 macOS 版本所引入的系統音訊權限。在 Windows 上,需要麥克風存取權,以及在你的輸出裝置上使用 loopback 擷取的權限。/tutorial 的教學會逐步說明如何授予這些權限。
雙音訊擷取適用於藍牙耳機嗎?
通常可以,但要看作業系統如何呈現輸出裝置。有線耳機和預設系統輸出最為穩定。若音訊路由方式較特殊,將會議應用程式的喇叭切換到預設裝置通常就能解決擷取問題。
擷取到的音訊會被上傳到某處嗎?
SubcueAI 會處理音訊以產生即時逐字稿與建議。關於資料處理與保留的詳情,請見 /security 頁面;在決定此工具是否適合你的情況前,請先審閱該頁面。