AI面試助手如何在iOS上擷取系統音訊,以及為何大多數情況下無法實現
作者 Aaron Cao · 更新於
在iOS上,助手大多無法像桌面助手那樣擷取系統音訊。iOS為每個應用程式提供沙箱化的音訊工作階段,沒有公開API可即時讀取其他應用程式的音訊。需要通話音訊的助手會改用macOS或Windows運行。
為何iOS在架構上與桌面不同
桌面面試助手能夠運作,是因為桌面作業系統會公開其他應用程式正在播放的音訊。在macOS上,這個通道是ScreenCaptureKit,與螢幕錄製權限同屬一個權限系列;在Windows上則是WASAPI回環,允許程序讀取系統輸出混音。SubcueAI的雙音訊擷取功能直接基於這兩個API構建。
iOS沒有公開的等效機制。每個應用程式在自己的沙箱中運行,擁有獨立的音訊工作階段,系統不向第三方應用程式提供進入混音或其他應用程式工作階段的回環通道。在iPhone上運行的Zoom通話,只有Zoom和擴音器能聽到,同一手機上安裝的其他應用程式無法獲取。這是平台的刻意設計決策,並在歷次iOS版本更新中保持不變。
結果很明確:桌面助手的架構——擷取系統音訊、即時轉錄、給出建議——無法原樣移植到iOS。任何聲稱能做到這一點的產品,在底層實際上做的是截然不同的事情,向供應商詢問具體使用了哪個API是合理的。
現有的變通方案,以及各方案的代價
如果你的面試必須在iPhone上進行,你的感受是對的——選擇確實有限。準確了解每種變通方案的能力邊界會有所幫助。目前流行三種模式,每一種都要犧牲某些重要的東西。
- ReplayKit廣播。iOS可以透過使用者發起的廣播來錄製螢幕並攜帶應用程式音訊,但該串流在嚴格約束的廣播擴充功能內運行。它的用途是將螢幕串流傳輸到服務,而不是為即時分析通話音訊並給出答案的第二個應用程式提供音訊來源。
- 擴音器加第二台裝置。將通話切換到擴音器模式,讓筆記型電腦的麥克風透過聲學方式收音。這可以與任何助手配合使用,包括SubcueAI的麥克風通道,但房間回聲和串音會降低轉錄準確率,面試官也會聽到擴音器聲效。
- 雇主端整合。部分面試平台會在伺服器端為公司轉錄通話。這是雇主在其基礎設施上的工具,對應徵者那一側沒有任何幫助。
這些方案都無法重現桌面體驗。實話實說:僅限手機的面試讓即時輔助變得遙不可及,提前準備才是關鍵;面試前一晚進行一次模擬面試,對電話面試的幫助遠超任何臨場變通方案。
SubcueAI以何種方式替代iOS應用程式
SubcueAI提供適用於macOS 14及更高版本以及Windows 10及更高版本的原生桌面應用程式,並刻意不提供iOS應用程式。SubcueAI創辦人Aaron Cao對此直言不諱:iPhone應用程式無法誠實地實現產品的核心功能,推出一個功能受損的偽裝版本以換取App Store上架,會消耗使用者的信任。
實際建議由此而來。只要有選擇,就盡量在電腦上參加視訊面試;招募人員幾乎總會為Zoom、Google Meet和Microsoft Teams通話提供桌面加入連結。在桌面上,助手透過作業系統(而非空氣)聽到通話內容,設定教學會在幾分鐘內引導你完成兩個平台的權限設定。
對於那些適合在瀏覽器中進行的面試準備環節,包括AI模擬面試,手機或平板電腦完全可以使用,因為練習不需要擷取其他應用程式的音訊。桌面擷取路徑背後的架構細節收錄在運作原理解答中。