即時面試助手:現場答案建議究竟如何運作

作者 Aaron Cao · 更新於

即時面試助手是一種軟體,它會聆聽你的現場面試,在數秒內轉寫面試官的話,並在螢幕上給出建議答案。SubcueAI 以原生桌面應用加本地懸浮視窗的形式實現這一點,而不是會議機器人。

即時面試助手究竟做什麼

你擔心現場面試節奏太快,來不及獲得協助。本節將一步步說明即時面試助手究竟做什麼。簡而言之,它把口頭問題轉成文字,並在你開口之前遞給你一份答案草稿。

這個循環始終是同樣的四個階段:擷取音訊、把它轉寫成文字、生成一份建議答案,並把它顯示出來。即時這個詞正是關鍵所在——只有當這四個階段都在面試官說完問題到你開始回答之間的幾秒內完成,價值才會存在。

SubcueAI 被定位為帶本地懸浮視窗的原生桌面應用,而不是瀏覽器外掛,也不是加入通話的參與者。如果你想先看產品的行銷層面概覽,首頁把它定位為一款 AI 面試助手。

音訊如何被擷取:雙路擷取

任何現場助手最難的部分都是同時聽到對話的雙方。即時面試助手既需要面試官的聲音(它從你的喇叭發出),需要你自己的聲音(來自你的麥克風)。SubcueAI 把這稱為雙路音訊擷取:它同時讀取系統音訊輸出和麥克風輸入。

這正是原生桌面應用重要的原因。macOSWindows 上的系統音訊擷取是一種作業系統層級的能力——瀏覽器分頁通常無法接入另一個獨立的 ZoomGoogle MeetMicrosoft Teams 視窗的音訊。由於 SubcueAI 不以機器人身分加入會議,面試官的參與者清單不會多出一名與會者。關於擷取模型更深入的拆解,見 運作原理專題

從語音到一份建議答案

音訊被擷取後,助手會把它串流傳送給一個語音轉文字引擎,該引擎持續輸出文字,而不是等待一整句話。部分轉寫讓答案生成步驟可以提早開始。生成步驟隨後取用轉寫出來的問題,加上你提供的任何上下文(例如履歷或職位描述),生成一份答案草稿。

設想一名後端工程師正在面試某家公有雲廠商的 L5 職位。當面試官問他會如何設計一個限流器時,轉寫會在幾秒內出現,而一份結構化提綱——令牌桶、分散式計數器、各種取捨——會浮現在懸浮視窗中。應徵者仍然必須用自己的話來作答;助手是一個提示,而不是一份台詞。

關鍵在於,這一輸出渲染在由桌面應用在你自己的機器上繪製的本地懸浮視窗中。它不會被注入到視訊畫面裡,也不屬於共享的會議視窗,所以共享通話螢幕本身並不會共享該懸浮視窗。

延遲、限制,以及「即時」做不到什麼

對現場助手而言,端對端延遲——從面試官說完一句話到一條可用建議出現的總時間——比底層模型的原始大小更重要。一個稍小、能在一秒內回應的模型,勝過一個要花十秒的更大模型,因為到了十秒,作答的時機早已過去。

對邊界要誠實。當你正在共享自己的螢幕時、當會話被面試官一方錄製並以某種方式捕捉到你整個顯示畫面時、在鎖定或監控你機器的受監考考試期間,或在你無法安裝軟體的受公司管控的裝置上,即時面試助手都不在適用範圍內。在這些情況下沒有任何工具是安全的,SubcueAI 也並不聲稱自己普遍不可被偵測。圍繞隱私的各種取捨在 可偵測性專題 中有討論,安全模型則在 安全頁面 上作了概述。

常見問題

即時面試助手和會議機器人是一回事嗎?

不是。會議機器人會作為可見的參與者加入通話,並常常對其進行錄製。SubcueAI 是帶本地懸浮視窗的原生桌面應用,所以它不會出現在參與者清單中,也不會加入會議。

答案多快會出現?

目標是面試官說完問題到你回答之間那幾秒的間隙。具體時間取決於你的網路和機器,但端對端延遲經過最佳化,使建議在你必須開口之前就可用。

它能在 Zoom、Google Meet 和 Microsoft Teams 中使用嗎?

可以。由於雙路音訊擷取在作業系統層級讀取系統音訊,它與具體的會議應用無關,所以 Zoom、Google Meet 和 Microsoft Teams 都以同樣的方式運作。

面試官能看到助手嗎?

建議渲染在你自己機器上的本地懸浮視窗中,而不是視訊畫面裡。不過,如果你共享螢幕,懸浮視窗就在你的顯示畫面上,可能會被看到,所以在共享螢幕時它不在適用範圍內。

我在哪裡設定它?

安裝和首次執行步驟在 /tutorial 頁面,方案和點數詳情在 /pricing 頁面。

相關問題

← 更多關於 運作原理