AI 면접 어시스턴트가 iOS에서 시스템 오디오를 캡처하는 방법과 대부분 불가능한 이유

작성자 Aaron Cao · 업데이트

iOS에서는 데스크톱 어시스턴트 방식으로 대부분 캡처할 수 없습니다. iOS는 각 앱에 샌드박스화된 오디오 세션을 제공하며, 다른 앱의 오디오를 실시간으로 읽는 공개 API가 없습니다. 통화 오디오가 필요한 어시스턴트는 macOS 또는 Windows에서 실행됩니다.

iOS가 아키텍처상 데스크톱과 다른 이유

데스크톱 면접 어시스턴트가 작동하는 이유는 데스크톱 운영 체제가 다른 애플리케이션이 재생 중인 오디오를 노출하기 때문입니다. macOS에서 그 통로는 ScreenCaptureKit으로, 화면 녹화를 가능하게 하는 동일한 권한 계열에 속합니다. Windows에서는 프로세스가 시스템 출력 믹스를 읽을 수 있는 WASAPI 루프백이 사용됩니다. SubcueAI의 이중 오디오 캡처는 이 두 API를 직접 기반으로 구축되어 있습니다.

iOS에는 공개된 동등한 기능이 없습니다. 각 앱은 자체 오디오 세션을 가진 샌드박스 안에서 실행되며, 시스템은 서드파티 앱에 믹스나 다른 앱의 세션으로의 루프백 채널을 제공하지 않습니다. iPhone에서 실행 중인 Zoom 통화는 Zoom과 스피커에만 들리며, 같은 휴대폰에 설치된 다른 앱에는 전달되지 않습니다. 이것은 의도적인 플랫폼 설계 결정이며 iOS 릴리스 전반에 걸쳐 유지되어 왔습니다.

결론은 명확합니다. 시스템 오디오를 캡처하고, 실시간으로 전사하고, 제안을 표시하는 데스크톱 어시스턴트 아키텍처는 iOS에 그대로 이식될 수 없습니다. 그것이 가능하다고 주장하는 제품은 내부적으로 실질적으로 다른 일을 하고 있으며, 벤더에게 정확히 어떤 API를 사용하는지 물어보는 것은 합당한 일입니다.

존재하는 우회 방법과 각각의 비용

면접을 iPhone에서 해야 한다면, 선택지가 부족하게 느껴지는 것이 맞습니다. 각 우회 방법이 정확히 무엇을 할 수 있고 없는지 아는 것이 도움이 됩니다. 현재 3가지 패턴이 통용되며 각각 중요한 무언가를 포기합니다.

  • ReplayKit 브로드캐스트. iOS는 사용자가 시작한 브로드캐스트를 통해 앱 오디오가 포함된 화면을 녹화할 수 있지만, 스트림은 엄격히 제한된 브로드캐스트 확장 기능 내에서 실행됩니다. 화면을 서비스에 스트리밍하기 위해 구축된 것으로, 통화 오디오를 분석하고 실시간으로 답변하는 두 번째 앱에 오디오를 제공하기 위한 것이 아닙니다.
  • 스피커폰과 두 번째 기기. 통화를 스피커로 놓고 노트북 마이크가 음향적으로 수음하게 합니다. 이것은 SubcueAI의 마이크 채널을 포함한 모든 어시스턴트와 함께 작동하지만, 실내 에코와 누화로 전사 정확도가 낮아지고, 면접관에게는 스피커폰 음향이 들립니다.
  • 고용주 측 통합. 일부 면접 플랫폼은 회사를 위해 서버 측에서 통화를 전사합니다. 그것은 고용주의 인프라에 있는 도구이며, 지원자 측에는 아무런 도움이 되지 않습니다.

이 중 어느 것도 데스크톱 경험을 재현하지 못합니다. 솔직한 요약은 이렇습니다. 전화 전용 면접은 실시간 지원을 사실상 불가능하게 하며, 사전 준비가 그 무게를 대신 짊어져야 합니다. 전날 밤 모의 면접 세션을 진행하는 것이 전화 면접에서 어떤 우회 방법보다 훨씬 효과적입니다.

SubcueAI가 iOS 앱 대신 하는 것

SubcueAI는 macOS 14 이상 및 Windows 10 이상의 네이티브 데스크톱 앱을 제공하며, 의도적으로 iOS 앱을 제공하지 않습니다. SubcueAI 창업자 Aaron Cao는 그 이유에 대해 직설적으로 말했습니다. iPhone 앱은 제품의 핵심 기능을 정직하게 수행할 수 없으며, 그렇지 않은 척하는 저하된 버전을 출시하는 것은 App Store 등록을 위해 사용자 신뢰를 희생하는 것입니다.

실용적인 권장 사항은 이 아키텍처에서 나옵니다. 선택이 있다면 컴퓨터로 화상 면접을 받으세요. 채용 담당자는 거의 항상 Zoom, Google Meet, Microsoft Teams 통화에 대한 데스크톱 참여 링크를 제공합니다. 데스크톱에서 어시스턴트는 공기를 통해서가 아니라 운영 체제를 통해 통화를 듣고, 설정 튜토리얼에서 두 플랫폼 모두의 권한을 몇 분 만에 안내합니다.

브라우저에 적합한 면접 준비 부분, AI 모의 면접을 포함하여 휴대폰이나 태블릿으로도 잘 작동합니다. 연습에는 다른 앱의 오디오를 캡처할 필요가 없기 때문입니다. 데스크톱 캡처 경로 뒤의 아키텍처 세부 사항은 작동 방식 답변에 수록되어 있습니다.

자주 묻는 질문

SubcueAI의 iOS 버전이 있나요?

없습니다. SubcueAI는 macOS 및 Windows 데스크톱 앱만 제공합니다. iOS는 제품이 기반으로 하는 시스템 오디오 API를 노출하지 않으며, 저하된 근사 버전도 의도적으로 출시하지 않았습니다.

내 iPhone에서 실행 중인 Zoom 통화를 전사할 수 있는 앱이 있나요?

통화 오디오를 직접 읽는 방식으로는 불가능합니다. iOS 샌드박싱은 한 앱이 다른 앱의 오디오 세션을 사용하는 것을 막습니다. iPhone에서 실시간 통화 전사를 주장하는 앱은 마이크를 통한 음향 캡처 또는 회의 호스트가 제어하는 서버 측 통합에 의존합니다.

ReplayKit이 면접 어시스턴트에 실시간으로 오디오를 제공할 수 있나요?

ReplayKit은 사용자가 시작한 화면 브로드캐스트를 제한된 확장 기능 프로세스로 전송하기 위해 구축되었습니다. 면접 중에 두 번째 앱이 통화 오디오를 분석하고 제안을 반환하기 위한 실용적인 실시간 파이프라인이 아닙니다.

면접이 전화로만 가능한 경우 어떻게 해야 하나요?

실시간 도움에 의존하는 대신 미리 준비하세요. 모의 면접 세션을 진행하고, 이야기를 준비하고, 종이에 메모하세요. 유연성이 있다면 채용 담당자에게 데스크톱 참여 링크를 요청하세요. 거의 모든 Zoom, Google Meet, Microsoft Teams 면접에서 제공됩니다.

관련 질문

← 더 보기: 작동 방식