Как AI-ассистенты для собеседований захватывают системный звук на iOS и почему большинство не могут этого сделать

Автор: Aaron Cao · Обновлено

На iOS они по большей части не могут делать это так, как десктопные ассистенты. iOS предоставляет каждому приложению изолированную аудиосессию и не имеет публичного API для чтения звука другого приложения в реальном времени. Ассистенты, которым нужен звук звонков, работают вместо этого на macOS или Windows.

Почему iOS архитектурно отличается от десктопа

Десктопный ассистент для собеседований работает, потому что десктопные операционные системы открывают доступ к звуку, который воспроизводит другое приложение. На macOS эта дверь — ScreenCaptureKit, то же семейство разрешений, которое обеспечивает запись экрана; на Windows — loopback WASAPI, позволяющий процессу читать системный выходной микс. Двойной захват звука SubcueAI построен непосредственно на этих двух API.

В iOS нет публичного эквивалента. Каждое приложение работает в «песочнице» с собственной аудиосессией, и система не предоставляет сторонним приложениям loopback-канал в микс или в сессию другого приложения. Звонок Zoom на iPhone слышен Zoom и динамику, но не другому приложению, установленному на том же телефоне. Это намеренное решение платформы, и оно сохраняется в разных версиях iOS.

Последствие очевидно: архитектура десктопного ассистента — захватить системный звук, транскрибировать его в реальном времени, показывать подсказки — не может быть перенесена на iOS в нынешнем виде. Любой продукт, заявляющий обратное, делает под капотом нечто принципиально иное, и спросить у поставщика, какой именно API они используют, вполне разумно.

Существующие обходные пути и цена каждого из них

Если ваше собеседование должно проходить на iPhone, вы правы, что варианты кажутся скудными, и полезно знать точно, что каждый обходной путь может и не может делать. В обращении находятся три схемы, и каждая чем-то важным жертвует.

  • Трансляции ReplayKit. iOS может записывать экран с аудио приложения через пользовательскую трансляцию, но поток работает внутри жёстко ограниченного расширения для трансляции. Оно создано для стриминга экрана в сервисы, а не для подачи звука второму приложению, которое анализирует аудио звонка и отвечает в реальном времени.
  • Громкая связь плюс второе устройство. Переключите звонок на громкую связь и позвольте микрофону ноутбука принимать звук акустически. Это работает с любым ассистентом, включая микрофонный канал SubcueAI, но эхо в комнате и перекрёстные помехи снижают точность транскрипции, а интервьюер слышит вас в акустике громкой связи.
  • Интеграции на стороне работодателя. Некоторые платформы для собеседований транскрибируют звонки на сервере для компании. Это инструментарий работодателя на его инфраструктуре; кандидату он ничего не даёт.

Ни одна из этих схем не воспроизводит десктопный опыт. Честное резюме: собеседование только по телефону делает помощь в реальном времени недостижимой, и подготовка заранее несёт весь груз; пробное собеседование накануне вечером приносит больше пользы для телефонного скрининга, чем любой обходной путь во время него.

Что SubcueAI делает вместо приложения для iOS

SubcueAI выпускает нативные десктопные приложения для macOS 14 и новее и Windows 10 и новее, и сознательно не выпускает приложение для iOS. Aaron Cao, основатель SubcueAI, был прямолинеен в своих доводах: приложение для iPhone не смогло бы честно выполнять основную функцию продукта, а выпуск ухудшенного заменителя, притворяющегося полноценным, означал бы обмен доверием пользователей на место в App Store.

Практическая рекомендация следует из архитектуры. Проходите видеособеседования на компьютере всякий раз, когда есть выбор; рекрутёры почти всегда предлагают десктопную ссылку для звонков в Zoom, Google Meet и Microsoft Teams. На десктопе ассистент слышит звонок через операционную систему, а не через воздух, а учебник по настройке проводит через разрешения для обеих платформ за несколько минут.

Для тех частей подготовки к собеседованию, которые подходят для браузера, включая пробное AI-собеседование, телефон или планшет работают нормально, потому что для практики не нужно захватывать звук другого приложения. Детали архитектуры за десктопным путём захвата собраны в ответах о принципах работы.

Частые вопросы

Есть ли версия SubcueAI для iOS?

Нет. SubcueAI выпускает только десктопные приложения для macOS и Windows. iOS не открывает системные аудио-API, на которых построен продукт, и ухудшенная приблизительная версия намеренно не выпускалась.

Может ли какое-нибудь приложение транскрибировать звонок Zoom на моём iPhone?

Не читая аудио звонка напрямую; «песочница» iOS не позволяет одному приложению использовать аудиосессию другого. Приложения, заявляющие о живой транскрипции звонков на iPhone, опираются на акустический захват через микрофон или на серверные интеграции, контролируемые организатором встречи.

Может ли ReplayKit снабжать ассистента для собеседований звуком в реальном времени?

ReplayKit создан для пользовательских трансляций экрана в ограниченный процесс расширения. Это не практический пайплайн в реальном времени, чтобы второе приложение анализировало аудио звонка и возвращало подсказки во время собеседования.

Что делать, если моё собеседование может состояться только по телефону?

Готовьтесь заранее, а не рассчитывайте на живую помощь: проводите пробные собеседования, готовьте свои истории и делайте заметки на бумаге. Если есть хоть какая-то гибкость, попросите рекрутёра десктопную ссылку для входа; почти все собеседования в Zoom, Google Meet и Microsoft Teams её предлагают.

Похожие вопросы

← Подробнее: Как это работает