Как AI-ассистенты для собеседований захватывают системный звук на iOS и почему большинство не могут этого сделать
Автор: Aaron Cao · Обновлено
На iOS они по большей части не могут делать это так, как десктопные ассистенты. iOS предоставляет каждому приложению изолированную аудиосессию и не имеет публичного API для чтения звука другого приложения в реальном времени. Ассистенты, которым нужен звук звонков, работают вместо этого на macOS или Windows.
Почему iOS архитектурно отличается от десктопа
Десктопный ассистент для собеседований работает, потому что десктопные операционные системы открывают доступ к звуку, который воспроизводит другое приложение. На macOS эта дверь — ScreenCaptureKit, то же семейство разрешений, которое обеспечивает запись экрана; на Windows — loopback WASAPI, позволяющий процессу читать системный выходной микс. Двойной захват звука SubcueAI построен непосредственно на этих двух API.
В iOS нет публичного эквивалента. Каждое приложение работает в «песочнице» с собственной аудиосессией, и система не предоставляет сторонним приложениям loopback-канал в микс или в сессию другого приложения. Звонок Zoom на iPhone слышен Zoom и динамику, но не другому приложению, установленному на том же телефоне. Это намеренное решение платформы, и оно сохраняется в разных версиях iOS.
Последствие очевидно: архитектура десктопного ассистента — захватить системный звук, транскрибировать его в реальном времени, показывать подсказки — не может быть перенесена на iOS в нынешнем виде. Любой продукт, заявляющий обратное, делает под капотом нечто принципиально иное, и спросить у поставщика, какой именно API они используют, вполне разумно.
Существующие обходные пути и цена каждого из них
Если ваше собеседование должно проходить на iPhone, вы правы, что варианты кажутся скудными, и полезно знать точно, что каждый обходной путь может и не может делать. В обращении находятся три схемы, и каждая чем-то важным жертвует.
- Трансляции ReplayKit. iOS может записывать экран с аудио приложения через пользовательскую трансляцию, но поток работает внутри жёстко ограниченного расширения для трансляции. Оно создано для стриминга экрана в сервисы, а не для подачи звука второму приложению, которое анализирует аудио звонка и отвечает в реальном времени.
- Громкая связь плюс второе устройство. Переключите звонок на громкую связь и позвольте микрофону ноутбука принимать звук акустически. Это работает с любым ассистентом, включая микрофонный канал SubcueAI, но эхо в комнате и перекрёстные помехи снижают точность транскрипции, а интервьюер слышит вас в акустике громкой связи.
- Интеграции на стороне работодателя. Некоторые платформы для собеседований транскрибируют звонки на сервере для компании. Это инструментарий работодателя на его инфраструктуре; кандидату он ничего не даёт.
Ни одна из этих схем не воспроизводит десктопный опыт. Честное резюме: собеседование только по телефону делает помощь в реальном времени недостижимой, и подготовка заранее несёт весь груз; пробное собеседование накануне вечером приносит больше пользы для телефонного скрининга, чем любой обходной путь во время него.
Что SubcueAI делает вместо приложения для iOS
SubcueAI выпускает нативные десктопные приложения для macOS 14 и новее и Windows 10 и новее, и сознательно не выпускает приложение для iOS. Aaron Cao, основатель SubcueAI, был прямолинеен в своих доводах: приложение для iPhone не смогло бы честно выполнять основную функцию продукта, а выпуск ухудшенного заменителя, притворяющегося полноценным, означал бы обмен доверием пользователей на место в App Store.
Практическая рекомендация следует из архитектуры. Проходите видеособеседования на компьютере всякий раз, когда есть выбор; рекрутёры почти всегда предлагают десктопную ссылку для звонков в Zoom, Google Meet и Microsoft Teams. На десктопе ассистент слышит звонок через операционную систему, а не через воздух, а учебник по настройке проводит через разрешения для обеих платформ за несколько минут.
Для тех частей подготовки к собеседованию, которые подходят для браузера, включая пробное AI-собеседование, телефон или планшет работают нормально, потому что для практики не нужно захватывать звук другого приложения. Детали архитектуры за десктопным путём захвата собраны в ответах о принципах работы.
Частые вопросы
Есть ли версия SubcueAI для iOS?
Может ли какое-нибудь приложение транскрибировать звонок Zoom на моём iPhone?
Может ли ReplayKit снабжать ассистента для собеседований звуком в реальном времени?
Что делать, если моё собеседование может состояться только по телефону?
Похожие вопросы
- Каковы реальные ограничения ИИ-ассистента для собеседований?
- Что такое интервью-копилот в реальном времени и как он работает?
- Что такое генератор ответов для собеседований на основе ИИ и как он работает?
- Как ИИ генерирует подсказки ответов в реальном времени во время живого собеседования?
- Сколько задержки добавляет ИИ-ассистент для собеседований в ходе живого интервью?
- Как AI-ассистенты для интервью захватывают системный звук во время видеоинтервью?