Чи може AI-асистент для співбесід транскрибувати як інтерв'юера, так і кандидата?

Автор: Aaron Cao · Оновлено

Так. Одночасно захоплюючи системний звук (голос інтерв'юера з ваших динаміків) і мікрофон, AI-асистент для співбесід може транскрибувати обидві сторони розмови в режимі реального часу. SubcueAI робить це за допомогою нативного подвійного захоплення звуку — жодного бота для нарад не потрібно.

Чому транскрибування обох сторін потребує двох джерел звуку

Якщо ви коли-небудь намагалися записати співбесіду за допомогою одного мікрофона, ви вже знаєте цю проблему: ваш власний голос чіткий і гучний, але інтерв'юер — що лунає з ваших динаміків або навушників — тихий, луна-подібний або взагалі не чутний. Для чіткого транскрибування обох сторін потрібні два окремих джерела звуку.

AI-асистент для співбесід вирішує це, одночасно захоплюючи два потоки: системний звук (все, що відтворює ваш комп'ютер, включно з голосом інтерв'юера у Zoom, Google Meet або Microsoft Teams) і ваш мікрофон (ваші власні відповіді). Кожен потік транскрибується незалежно, тому слова приписуються правильному мовцю, а не змішуються в одну нерозбірливу доріжку.

Як SubcueAI захоплює і інтерв'юера, і вас

SubcueAI працює як нативний десктопний застосунок на macOS і Windows — не як плагін для браузера і не як бот, що приєднується до наради. На macOS він отримує системний звук через API захоплення екрана операційної системи; на Windows використовує системний пристрій зворотного зв'язку (loopback). Мікрофон захоплюється паралельно через звичайний пристрій введення.

Уявіть бекенд-інженера, який проходить співбесіду на посаду сеньйора через Zoom: питання менеджера з найму надходять як системний звук, усні відповіді кандидата — як звук мікрофона, і SubcueAI транскрибує обидва в режимі реального часу. Оскільки два потоки залишаються окремими, транскрипт виглядає як розмічений діалог, а не один нерозчленований блок.

Захоплення відбувається повністю на вашому пристрої, а плаваючий оверлей, що показує транскрипт, є локальним на вашому робочому столі. Короткий посібник із налаштування охоплює встановлення.

Розділення мовців, затримка і точність

Розміщення інтерв'юера і кандидата на окремих каналах робить більше, ніж просто впорядковує транскрипт — це дозволяє асистенту вирішити, на яку репліку реагувати. Питання на каналі інтерв'юера — це те, на що має відповідати підказка відповіді; ваш власний канал є контекстом, а не новим запитом.

  • Позначення мовців природно випливає з дводжерельного дизайну, оскільки кожен потік має відомого власника.
  • Затримка залежить від шляху розпізнавання мовлення; потокове транскрибування повертає частковий текст, поки людина ще говорить.
  • Точність найкраща за чистого сигналу системного звуку — хорошу гарнітуру і тиха кімната допомагають обом каналам.

Для повного шляху від захоплення до підказки дивіться хаб how it works.

Де подвійне транскрибування не застосовується

Двостороннє транскрибування передбачає, що звук дійсно надходить до вихідних і вхідних пристроїв вашого комп'ютера. Воно не охоплює кожну ситуацію, і чесно визнати це:

  • На корпоративному пристрої, яким ви не керуєте, ви можете взагалі не мати змоги встановити десктопний застосунок.
  • Середовища під наглядом і програмне забезпечення для дистанційного моніторингу можуть обмежувати фонові застосунки або активність екрана.
  • Якщо сеанс записується з екрана з іншого боку, цей запис є незалежним від того, що ваш асистент робить локально.
  • Особисті раунди, де звук ніколи не проходить через ваш комп'ютер, виходять за межі захоплення системного звуку.

SubcueAI створено для ваших власних дистанційних співбесід на вашому власному пристрої; його обмеження розглядаються в хабі detectability.

Часті запитання

Чи транскрибується також голос інтерв'юера, чи лише мій?

Обидва. Голос інтерв'юера захоплюється як системний звук (те, що відтворює ваш комп'ютер), а ваш голос — як звук мікрофона, тому транскрипт показує обидві сторони розмови.

Чи потрібен мені бот для нарад або розширення браузера?

Ні. SubcueAI — це нативний десктопний застосунок, який локально захоплює системний звук і звук мікрофона — ніщо не приєднується до дзвінка і немає жодного плагіна для браузера.

Чи може він визначити, хто що сказав?

Так. Оскільки інтерв'юер і кандидат надходять на двох окремих аудіопотоках, кожен транскрибований рядок вже має відомого власника, тому позначення мовців вбудоване.

Чи це працює на Zoom, Google Meet і Microsoft Teams?

Так. Захоплення системного звуку не залежить від платформи для нарад, тому голос інтерв'юера транскрибується незалежно від того, чи відбувається дзвінок у Zoom, Google Meet або Microsoft Teams.

Чи транскрибує він обидві сторони особистої співбесіди?

Ні. Захоплення системного звуку працює лише тоді, коли звук проходить через ваш комп'ютер. Особисті раунди, де ви не перебуваєте на дзвінку, виходять за межі підтримки.

Схожі запитання

← Докладніше: Як це працює