Dokáže AI asistent pro pohovory přepsat jak tazatele, tak uchazeče?

Autor: Aaron Cao · Aktualizováno

Ano. Tím, že zachytává systémový zvuk (hlas tazatele z vašich reproduktorů) a váš mikrofon současně, dokáže AI asistent pro pohovory přepsat obě strany rozhovoru v reálném čase. SubcueAI to dělá s nativním duálním zachytáváním zvuku — není potřeba žádný meetingový bot.

Proč přepis obou stran vyžaduje dva zvukové zdroje

Pokud jste se někdy pokusili nahrát pohovor pomocí jediného mikrofonu, znáte problém: váš vlastní hlas je hlasitý a čistý, ale tazatel — přicházející přes vaše reproduktory nebo sluchátka — je slabý, echovatý nebo zcela chybí. Čistý přepis obou stran vyžaduje dva oddělené zvukové zdroje.

AI asistent pro pohovory to řeší zachytáváním dvou streamů najednou: systémový zvuk (vše, co váš počítač přehrává, včetně hlasu tazatele v Zoom, Google Meet nebo Microsoft Teams) a váš mikrofon (vaše vlastní odpovědi). Každý stream je přepsán nezávisle, takže slova jsou přiřazena správnému mluvčímu místo aby se mísila do jedné nepřehledné stopy.

Jak SubcueAI zachytává jak tazatele, tak vás

SubcueAI běží jako nativní desktopová aplikace na macOS a Windows — není to prohlížečový plugin ani bot, který se připojuje ke schůzce. Na macOS zachytává systémový zvuk prostřednictvím API pro zachytávání zvuku operačního systému; na Windows používá systémové loopback zařízení. Váš mikrofon je zachytáván paralelně přes normální vstupní zařízení.

Představte si backendového inženýra, který se přes Zoom uchází o seniorní pozici: otázky vedoucího náboru přicházejí jako systémový zvuk, mluvené odpovědi uchazeče přicházejí jako zvuk mikrofonu a SubcueAI přepisuje každý stream v reálném čase. Protože oba streamy zůstávají oddělené, přepis se čte jako označený dialog, nikoli jako jeden nediferencovaný blok.

Zachytávání probíhá zcela na vašem počítači a plovoucí překryvná vrstva zobrazující přepis je lokální na vašem desktopu. Krátký průvodce nastavením pokrývá instalaci.

Oddělení mluvčích, latence a přesnost

Udržování tazatele a uchazeče na oddělených kanálech dělá víc než jen uklízí přepis — umožňuje asistentovi rozhodnout, na které replice má reagovat. Otázka na kanálu tazatele je to, na co by měl reagovat návrh odpovědi; váš vlastní kanál je kontext, nikoli nová výzva.

  • Označení mluvčího přirozeně vyplývá z návrhu dvou zdrojů, protože každý stream má známého vlastníka.
  • Latence závisí na cestě speech-to-text; streamovací přepis vrací částečný text, zatímco osoba ještě mluví.
  • Přesnost je nejlepší s čistým signálem systémového zvuku — dobrá sluchátka a tichá místnost pomáhají oběma kanálům.

Pro celou cestu od zachytávání po návrh viz centrum jak to funguje.

Kde duální přepis nefunguje

Oboustranný přepis předpokládá, že zvuk skutečně dosahuje výstupních a vstupních zařízení vašeho počítače. Ne každou situaci pokrývá, a je poctivé to říci:

  • Na firemně spravovaném zařízení, které nekontrolujete, nemusíte být vůbec schopni nainstalovat desktopovou aplikaci.
  • Dozorované prostředí a software pro vzdálené monitorování mohou omezovat aplikace na pozadí nebo aktivitu obrazovky.
  • Pokud je relace na druhé straně nahrávána na obrazovku, toto nahrávání je nezávislé na tom, co váš asistent dělá lokálně.
  • Osobní kola, kde zvuk nikdy neprojde přes váš počítač, jsou mimo rozsah systémového zachytávání zvuku.

SubcueAI je vytvořen pro vaše vlastní vzdálené pohovory na vašem vlastním počítači; jeho limity jsou popsány v centru detekovatelnosti.

Časté dotazy

Přepisuje se i hlas tazatele, nebo jen můj?

Oba. Hlas tazatele je zachycen jako systémový zvuk (co váš počítač přehrává) a váš hlas jako zvuk mikrofonu, takže přepis zobrazuje obě strany rozhovoru.

Potřebuji pro to meetingového bota nebo rozšíření prohlížeče?

Ne. SubcueAI je nativní desktopová aplikace, která zachytává systémový zvuk a zvuk mikrofonu lokálně — nic se nepřipojuje k hovoru a neexistuje žádný prohlížečový plugin.

Pozná, kdo co říkal?

Ano. Protože tazatel a uchazeč přicházejí na dvou oddělených zvukových streamech, každý přepsaný řádek již má známého vlastníka, takže označení mluvčího je zabudováno.

Funguje to se Zoom, Google Meet a Microsoft Teams?

Ano. Zachytávání systémového zvuku je nezávislé na platformě schůzky, takže hlas tazatele je přepsán bez ohledu na to, zda hovor probíhá přes Zoom, Google Meet nebo Microsoft Teams.

Přepíše obě strany osobního pohovoru?

Ne. Zachytávání systémového zvuku funguje pouze tehdy, když zvuk prochází přes váš počítač. Osobní kola, kde nejste na hovoru, nejsou podporována.

Související otázky

← Více o Jak to funguje