Jak AI asistenti pro pohovory zachycují systémový zvuk na iOS a proč to většinou nemohou

Autor: Aaron Cao · Aktualizováno

Na iOS to většinou nemohou dělat tak, jak to dělají desktopoví asistenti. iOS dává každé aplikaci sandboxovanou audio relaci a neexistuje žádné veřejné API pro čtení zvuku jiné aplikace v reálném čase. Asistenti, kteří potřebují zvuk hovorů, místo toho běží na macOS nebo Windows.

Proč se iOS architektonicky liší od desktopu

Desktopový asistent pro pohovory funguje, protože desktopové operační systémy zpřístupňují zvuk, který přehrává jiná aplikace. Na macOS jsou tímto vstupem ScreenCaptureKit, stejná rodina oprávnění, která pohání nahrávání obrazovky; na Windows je to WASAPI loopback, který umožňuje procesu číst výstupní mix systému. Dvojité zachytávání zvuku SubcueAI je postaveno přímo na těchto dvou API.

iOS nemá veřejný ekvivalent. Každá aplikace běží v sandboxu s vlastní audio relací a systém nenabízí aplikacím třetích stran loopback kanál do mixu ani do relace jiné aplikace. Hovor Zoom běžící na iPhonu je slyšitelný pro Zoom a pro reproduktor, ne pro jinou aplikaci nainstalovanou na stejném telefonu. Jde o záměrné rozhodnutí platformy, které se udrželo ve všech verzích iOS.

Důsledek je jasný: architekturu desktopového asistenta — zachycení systémového zvuku, přepis v reálném čase, zobrazení návrhů — nelze jako takovou přenést na iOS. Každý produkt, který tvrdí opak, dělá pod kapotou něco zásadně jiného, a je legitimní ptát se dodavatelů přesně na to, které API používají.

Dostupná řešení a cena každého z nich

Pokud musí váš pohovor proběhnout na iPhonu, máte pravdu, že možnosti se zdají být malé; pomáhá přesně vědět, co každé řešení může a co nemůže. V oběhu jsou 3 vzory a každý obětuje něco důležitého.

  • Vysílání ReplayKit. iOS může nahrávat obrazovku se zvukem aplikace prostřednictvím uživatelem iniciovaného vysílání, ale stream běží uvnitř přísně omezeného rozšíření vysílání. Je určen pro streamování obrazovky do služeb, nikoli pro napájení druhé aplikace, která analyzuje zvuk hovoru a odpovídá v reálném čase.
  • Reproduktor plus druhé zařízení. Dejte hovor na reproduktor a nechte mikrofon notebooku akusticky naslouchat. Funguje to s jakýmkoli asistentem, včetně mikrofonního kanálu SubcueAI, ale ozvěna místnosti a přeslech snižují přesnost přepisu a tazatel vás slyší v akustice reproduktoru.
  • Integrace na straně zaměstnavatele. Některé platformy pro pohovory přepisují hovory na straně serveru pro společnost. To jsou nástroje zaměstnavatele na jejich infrastruktuře; pro stranu kandidáta nedělají nic.

Žádné z těchto řešení nereprodukuje desktopový zážitek. Upřímné shrnutí je, že pohovor pouze přes telefon dělá pomoc v reálném čase nedosažitelnou a příprava předem nese tíhu; session zkušebního pohovoru večer předem udělá pro telefonický screening více než jakékoli řešení v jeho průběhu.

Co SubcueAI dělá místo aplikace pro iOS

SubcueAI dodává nativní desktopové aplikace pro macOS 14 a novější a Windows 10 a novější a záměrně nedodává aplikaci pro iOS. Aaron Cao, zakladatel SubcueAI, byl přímý ohledně důvodů: aplikace pro iPhone by nemohla čestně plnit základní funkci produktu a dodat degradovaného posluchače, který předstírá opak, by znamenalo vyměnit důvěru uživatelů za zápis v App Store.

Praktické doporučení plyne z architektury. Absolvujte video pohovory na počítači, kdykoli to je možné; náboráři téměř vždy nabízejí odkaz na připojení přes desktop pro hovory Zoom, Google Meet a Microsoft Teams. Na desktopu asistent slyší hovor přes operační systém, nikoli přes vzduch, a průvodce nastavením projde oprávněními pro obě platformy za několik minut.

Pro části přípravy na pohovor, které se hodí do prohlížeče, včetně AI zkušebního pohovoru, telefon nebo tablet funguje skvěle, protože procvičování nevyžaduje zachycení zvuku jiné aplikace. Architektonické detaily za desktopovou cestou zachytávání jsou shromážděny v odpovědích how-it-works.

Časté dotazy

Existuje verze SubcueAI pro iOS?

Ne. SubcueAI dodává pouze desktopové aplikace pro macOS a Windows. iOS nezveřejňuje API systémového zvuku, na kterém je produkt postaven, a degradovaná aproximace záměrně nebyla dodána.

Může nějaká aplikace přepsat hovor Zoom běžící na mém iPhonu?

Ne přímým čtením zvuku hovoru; sandboxing iOS zabraňuje jedné aplikaci spotřebovávat audio relaci jiné aplikace. Aplikace, které tvrdí přepis živých hovorů na iPhonu, spoléhají na akustické zachytávání přes mikrofon nebo na serverové integrace kontrolované hostitelem schůzky.

Mohl by ReplayKit napájet asistenta pro pohovory v reálném čase?

ReplayKit je postaven pro uživatelem iniciovaná vysílání obrazovky do omezeného procesu rozšíření. Není to praktický pipeline v reálném čase pro druhou aplikaci k analýze zvuku hovoru a vrácení návrhů během pohovoru.

Co mám dělat, pokud se můj pohovor může konat pouze na mém telefonu?

Připravte se předem místo spoléhání na živou pomoc: absolvujte zkušební pohovory, připravte si své příběhy a dělejte si poznámky na papír. Pokud existuje jakákoli flexibilita, požádejte náboráře o odkaz na připojení přes desktop; téměř všechny pohovory přes Zoom, Google Meet a Microsoft Teams ho nabízejí.

Související otázky

← Více o Jak to funguje