Πώς οι AI βοηθοί συνεντεύξεων καταγράφουν ήχο συστήματος στο iOS και γιατί ως επί το πλείστον δεν μπορούν

Από Aaron Cao · Ενημερώθηκε

Στο iOS ως επί το πλείστον δεν μπορούν, με τον τρόπο που το κάνουν οι βοηθοί desktop. Το iOS δίνει σε κάθε εφαρμογή μια απομονωμένη ηχητική συνεδρία και δεν υπάρχει δημόσιο API για ανάγνωση του ήχου μιας άλλης εφαρμογής σε πραγματικό χρόνο. Οι βοηθοί που χρειάζονται ήχο κλήσεων τρέχουν αντ' αυτού σε macOS ή Windows.

Γιατί το iOS διαφέρει αρχιτεκτονικά από το desktop

Ένας βοηθός συνέντευξης desktop λειτουργεί επειδή τα επιτραπέζια λειτουργικά συστήματα εκθέτουν τον ήχο που αναπαράγει μια άλλη εφαρμογή. Στο macOS αυτή η «πόρτα» είναι το ScreenCaptureKit, η ίδια οικογένεια δικαιωμάτων που τροφοδοτεί την εγγραφή οθόνης· στα Windows είναι το WASAPI loopback, που επιτρέπει σε μια διεργασία να διαβάζει το μείγμα εξόδου του συστήματος. Η διπλή καταγραφή ήχου του SubcueAI είναι χτισμένη απευθείας πάνω σε αυτά τα δύο API.

Το iOS δεν έχει δημόσιο αντίστοιχο. Κάθε εφαρμογή τρέχει σε sandbox με τη δική της ηχητική συνεδρία και το σύστημα δεν προσφέρει στις εφαρμογές τρίτων κανάλι loopback προς το μείγμα ή προς τη συνεδρία άλλης εφαρμογής. Μια κλήση Zoom που τρέχει σε iPhone είναι ακουστή από το Zoom και από το ηχείο, όχι από μια διαφορετική εφαρμογή εγκατεστημένη στο ίδιο τηλέφωνο. Αυτή είναι μια εσκεμμένη απόφαση πλατφόρμας που ισχύει σε όλες τις εκδόσεις iOS.

Η συνέπεια είναι σαφής: η αρχιτεκτονική του βοηθού desktop — καταγραφή ήχου συστήματος, μεταγραφή σε πραγματικό χρόνο, εμφάνιση προτάσεων — δεν μπορεί να μεταφερθεί στο iOS ως έχει. Κάθε προϊόν που ισχυρίζεται το αντίθετο κάνει κάτι ουσιαστικά διαφορετικό κάτω από την επιφάνεια, και είναι εύλογο να ρωτάς τους παρόχους ακριβώς ποιο API χρησιμοποιούν.

Οι υπάρχουσες εναλλακτικές λύσεις και το κόστος της καθεμίας

Αν η συνέντευξή σου πρέπει να γίνει σε iPhone, έχεις δίκιο ότι οι επιλογές φαίνονται λίγες· βοηθά να ξέρεις ακριβώς τι μπορεί και τι δεν μπορεί να κάνει η κάθε εναλλακτική λύση. Κυκλοφορούν 3 μοτίβα και καθένα θυσιάζει κάτι σημαντικό.

  • Εκπομπές ReplayKit. Το iOS μπορεί να εγγράψει την οθόνη με ήχο εφαρμογής μέσω μιας εκπομπής που εκκινεί ο χρήστης, αλλά η ροή τρέχει μέσα σε μια αυστηρά περιορισμένη επέκταση εκπομπής. Είναι φτιαγμένο για μεταδόσεις οθόνης σε υπηρεσίες, όχι για τροφοδότηση μιας δεύτερης εφαρμογής που αναλύει ήχο κλήσεων και απαντά σε πραγματικό χρόνο.
  • Ηχείο συν δεύτερη συσκευή. Βάλε την κλήση στο ηχείο και άσε το μικρόφωνο ενός laptop να ακούει ακουστικά. Αυτό λειτουργεί με οποιονδήποτε βοηθό, συμπεριλαμβανομένου του καναλιού μικροφώνου του SubcueAI, αλλά η αντήχηση δωματίου και οι παρεμβολές μειώνουν την ακρίβεια μεταγραφής και ο συνεντευκτής σε ακούει με την ακουστική ηχείου.
  • Ενσωματώσεις από την πλευρά του εργοδότη. Ορισμένες πλατφόρμες συνεντεύξεων μεταγράφουν κλήσεις από πλευράς διακομιστή για την εταιρεία. Αυτό είναι το εργαλείο του εργοδότη στην υποδομή του· δεν κάνει τίποτα για την πλευρά του υποψηφίου.

Καμία από αυτές δεν αναπαράγει την εμπειρία desktop. Η ειλικρινής σύνοψη είναι ότι μια συνέντευξη αποκλειστικά μέσω τηλεφώνου καθιστά τη βοήθεια σε πραγματικό χρόνο ανέφικτη, και η προετοιμασία εκ των προτέρων φέρει το βάρος· μια συνεδρία προσομοίωσης συνέντευξης το προηγούμενο βράδυ κάνει περισσότερα για μια τηλεφωνική επιλογή από οποιαδήποτε εναλλακτική λύση κατά τη διάρκειά της.

Τι κάνει το SubcueAI αντί για εφαρμογή iOS

Το SubcueAI διαθέτει εγγενείς εφαρμογές desktop για macOS 14 και νεότερες εκδόσεις και Windows 10 και νεότερες εκδόσεις και σκόπιμα δεν διαθέτει εφαρμογή iOS. Ο Aaron Cao, ιδρυτής του SubcueAI, ήταν άμεσος σχετικά με το σκεπτικό: μια εφαρμογή iPhone δεν θα μπορούσε να εκτελεί την βασική λειτουργία του προϊόντος με ειλικρίνεια, και η διάθεση ενός υποβαθμισμένου ακροατή που προσποιείται το αντίθετο θα ανέκαζε την εμπιστοσύνη των χρηστών με μια καταχώριση στο App Store.

Η πρακτική σύσταση προκύπτει από την αρχιτεκτονική. Κάνε βιντεοσυνεντεύξεις σε υπολογιστή όταν υπάρχει η επιλογή· οι υπεύθυνοι πρόσληψης προσφέρουν σχεδόν πάντα σύνδεσμο συμμετοχής από desktop για κλήσεις Zoom, Google Meet και Microsoft Teams. Στο desktop, ο βοηθός ακούει την κλήση μέσω του λειτουργικού συστήματος αντί μέσω του αέρα, και το εκπαιδευτικό υλικό ρύθμισης παρουσιάζει τα δικαιώματα και για τις δύο πλατφόρμες σε λίγα λεπτά.

Για τα μέρη της προετοιμασίας συνέντευξης που ταιριάζουν σε πρόγραμμα περιήγησης, συμπεριλαμβανομένης της AI προσομοίωσης συνέντευξης, ένα τηλέφωνο ή tablet λειτουργεί μια χαρά, επειδή η εξάσκηση δεν απαιτεί καταγραφή ήχου άλλης εφαρμογής. Οι αρχιτεκτονικές λεπτομέρειες πίσω από τη διαδρομή καταγραφής desktop συλλέγονται στις απαντήσεις how-it-works.

Συχνές ερωτήσεις

Υπάρχει έκδοση iOS του SubcueAI;

Όχι. Το SubcueAI διαθέτει μόνο εφαρμογές desktop για macOS και Windows. Το iOS δεν εκθέτει τα API ήχου συστήματος πάνω στα οποία είναι χτισμένο το προϊόν, και μια υποβαθμισμένη προσέγγιση σκόπιμα δεν έχει διατεθεί.

Μπορεί οποιαδήποτε εφαρμογή να μεταγράψει μια κλήση Zoom που τρέχει στο iPhone μου;

Όχι διαβάζοντας άμεσα τον ήχο κλήσης· το sandboxing του iOS αποτρέπει μια εφαρμογή από το να καταναλώνει τη συνεδρία ήχου άλλης εφαρμογής. Οι εφαρμογές που ισχυρίζονται ζωντανή μεταγραφή κλήσεων σε iPhone βασίζονται σε ακουστική καταγραφή μέσω μικροφώνου ή σε ενσωματώσεις από πλευράς διακομιστή που ελέγχονται από τον οικοδεσπότη της σύσκεψης.

Θα μπορούσε το ReplayKit να τροφοδοτεί έναν βοηθό συνέντευξης σε πραγματικό χρόνο;

Το ReplayKit είναι φτιαγμένο για εκπομπές οθόνης που εκκινούνται από τον χρήστη σε μια περιορισμένη διαδικασία επέκτασης. Δεν αποτελεί πρακτικό pipeline πραγματικού χρόνου για μια δεύτερη εφαρμογή ώστε να αναλύει ήχο κλήσεων και να επιστρέφει προτάσεις κατά τη διάρκεια συνέντευξης.

Τι πρέπει να κάνω αν η συνέντευξή μου μπορεί να γίνει μόνο στο τηλέφωνό μου;

Προετοιμάσου εκ των προτέρων αντί να βασίζεσαι σε ζωντανή βοήθεια: κάνε συνεδρίες προσομοίωσης συνέντευξης, ετοίμασε τις ιστορίες σου και κράτα σημειώσεις σε χαρτί. Αν υπάρχει οποιαδήποτε ευελιξία, ζήτα από τον υπεύθυνο πρόσληψης σύνδεσμο συμμετοχής από desktop· σχεδόν όλες οι συνεντεύξεις Zoom, Google Meet και Microsoft Teams προσφέρουν έναν.

Σχετικές ερωτήσεις

← Περισσότερα για Πώς λειτουργεί