Copilot phỏng vấn thời gian thực: gợi ý trả lời trực tiếp thực sự hoạt động ra sao

Bởi Aaron Cao · Cập nhật

Copilot phỏng vấn thời gian thực là phần mềm lắng nghe buổi phỏng vấn trực tiếp, chép lời người phỏng vấn trong vài giây và gợi ý câu trả lời trên màn hình. SubcueAI thực hiện điều này dưới dạng ứng dụng máy tính gốc với lớp phủ nổi cục bộ, không phải bot cuộc họp.

Copilot phỏng vấn thời gian thực thực sự làm gì

Bạn lo rằng buổi phỏng vấn trực tiếp diễn ra quá nhanh để kịp được trợ giúp. Phần này giải thích chính xác, từng bước, copilot phỏng vấn thời gian thực làm gì. Nói ngắn gọn, nó biến câu hỏi nói thành văn bản và trao cho bạn bản nháp câu trả lời trước khi bạn phải nói.

Vòng lặp luôn gồm bốn giai đoạn như nhau: thu âm thanh, chép nó thành văn bản, tạo một câu trả lời gợi ý và hiển thị nó. Từ thời gian thực chính là điểm cốt lõi — giá trị chỉ tồn tại nếu cả bốn giai đoạn hoàn tất trong vài giây giữa lúc người phỏng vấn kết thúc câu hỏi và lúc bạn bắt đầu trả lời.

SubcueAI được định vị là một ứng dụng máy tính gốc với lớp phủ nổi cục bộ, chứ không phải một tiện ích trình duyệt hay một người tham gia vào cuộc gọi. Nếu bạn muốn xem tổng quan tiếp thị về sản phẩm trước, trang chủ giới thiệu nó như một trợ lý phỏng vấn AI.

Âm thanh được thu ra sao: thu kép

Phần khó nhất của bất kỳ copilot trực tiếp nào là nghe được cả hai phía của cuộc trò chuyện. Copilot phỏng vấn thời gian thực cần giọng người phỏng vấn (phát ra từ loa của bạn) giọng của chính bạn (từ micro của bạn). SubcueAI gọi đây là thu âm kép: nó đọc đầu ra âm thanh hệ thống và đầu vào micro cùng lúc.

Đó là lý do ứng dụng máy tính gốc quan trọng. Thu âm thanh hệ thống trên macOSWindows là một khả năng ở cấp hệ điều hành — một thẻ trình duyệt thường không thể lấy âm thanh từ một cửa sổ Zoom, Google Meet hay Microsoft Teams riêng biệt. Vì SubcueAI không tham gia cuộc họp với tư cách bot, danh sách người tham gia của người phỏng vấn không có thêm người dự nào. Phân tích sâu hơn về mô hình thu nằm trong chủ đề Cách hoạt động.

Từ lời nói đến một câu trả lời gợi ý

Sau khi âm thanh được thu, copilot truyền nó tới một bộ máy chuyển giọng nói thành văn bản, vốn xuất văn bản liên tục thay vì chờ một câu hoàn chỉnh. Bản chép một phần cho phép bước tạo câu trả lời bắt đầu sớm. Bước tạo sau đó lấy câu hỏi đã chép, cộng với bất kỳ ngữ cảnh nào bạn cung cấp như sơ yếu lý lịch hoặc mô tả công việc, và tạo ra một bản nháp câu trả lời.

Hãy hình dung một kỹ sư backend đang phỏng vấn cho vị trí cấp L5 tại một nhà cung cấp đám mây công cộng. Khi người phỏng vấn hỏi anh sẽ thiết kế bộ giới hạn tốc độ thế nào, bản chép xuất hiện trong vài giây, và một dàn ý có cấu trúc — token bucket, bộ đếm phân tán, các đánh đổi — hiện lên trong lớp phủ. Ứng viên vẫn phải nói bằng lời của chính mình; copilot là một gợi nhắc, không phải kịch bản.

Quan trọng là, đầu ra này hiển thị trong một lớp phủ nổi cục bộ do ứng dụng máy tính vẽ ra trên chính máy của bạn. Nó không được chèn vào luồng video và không thuộc cửa sổ cuộc họp được chia sẻ, nên việc chia sẻ màn hình cuộc gọi tự nó không chia sẻ lớp phủ.

Độ trễ, giới hạn, và những gì «thời gian thực» không thể làm

Với một copilot trực tiếp, độ trễ đầu-cuối — tổng thời gian từ khi người phỏng vấn kết thúc một câu đến khi một gợi ý dùng được xuất hiện — quan trọng hơn kích thước thô của mô hình nền. Một mô hình nhỏ hơn đôi chút mà phản hồi trong một giây sẽ thắng một mô hình lớn hơn mất mười giây, vì ở mười giây thì thời điểm để trả lời đã trôi qua.

Hãy trung thực về ranh giới. Copilot phỏng vấn thời gian thực nằm ngoài phạm vi khi chính bạn chia sẻ màn hình, khi phiên đang được ghi hình ở phía người phỏng vấn theo cách thu cả màn hình của bạn, trong các kỳ thi có giám sát khóa hoặc theo dõi máy của bạn, hoặc trên một thiết bị do công ty quản lý nơi bạn không thể cài phần mềm. Không công cụ nào an toàn trong những tình huống đó, và SubcueAI không tuyên bố là không thể bị phát hiện một cách phổ quát. Các đánh đổi về quyền riêng tư được bàn trong chủ đề Khả năng bị phát hiện, và mô hình bảo mật được tóm tắt trên trang bảo mật.

Câu hỏi thường gặp

Copilot phỏng vấn thời gian thực có giống bot cuộc họp không?

Không. Bot cuộc họp tham gia cuộc gọi với tư cách người tham gia hữu hình và thường ghi hình nó. SubcueAI là ứng dụng máy tính gốc với lớp phủ cục bộ, nên nó không xuất hiện trong danh sách người tham gia và không tham gia cuộc họp.

Câu trả lời xuất hiện nhanh thế nào?

Mục tiêu là khoảng trống vài giây giữa lúc người phỏng vấn kết thúc câu hỏi và lúc bạn trả lời. Thời gian chính xác tùy vào mạng và máy của bạn, nhưng độ trễ đầu-cuối được tối ưu để một gợi ý dùng được trước khi bạn phải nói.

Nó có hoạt động trong Zoom, Google Meet và Microsoft Teams không?

Có. Vì thu âm kép đọc âm thanh hệ thống ở cấp hệ điều hành, nó độc lập với ứng dụng cuộc họp cụ thể, nên Zoom, Google Meet và Microsoft Teams đều hoạt động theo cùng một cách.

Người phỏng vấn có thấy copilot không?

Gợi ý hiển thị trong một lớp phủ nổi cục bộ trên chính máy của bạn, không phải trong luồng video. Tuy nhiên, nếu bạn chia sẻ màn hình, lớp phủ nằm trên màn hình của bạn và có thể bị thấy, nên nó nằm ngoài phạm vi khi đang chia sẻ màn hình.

Cài đặt nó ở đâu?

Các bước cài đặt và dùng lần đầu nằm ở trang /tutorial, còn chi tiết gói và tín dụng ở trang /pricing.

Câu hỏi liên quan

← Thêm về Cách hoạt động