AI interview assistant สามารถถอดเสียงทั้งผู้สัมภาษณ์และผู้สมัครได้ไหม?

โดย Aaron Cao · อัปเดตเมื่อ

ได้ โดยการจับ system audio (เสียงของผู้สัมภาษณ์จากลำโพงของคุณ) และไมโครโฟนพร้อมกัน AI interview assistant สามารถถอดเสียงการสนทนาทั้งสองฝ่ายแบบ real time ได้ SubcueAI ทำสิ่งนี้ด้วย native dual audio capture — ไม่จำเป็นต้องใช้ meeting bot

ทำไมการถอดเสียงทั้งสองฝ่ายจึงต้องใช้แหล่งเสียง 2 แหล่ง

หากคุณเคยลองบันทึกการสัมภาษณ์ด้วยไมโครโฟนตัวเดียว คุณคงรู้ปัญหาแล้ว: เสียงของคุณเองดังและชัดเจน แต่ผู้สัมภาษณ์ — ที่มาจากลำโพงหรือหูฟังของคุณ — เบา มีเสียงก้อง หรือหายไปเลย การถอดเสียงทั้งสองฝ่ายอย่างชัดเจนต้องใช้แหล่งเสียง 2 แหล่งที่แยกกัน

AI interview assistant แก้ปัญหานี้โดยจับ 2 สตรีมพร้อมกัน: system audio (ทุกอย่างที่คอมพิวเตอร์ของคุณเล่น รวมถึงเสียงผู้สัมภาษณ์ใน Zoom, Google Meet หรือ Microsoft Teams) และไมโครโฟนของคุณ (คำตอบของคุณเอง) แต่ละสตรีมถูกถอดเสียงอิสระ ดังนั้นคำพูดจึงถูกนำไปให้ผู้พูดที่ถูกต้องแทนที่จะรวมกันเป็นแทร็กเดียวที่ฟังยาก

SubcueAI จับเสียงทั้งผู้สัมภาษณ์และคุณอย่างไร

SubcueAI ทำงานเป็น native desktop app บน macOS และ Windows — ไม่ใช่ browser plugin และไม่ใช่บอทที่เข้าร่วมการประชุม บน macOS จะเข้าถึง system audio ผ่าน screen-capture audio APIs ของระบบปฏิบัติการ บน Windows จะใช้ system loopback device ไมโครโฟนของคุณถูกจับพร้อมกันผ่านอุปกรณ์ input ปกติ

ลองนึกภาพ backend engineer ที่กำลังสัมภาษณ์ตำแหน่ง senior ผ่าน Zoom: คำถามของ hiring manager มาเป็น system audio คำตอบที่พูดของผู้สมัครมาเป็น microphone audio และ SubcueAI ถอดเสียงแต่ละส่วนแบบ real time เนื่องจากสองสตรีมยังคงแยกกัน transcript จึงอ่านเหมือนการสนทนาที่มีป้ายกำกับ ไม่ใช่บล็อกเดียวที่ไม่มีความแตกต่าง

การจับเสียงเกิดขึ้นทั้งหมดบนเครื่องของคุณ และ floating overlay ที่แสดง transcript อยู่ใน local desktop ของคุณ คู่มือการตั้งค่าสั้น ๆ ครอบคลุมขั้นตอนการติดตั้ง

การแยกผู้พูด latency และความแม่นยำ

การรักษาผู้สัมภาษณ์และผู้สมัครไว้ในช่องสัญญาณแยกกันทำได้มากกว่าแค่จัดระเบียบ transcript — ช่วยให้ assistant ตัดสินใจได้ว่าจะตอบสนองต่อเทิร์นไหน คำถามบนช่องสัญญาณของผู้สัมภาษณ์คือสิ่งที่ข้อเสนอแนะคำตอบควรตอบ ช่องสัญญาณของคุณเองคือบริบท ไม่ใช่ prompt ใหม่

  • การระบุผู้พูด เกิดขึ้นตามธรรมชาติจากการออกแบบ two-source เนื่องจากแต่ละสตรีมมีเจ้าของที่ชัดเจน
  • Latency ขึ้นอยู่กับเส้นทาง speech-to-text การถอดเสียงแบบ streaming จะส่งคืนข้อความบางส่วนขณะที่คนยังพูดอยู่
  • ความแม่นยำ ดีที่สุดเมื่อมีสัญญาณ system-audio ที่สะอาด — headset ที่ดีและห้องที่เงียบช่วยทั้งสองช่องสัญญาณ

สำหรับเส้นทาง capture-to-suggestion แบบเต็ม ดูที่ hub วิธีการทำงาน

เมื่อใดที่ dual transcription ไม่สามารถนำไปใช้ได้

Two-sided transcription สมมติว่าเสียงจริง ๆ ไปถึงอุปกรณ์ output และ input ของคอมพิวเตอร์ของคุณ ไม่ครอบคลุมทุกสถานการณ์ และเป็นเรื่องซื่อสัตย์ที่จะบอกเช่นนั้น:

  • บนอุปกรณ์ที่บริษัทจัดการซึ่งคุณไม่ได้ควบคุม คุณอาจไม่สามารถติดตั้ง desktop app ได้เลย
  • สภาพแวดล้อมที่มีการควบคุมและซอฟต์แวร์ remote-monitoring อาจจำกัด background apps หรือกิจกรรมบนหน้าจอ
  • หากเซสชันถูกบันทึกหน้าจอจากอีกฝ่าย การบันทึกนั้นเป็นอิสระจากสิ่งที่ assistant ของคุณทำในเครื่อง
  • การสัมภาษณ์แบบพบตัวจริง ที่เสียงไม่ผ่านคอมพิวเตอร์ของคุณ อยู่นอกขอบเขตของ system-audio capture

SubcueAI สร้างขึ้นสำหรับการสัมภาษณ์ remote ของคุณเองบนเครื่องของคุณเอง ข้อจำกัดของมันอธิบายไว้ใน hub detectability

คำถามที่พบบ่อย

เสียงของผู้สัมภาษณ์ถูกถอดเสียงด้วยไหม หรือแค่ของฉัน?

ทั้งคู่ เสียงของผู้สัมภาษณ์ถูกจับเป็น system audio (สิ่งที่คอมพิวเตอร์ของคุณเล่น) และเสียงของคุณเป็น microphone audio ดังนั้น transcript จึงแสดงทั้งสองฝ่ายของการสนทนา

ฉันต้องการ meeting bot หรือ browser extension สำหรับสิ่งนี้ไหม?

ไม่ SubcueAI เป็น native desktop app ที่จับ system และ microphone audio ในเครื่อง — ไม่มีอะไรเข้าร่วมการโทร และไม่มี browser plugin

มันบอกได้ไหมว่าใครพูดอะไร?

ได้ เนื่องจากผู้สัมภาษณ์และผู้สมัครมาจากสองสตรีมเสียงที่แยกกัน แต่ละบรรทัดของ transcript มีเจ้าของที่ชัดเจนอยู่แล้ว ดังนั้นการระบุผู้พูดจึงถูกสร้างไว้ในตัว

ใช้งานได้กับ Zoom, Google Meet และ Microsoft Teams ไหม?

ได้ System-audio capture ไม่ขึ้นอยู่กับ meeting platform ดังนั้นเสียงของผู้สัมภาษณ์จึงถูกถอดเสียงไม่ว่าการโทรจะทำงานบน Zoom, Google Meet หรือ Microsoft Teams

มันจะถอดเสียงทั้งสองฝ่ายของการสัมภาษณ์แบบพบตัวจริงได้ไหม?

ไม่ System-audio capture ทำงานได้เฉพาะเมื่อเสียงผ่านคอมพิวเตอร์ของคุณ การสัมภาษณ์แบบพบตัวจริงที่คุณไม่ได้อยู่ในการโทร อยู่นอกขอบเขต

คำถามที่เกี่ยวข้อง

← เพิ่มเติมเกี่ยวกับ หลักการทำงาน