هل يستطيع مساعد المقابلة بالذكاء الاصطناعي نسخ كلام المحاور والمرشح معاً؟

بقلم Aaron Cao · آخر تحديث

نعم. عن طريق التقاط صوت النظام (صوت المحاور من مكبرات الصوت) والميكروفون في الوقت ذاته، يستطيع مساعد المقابلة بالذكاء الاصطناعي نسخ كلا الطرفين في المحادثة بشكل فوري. يقوم SubcueAI بذلك من خلال التقاط مزدوج أصيل للصوت — لا حاجة لأي بوت اجتماعات.

لماذا يتطلب نسخ كلا الطرفين مصدرَي صوت

إذا سبق لك أن حاولت تسجيل مقابلة بميكروفون واحد، فأنت تعرف المشكلة بالفعل: صوتك أنت واضح ومرتفع، لكن المحاور — الذي يصل عبر مكبرات الصوت أو سماعات الرأس — يكون خافتاً أو مليئاً بالصدى أو يُفقد تماماً. نسخ كلا الطرفين بشكل نظيف يستلزم مصدرَي صوت منفصلَين.

يحل مساعد المقابلة بالذكاء الاصطناعي هذه المشكلة بالتقاط مجريَين في آنٍ واحد: صوت النظام (كل ما يشغله جهازك، بما في ذلك صوت المحاور في Zoom أو Google Meet أو Microsoft Teams) وميكروفونك (إجاباتك الخاصة). يُنسخ كل مجرى بشكل مستقل، فتُنسب الكلمات إلى المتحدث الصحيح بدلاً من أن تمتزج في مسار ضبابي واحد.

كيف يلتقط SubcueAI كلاً من المحاور وأنت

يعمل SubcueAI كتطبيق سطح مكتب أصيل على macOS وWindows — وليس إضافة متصفح، وليس بوتاً يدخل الاجتماع. على macOS يلتقط صوت النظام عبر واجهات برمجة التطبيقات الخاصة بالتقاط صوت الشاشة في نظام التشغيل؛ وعلى Windows يستخدم جهاز loopback الخاص بالنظام. يُلتقط الميكروفون بشكل متوازٍ عبر جهاز الإدخال الاعتيادي.

تخيّل مهندسَ باك-إند يُجري مقابلة لمنصب كبير عبر Zoom: تصل أسئلة مدير التوظيف كصوت نظام، وتصل الإجابات الشفهية للمرشح كصوت ميكروفون، وينسخ SubcueAI كل منهما في الوقت الفعلي. ولأن المجريَين يبقيان منفصلَين، تبدو النسخة كمحادثة ذهابٍ وإياب موسومة بدلاً من كتلة واحدة غير متمايزة.

يتم الالتقاط بالكامل على جهازك، والطبقة العائمة التي تعرض النص محلية على سطح مكتبك. يغطي دليل الإعداد القصير خطوات التثبيت.

فصل المتحدثين والكمون والدقة

إبقاء المحاور والمرشح على قناتَين منفصلتَين يتجاوز مجرد ترتيب النص — إذ يتيح للمساعد تحديد أي دور يتصرف بناءً عليه. السؤال الوارد في قناة المحاور هو ما يجب أن يرد عليه اقتراح الإجابة؛ أما قناتك الخاصة فهي سياق، وليست طلباً جديداً.

  • وسم المتحدث ينبثق بشكل طبيعي من التصميم ثنائي المصدر، إذ يكون لكل مجرى مالك معروف.
  • الكمون يعتمد على مسار تحويل الكلام إلى نص؛ فالنسخ المتدفق يعيد نصاً جزئياً بينما لا يزال الشخص يتحدث.
  • الدقة تكون أفضل مع إشارة نظام صوت نظيفة — تساعد سماعة رأس جيدة وغرفة هادئة كلتا القناتين.

للاطلاع على المسار الكامل من الالتقاط إلى الاقتراح، راجع مركز كيف يعمل.

أين لا ينطبق النسخ المزدوج

يفترض النسخ ثنائي الجانب أن الصوت يصل فعلاً إلى أجهزة الإخراج والإدخال في جهازك. لا يغطي كل حالة، ومن الصادق الإقرار بذلك:

  • على جهاز تديره الشركة ولا تتحكم فيه، قد لا تتمكن من تثبيت تطبيق سطح مكتب أصلاً.
  • يمكن أن تفرض البيئات المراقبة وبرامج الرصد عن بُعد قيوداً على تطبيقات الخلفية أو نشاط الشاشة.
  • إذا كانت الجلسة مسجَّلة بالشاشة من الطرف الآخر، فإن ذلك التسجيل مستقل عما يفعله مساعدك محلياً.
  • الجولات الشخصية التي لا يمر فيها الصوت عبر جهازك قط خارج نطاق التقاط صوت النظام.

تم بناء SubcueAI لمقابلاتك عن بُعد الخاصة على جهازك الخاص؛ تُغطَّى حدوده في مركز قابلية الكشف.

الأسئلة الشائعة

هل يُنسخ صوت المحاور أيضاً أم صوتي أنا فقط؟

كلاهما. يُلتقط صوت المحاور كصوت نظام (ما يشغله جهازك) ويُلتقط صوتك كصوت ميكروفون، فتعرض النسخة كلا طرفَي المحادثة.

هل أحتاج إلى بوت اجتماعات أو امتداد متصفح لذلك؟

لا. SubcueAI هو تطبيق سطح مكتب أصيل يلتقط صوت النظام والميكروفون محلياً — لا شيء يتصل بالمكالمة، ولا توجد إضافة متصفح.

هل يستطيع التمييز بين من قال ماذا؟

نعم. لأن المحاور والمرشح يصلان عبر مجريَي صوت منفصلَين، يكون لكل سطر منسوخ مالك معروف مسبقاً، فيكون وسم المتحدث مدمجاً بطبيعته.

هل يعمل هذا مع Zoom و Google Meet و Microsoft Teams؟

نعم. التقاط صوت النظام مستقل عن منصة الاجتماع، لذا يُنسخ صوت المحاور سواء جرت المكالمة عبر Zoom أو Google Meet أو Microsoft Teams.

هل ينسخ كلا الطرفين في مقابلة شخصية؟

لا. يعمل التقاط صوت النظام فقط عندما يمر الصوت عبر جهازك. الجولات الشخصية التي لا تكون فيها في مكالمة خارج النطاق.

أسئلة ذات صلة

← المزيد عن كيف يعمل