طور باحثون من شركة مايكروسوفت نظام يعترف خطاب بأكبر قدر ناسخة البشرية المهنية.

وقد وضعت الباحثين والمهندسين من مجموعة الذكاء الاصطناعي والبحوث مايكروسوفت رقما قياسيا جديدا في التعرف على الكلام، وتحقيق نسبة الخطأ كلمة من 5.9 في المئة انخفاضا من 6.3 في المئة ذكرت قبل شهر.

نسبة الخطأ كلمة هو النسبة المئوية من مرة في محادثة هذا النظام، في هذه الحالة مجموعة من الشبكات العصبية، mishears كلمات مختلفة. تنفيذ نظام مايكروسوفت وكذلك البشر الذين طلب منهم الاستماع إلى نفس المحادثات.

الحجم مايكروسوفت بآلياته ضد النساخ المحترفين الذين كلفوا الاستماع إلى بيانات التقييم نفسها عبر الهاتف، والتي شملت بيانات محادثة في اتجاهين ومجموعة منفصلة حيث الأهل والأصدقاء إجراء محادثات مفتوحة.

سجل البشر والنظم الآلية مايكروسوفت 5.9 في المئة و 11.3 في المئة معدلات الخطأ، لبيانات الاختبار منها.
الدرجات هي شخصية مظلة لنتائج ثلاثة اختبارات، مقارنة عدد المرات نظام مايكروسوفت والناسخين الإنسان استبدال خطأ الأصوات، إسقاط كلمة من الجملة، وأو إدخال كلمة خاطئة.

كما يلاحظ مايكروسوفت في ورقة، والبشر والنظام الآلي تخبطت في الغالب على نفس الأصوات في الاختبارات، باستثناء "هاه" و "اه".

كان الخلط بين نظام مايكروسوفت من الأصوات "هاه"، التي يمكن أن تكون موافقة لفظية لشخص ما أن تمضي قدما التحدث و"اه"، كما تستخدم تردد في الكلام. الكلام الصوت نفسها ولكن لها معان المعاكس، الذي كان البشر مشاكل أقل بكثير من تحديد من مايكروسوفت.


زيادة الإنتاجية مع البساطة البنية التحتية والخوادم HPE بروليانت Gen9
تعقيد تكنولوجيا المعلومات يؤدي إلى إهدار الجهد والوقت، أو حساب. رفع الإنتاجية مع خوادم شركة هيوليت باكارد المؤسسة بروليانت Gen9 للشركات الصغيرة ومتوسطة الحجم لتبسيط البنية التحتية الخاصة بك، مما يؤدي إلى تحسين الأداء وتطويره مع إدارة أسهل. مشاهدة هذا الفيديو القصير لمعرفة المزيد.
أشرطة الفيديو المقدمة من شركة هيوليت باكارد المشاريع و...
وtranscriptionists، لسبب ما، وكثيرا ما انخفض الرسالة "أنا" من المحادثات في اتجاهين، وفعل حتى الآن في كثير من الأحيان من مايكروسوفت لمنظمة العفو الدولية.

وعموما، يلاحظ مايكروسوفت، وكان البشر انخفاض معدل الاستبدال، وارتفاع معدل الحذف، بينما تنتج كل من البشر والآلة عدد قليل من الإدراج.

"إن معدل الحذف أعلى نسبيا قد يعكس انحياز البشري لتجنب إخراج معلومات غير مؤكدة، أو مطالب الإنتاجية على الناسخ المهنية،" يخمن مايكروسوفت.

وقال Xuedong هوانغ، كبير العلماء خطاب مايكروسوفت لا تزال، لتحقيق التكافؤ مع الإنسان في هذا الاختبار كان "الإنجاز التاريخي".

تحسين أنظمة التعرف على الكلام الآلي يمكن أن تستخدم في خدمات النسخ الكلام إلى نص وتعزيز تجهيزات للمعاقين Cortana، وأقول، للصم. ومع ذلك، هذا الاحتمال يبدو أنه لا يزال بعيدا بعض الشيء.

استخدام Microsoft 2000 ساعة من بيانات التدريب لتجهيز شبكاتها العصبية للقيام بهذه المهمة. وتدعي أنه من خلال parallelizing البيانات مع أدوات منظمة العفو الدولية الحاسوبية الشبكة على تكتل متعددة GPU لينكس على أساس، وكان قادرا على خفض أوقات التدريب من أشهر إلى أقل من ثلاثة أسابيع.

وعلى الرغم من معلم، ويعترف مايكروسوفت انها لا تزال بعيدة عن تحقيق التعرف على الكلام الذي يعمل بشكل جيد في ظروف الحياة الحقيقية مع الكثير من الضوضاء في الخلفية.

على سبيل المثال، كخدمة النسخ حية انها ليست من الممكن بعد تحديد وتعيين أسماء للمتكلمين متعددة قد يكون لديهم لهجات مختلفة والأعمار والخلفيات. ومع ذلك، وتقول الشركة انها تعمل على التكنولوجيا، والتي يمكن أن تفتح مجموعة كاملة من الاحتمالات.

موضوع حصري من ويب تايم.

مايكروسوفت انطلاقة جديدة : منظمة العفو الدولية هذا امر جيد مثل البشر في الاستماع ... على الهاتف

مايكروسوفت انطلاقة جديدة : منظمة العفو الدولية هذا امر جيد مثل البشر في الاستماع ... على الهاتف

ليست هناك تعليقات:

جميع الحقوق محفوظة ويب تايم | موقع يهتم بكل ما هو جديد فى عالم التقنية

| تصميم : الروسافي عمر