تقنيات متفرقة

مساعد جوجل الصوتي سيقدم صوت طبيعي أكثر بنظام WaveNet

مساعد جوجل الصوتي سيبدو طبيعي أكثر بفضل نظام لتحويل النص إلى كلام مسموع يُدعى WaveNet، والذي أنشأه فرع DeepMind في جوجل.

ويختلف نظام WaveNet عن تقنية Concatenative TTS التقليدية، والتي تستخدم قاعدة كبيرة من العبارات المُسجلة مُسبقًا بصوت واحد، وتقنية Parametric TTS التي تستخدم صوت يُنتجه الحاسب لخلق موجات فردية باستخدام 16000 عينة في الثانية.

WaveNet

أما نظام WaveNet فيستخدم مجموعة كبيرة من عينات الكلام، وتم تدريبه لأكثر من 12 شهرا للتعرف على النغمات التي تتبع بعضها البعض وما هي أشكال موجات التحدث الواقعية.

هناك الكثير من التفاصيل الفنية في هذا النظام، والذي سيتم استخدامه في الوقت الحالي مع اللغة الإنجليزية الأمريكية واللغة اليابانية؛ لكن في الأغلب فأن جوجل ستقوم بجعل اللغات الأخرى طبيعية أكثر مع الوقت.

وقد استغرق فريق DeepMind مدة 12 شهر لصنع نظام WaveNet، وتخصيصه ليعمل بسرعة كافية على نطاق واسع.

المصدر

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

إغلاق