مباشر
أين يمكنك متابعتنا

أقسام مهمة

Stories

57 خبر
  • نبض الملاعب
  • العملية العسكرية الروسية في أوكرانيا
  • هدنة وحصار المضيق
  • نبض الملاعب

    نبض الملاعب

  • العملية العسكرية الروسية في أوكرانيا

    العملية العسكرية الروسية في أوكرانيا

  • هدنة وحصار المضيق

    هدنة وحصار المضيق

  • إسرائيل تواصل غاراتها على لبنان

    إسرائيل تواصل غاراتها على لبنان

  • زيارة بوتين إلى الصين

    زيارة بوتين إلى الصين

  • فيديوهات

    فيديوهات

  • بيسكوف: لدينا توقعات جدية جدا بشأن زيارة بوتين إلى الصين

    بيسكوف: لدينا توقعات جدية جدا بشأن زيارة بوتين إلى الصين

  • ليخاتشوف: القوات الأوكرانية شنت عشرات الضربات على محطة زابوروجيه النووية خلال اليوم الأخير

    ليخاتشوف: القوات الأوكرانية شنت عشرات الضربات على محطة زابوروجيه النووية خلال اليوم الأخير

روسيا.. ابتكار أول برنامج وطني لتوليد المحتوى الصوتي بالذكاء الاصطناعي

طوّر باحثو جامعة نوفوسيبيرسك التقنية الروسية أول برنامج وطني لتوليد المحتوى الصوتي بالذكاء الاصطناعي.

روسيا.. ابتكار أول برنامج وطني لتوليد المحتوى الصوتي بالذكاء الاصطناعي
صورة إرشيفية / abc-av.ru

أفاد بذلك  المشرف على المشروع يغور أنتونيانتس في حديث أدلى به لوكالة "تاس" الروسية.

يهدف هذا التطوير إلى المهام التي تتطلب إنتاجا مستقلا للمقطوعات الموسيقية والأجزاء الغنائية والمؤثرات الصوتية بناء على أوصاف نصية دون الارتباط بخدمات سحابية. ووفقا للمطورين، يوفر النظام دورة كاملة لإنتاج المحتوى الصوتي،  بدءا من الطلب النصي ووصولا للتصدير إلى المنصات واسعة الاستخدام WAV و MP3 و FLAC، ويعمل النظام  في نفس الوقت على أجهزة استهلاكية بحجم ذاكرة فيديو أقل من 6 غيغابايت.

وأشار أنتونيانتس إلى أن  "الميزة الرئيسية لتطويرنا هي الاستقلالية الكاملة عن المنصات الأجنبية وإمكانية العمل في بيئة مغلقة. لقد قمنا بضبط النموذج الأساسي باستخدام محولات LoRA المتخصصة لثلاثة أنواع من المحتوى، وهي الموسيقى الآلية، والأغاني المصحوبة بصوت بشري، والمؤثرات الصوتية، مما يتجنب تأثير اختلاط الخصائص ويحقق تطابقا أدق مع الطلب".

وعلى عكس الحلول الأساسية الموجهة للمستخدمين الناطقين بالإنجليزية، فإن الأداة الجديدة مهيأة للعمل مع الاستعلامات الناطقة بالروسية وتُظهر نتائج تنافسية. فقد بلغ متوسط معيار التقييم الذاتي MOS 4.1 من أصل 5 نقاط، وهو ما يُقارن بمعدلات المنصات التجارية الرائدة.

وأوضح مطور المشروع أرتور خوساينوف قائلا: " من ناحية تقنية تتم المعالجة على عدة مراحل: يقوم نموذج لغوي أولا بتشكيل هيكل دلالي للمقطوعة باستخدام سلسلة من التفكير، ثم يقوم المحول الانتشاري (diffusion transformer) بالتركيب الصوتي في الفضاء الكامن، أما وحدة التصدير فتقوم بتحويل المحتوى إلى الصيغ المستهدفة. وتسمح الواجهة الرسومية المدمجة بإدارة المشاريع، وحفظ وتحميل إعدادات التوليد المسبقة، والمعاينة قبل الاستماع، وتصدير المسارات دون الحاجة إلى محررات خارجية".

وأكد مبتكرو البرنامج أنهم يخططون مستقبلا لتوسيع النظام، بما في ذلك إضافة دعم الصوت المكاني لتطبيقات الواقع الافتراضي، وتنفيذ التكامل مع وحدات تحكم MIDI للتفاعل الحي، وتكييف البرنامج للسيناريوهات الصناعية،  بدءا من إنشاء مقاطع صوتية لألعاب الفيديو ووصولا إلى الدبلجة الآلية للأفلام والبث المباشر والبودكاست والإعلانات التجارية.

المصدر: تاس

التعليقات

رد إيراني على تهديدات واشنطن بصورة لترامب وصدام حسين.. ما علاقة الـ"3 أيام"؟

إيران تكشف لأول مرة تفاصيل إصابة مجتبى خامنئي في اليوم الأول من "حرب رمضان"

ترامب يعلن تعليق هجوم مخطط على إيران بناء على طلب قادة خليجيين

مستشار سابق بالدفاع العراقية: واشنطن خدعت بغداد وتحركات إسرائيل في صحراء العراق تمت بغطاء أمريكي

"قوة الفضاء.. زر أحمر وكائن فضائي".. ترامب ينشر صورا بالذكاء الاصطناعي لحرب يخوضها في الفضاء

رضائي لـ RT: صدرت أوامر في حال الهجوم برا على إيران ألا يترك جندي أمريكي على قيد الحياة

"لا ترتكبوا هذا الخطأ الجسيم معه".. ميركل تقدم نصيحة للسياسيين الأوروبيين تخص بوتين

ترامب يشن هجوما جديدا: حتى لو استسلمت إيران بالكامل سيحتفل الإعلام "الفاسد" بانتصارها

"والا" العبري يكشف تفاصيل جديدة عن القاعدتين العسكريتين الإسرائيليتين السريتين في العراق

مقتل قيادي بحركة الجهاد الإسلامي وابنته جراء استهداف شقته جنوبي بعلبك بصاروخ إسرائيلي (فيديو)

الدفاع الروسية: هجوم مكثف على صناعات ومطارات عسكرية في أوكرانيا ومواقع بنية تحتية مرتبطة بجيشها