كشفت شركة ميتا عن مشروع AudioCraft الذي يضم مجموعة من أدوات الذكاء الاصطناعي التوليدي التي تساعد في إنشاء المقاطع الصوتية والموسيقية استنادًا إلى الأوامر النصية.
ويمكن لصنّاع المحتوى استخدام الأدوات عبر إدخال أوصاف نصية بسيطة لإنشاء مقاطع صوتية معقدة، أو تأليف الألحان، أو حتى محاكاة فرق موسيقية افتراضية كاملة.
وقالت ميتا في بيانٍ لها عبر موقعها الرسمي إن أدوات AudioCraft يمكنها أن تساعد الموسيقيين المحترفين في استكشاف تراكيب جديدة دون الحاجة إلى العزف على آلة موسيقية، كما ستساعد مطوري الألعاب في إدخال تأثيرات صوتية واقعية وضوضاء محيطة في الألعاب، كما تفيد أصحاب الأعمال الصغيرة في إضافة تأثيرات صوتية إلى مقاطع الفيديو التي يشاركونها مع الجمهور.
وأفادت شركة ميتا بأن مشروع AudioCraft يتكون من ثلاثة أجزاء رئيسية: AudioGen وهي أداة توليد التأثيرات والمشاهد الصوتية، و MusicGen وهي أداة توليد المؤلفات الموسيقية والألحان، وأداة فك الترميز EnCodec التي تساعد في توليد المخرجات الصوتية بجودة عالية وأقل قدر من الأخطاء والنشاز.
يذكر أن نماذج الذكاء الاصطناعي الجديدة من ميتا مفتوحة المصدر ومتاحة للباحثين والمتخصصين لفهمها واستخدامها وتطويرها، مع إمكانية إنشاء نماذج مخصصة باستخدام البيانات الخاصة بهم.
وتسعى ميتا عبر أدواتها الجديدة إلى تسريع وتيرة تطوير الذكاء الاصطناعي في مجال الصوتيات الذي لا يزال متأخرًا مقارنةً بتقنيات الذكاء الاصطناعي التوليدي للنصوص والصور.
وكانت شركات أخرى قد سبقت ميتا في إتاحة أدوات الذكاء الاصطناعي لتوليد الأصوات والموسيقى، ومنها شركة OpenAI التي أعلنت عن مشروع Jukebox عام 2020، وشركة جوجل التي أعلنت في وقتٍ سابق من العام الجاري عن مشروع MusicLM.