الدكاء AI

يمكن للذكاء الاصطناعي الخاص بـ ByteDance أن يجعل صورك تمثل مشاهد الفيلم – ولكن هل هذا حقيقي جدًا؟


انضم إلى نشراتنا الإخبارية اليومية والأسبوعية للحصول على آخر التحديثات والمحتوى الحصري حول تغطية الذكاء الاصطناعي الرائدة. يتعلم أكثر


بايت دانس لقد قدمت نظام ذكاء اصطناعي يمكنه تحويل أي صورة إلى أداء فيديو مقنع، مكتمل بالتعبيرات الدقيقة والعمق العاطفي الذي يمكن أن ينافس اللقطات الحقيقية. صممت شركة التكنولوجيا الصينية العملاقة المعروفة بـ TikTok، “صورة X 2“نظام لإنشاء صور كنسخ طبق الأصل من مشاهد من أفلام مشهورة – مع نتائج واقعية للغاية لدرجة أنها تطمس الخط الفاصل بين المحتوى الأصلي والمصطنع.

نظامي المظاهرات لقطات مميزة لمشاهد مميزة من أفلام مثل “The Shining” و”Face Off” و”Fences”، تلتقط كل تعبير دقيق من العروض الأصلية. يمكن الآن لصورة واحدة أن تصور الخوف أو الغضب أو الفرح بنفس التفاصيل المقنعة التي يجسدها ممثل مدرب، مع الاحتفاظ بهوية وخصائص الشخص الأصلي.

ويأتي هذا الاختراق في وقت حاسم. بينما يتصارع المجتمع مع المعلومات الرقمية الخاطئة وتداعيات الانتخابات الرئاسية الأمريكية، فإن قدرة X-Portrait 2 على إنشاء مقاطع فيديو لا يمكن تمييزها عن الواقع من أي صورة تثير مخاوف جدية. أنتجت أدوات الرسوم المتحركة السابقة للذكاء الاصطناعي نتائج مصطنعة بشكل واضح باستخدام حركات ميكانيكية. لكن نظام ByteDance الجديد يلتقط التدفق الطبيعي لعضلات الوجه، وحركات العين الدقيقة والتعبيرات المعقدة التي تجعل الوجوه البشرية معبرة بشكل فريد.

حققت ByteDance هذه الواقعية من خلال نهج مبتكر. بدلاً من تتبع نقاط محددة على الوجه – وهي الطريقة القياسية التي تستخدمها معظم برامج الرسوم المتحركة – يقوم النظام بمراقبة حركات الوجه الكاملة والتعلم منها. بينما كانت الأنظمة القديمة تنشئ تعبيرات من خلال ربط النقاط، يلتقط X-Portrait 2 الحركة السلسة للوجه بالكامل، حتى أثناء الكلام السريع أو عند النظر إليه من زوايا مختلفة.

يُظهر X-Portrait 2 تنوعه في الأنماط المرئية المختلفة. يمكن تحويل صورة القيادة (أعلى اليسار) لتتناسب مع تعبير شخص آخر (أعلى اليمين)، في حين يمكن للتقنية نفسها إنشاء رسوم توضيحية بنمط الرسوم المتحركة (أسفل اليسار) وصور مصورة (أسفل اليمين)، مع الحفاظ على تعبيرات الوجه المتسقة. (الائتمان: بايت دانس)

قاعدة بيانات TikTok التي تضم مليار مستخدم: السر وراء اختراق ByteDance للذكاء الاصطناعي

تنبع ميزة ByteDance من موقع الملكية الفريد الذي تتمتع به تيك توكالذي يعالج أكثر من مليار مقطع فيديو ينشئه المستخدم يوميًا. توفر هذه المجموعة الواسعة من تعبيرات الوجه والحركات والعواطف بيانات تدريبية على نطاق لا يمكن لمعظم شركات الذكاء الاصطناعي الوصول إليه. وبينما يعتمد المنافسون على مجموعات بيانات محدودة أو بيانات تركيبية، يمكن لشركة ByteDance تحسين نماذج الذكاء الاصطناعي الخاصة بها باستخدام تعبيرات العالم الحقيقي الملتقطة على وجوه مختلفة وظروف الإضاءة وزوايا الكاميرا.

تحرير صورة X 2 يتزامن مع توسع ByteDance في أبحاث الذكاء الاصطناعي خارج الصين. تأسست الشركة مراكز بحثية جديدة في أوروبا، مع مواقع محتملة في سويسرا وبريطانيا العظمى وفرنسا. ومخطط لها مركز للذكاء الاصطناعي بقيمة 2.13 مليار دولار في ماليزيا وبالتعاون مع جامعة تسينغهوا يقترحان استراتيجية لبناء خبرات الذكاء الاصطناعي عبر قارات متعددة.

تأتي هذه الدفعة البحثية العالمية في وقت حرج. بينما تواجه ByteDance تدقيقًا تنظيميًا في الأسواق الغربية – بما في ذلك طلب كندا الأخير لشراء TikTok توقف عن العمل وفي التقدم المناقشات الأمريكية حول القيود – تواصل الشركة تحسين قدراتها التقنية.

ثورة هوليوود القادمة: كيف يمكن للذكاء الاصطناعي أن يحل محل التقاط الحركة بملايين الدولارات

تمتد الآثار المترتبة على صناعة الرسوم المتحركة إلى ما هو أبعد من التقدم التقني. تخصص حاليا في الدراسات أنفق الملايين على معدات التقاط الحركة وتوظيف المئات من رسامي الرسوم المتحركة لإنشاء تعبيرات وجه واقعية. يقترح X-Portrait 2 مستقبلًا حيث يمكن لمصور واحد وفيديو مرجعي أن يحل محل الكثير من هذه البنية التحتية.

وتأتي هذه الخطوة وسط جدل متزايد حول المحتوى الناتج عن الذكاء الاصطناعي والحقوق الرقمية. بينما سارع المنافسون إلى إطلاق الكود الخاص بهم علنًا، أبقت ByteDance على تنفيذ X-Portrait 2 معلقًا خاص – قرار يعكس الوعي المتزايد بكيفية إساءة استخدام أدوات الذكاء الاصطناعي لإنشاء أداء غير مصرح به أو محتوى مضلل.

يمثل تركيز ByteDance على الحركة البشرية والتعبير مسارًا متميزًا عن شركات الذكاء الاصطناعي الأخرى. في حين تركز شركات مثل OpenAI وAnthropic على معالجة اللغة، فإن ByteDance تعتمد على قوتها الأساسية: فهم كيفية تحرك الأشخاص والتعبير عن أنفسهم أمام الكاميرا. ينبع هذا التخصص مباشرة من سنوات TikTok في تحليل اتجاهات الرقص وتعبيرات الوجه.

قد يكون هذا التركيز على الحركة البشرية أكثر أهمية مما يقترحه تحليل السوق الحالي. مع انتقال العمل والتواصل الاجتماعي بشكل متزايد إلى المساحات الافتراضية، أصبحت التكنولوجيا التي تلتقط المشاعر الإنسانية وتنقلها بدقة أمرًا بالغ الأهمية. التقدم الذي أحرزته ByteDance يضعها في مكانة يمكنها من التأثير على كيفية تفاعل الأشخاص في البيئة الرقمية، بدءًا من اجتماعات العمل وحتى الترفيه.

مشكلات أمان الذكاء الاصطناعي: عندما تحتاج الوجوه الرقمية إلى أقفال رقمية

طرد ByteDance في أكتوبر للمتدربين بسبب ما يُزعم تعطيل التدريب على نموذج الذكاء الاصطناعي وشدد على جانب غالبًا ما يتم تجاهله في تطوير الذكاء الاصطناعي: الأمن الداخلي. ومع تطور النماذج، تصبح حمايتها من الوصول غير المصرح به أكثر أهمية.

تصل هذه التكنولوجيا مع تزايد الطلب على محتوى الفيديو الناتج عن الذكاء الاصطناعي في مجالات الترفيه والتعليم والاتصالات التجارية. في حين يُظهر X-Portrait 2 تقدمًا تقنيًا كبيرًا في الحفاظ على هوية متسقة مع نقل التعبيرات الدقيقة، فإنه يثير أيضًا تساؤلات حول المصادقة والتحقق من المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي.

وبينما تدقق الحكومات الغربية في شركات التكنولوجيا الصينية، فإن التقدم الذي أحرزته بايت دانس في الرسوم المتحركة التي تعتمد على الذكاء الاصطناعي يمثل حقيقة معقدة: فالابتكار لا يعرف حدودا، وقد يتشكل مستقبل كيفية تواصلنا عبر الإنترنت من خلال التقنيات التي تم تطويرها بعيدا عن وادي السليكون.


مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى