انضم إلى نشراتنا الإخبارية اليومية والأسبوعية للحصول على آخر التحديثات والمحتوى الحصري حول التغطية الرائدة للذكاء الاصطناعي. يتعلم أكثر
أ تقرير جديد من موفري بيانات الذكاء الاصطناعي أبين يكشف أن الشركات تكافح للعثور على البيانات عالية الجودة اللازمة لتشغيل أنظمة الذكاء الاصطناعي وإدارتها مع توسع الذكاء الاصطناعي في العمليات التجارية.
أبين تقرير حالة الذكاء الاصطناعي 2024والتي استطلعت آراء أكثر من 500 من صناع القرار في مجال تكنولوجيا المعلومات في الولايات المتحدة، كشفت أن اعتماد الذكاء الاصطناعي التوليدي قد زاد بنسبة 17% في العام الماضي؛ ومع ذلك، تواجه المنظمات الآن عقبات كبيرة في إعداد البيانات وضمان الجودة. ويظهر التقرير زيادة بنسبة 10% على أساس سنوي في الاختناقات المتعلقة بمصادر البيانات وتنظيفها ووضع العلامات عليها، مما يسلط الضوء على مدى تعقيد بناء وصيانة نماذج الذكاء الاصطناعي الفعالة.
أوضحت سي تشين، رئيسة الإستراتيجية في Appen، في مقابلة مع VentureBeat: “بينما تعالج نماذج الذكاء الاصطناعي مشكلات أكثر تعقيدًا وتخصصًا، تتغير متطلبات البيانات أيضًا”. “تكتشف الشركات أن مجرد الحصول على الكثير من البيانات لم يعد كافيا. ومن أجل تحسين النموذج، يجب أن تكون البيانات ذات جودة عالية للغاية، مما يعني أنها دقيقة ومتنوعة ومُصنفة بشكل صحيح ومصممة خصيصًا لحالة استخدام الذكاء الاصطناعي المحددة.
وبينما تستمر إمكانات الذكاء الاصطناعي في النمو، يحدد التقرير العديد من المجالات الرئيسية التي تواجه فيها الشركات عقبات. فيما يلي أهم خمس نقاط من تقرير Appen’s State of AI 2024:
1. إن اعتماد الذكاء الاصطناعي التوليدي آخذ في الارتفاع، ولكن التحديات المتعلقة بالبيانات آخذة في الارتفاع أيضًا
من المقرر أن ينمو اعتماد الذكاء الاصطناعي التوليدي (GenAI) بنسبة مذهلة تبلغ 17% في عام 2024، مدفوعًا بالتقدم في نماذج اللغة واسعة النطاق (LLMs) التي تمكن الشركات من أتمتة المهام عبر مجموعة واسعة من حالات الاستخدام. من عمليات تكنولوجيا المعلومات إلى البحث والتطوير، تستخدم الشركات GenAI لتبسيط العمليات الداخلية وزيادة الإنتاجية. ومع ذلك، فإن الارتفاع السريع في استخدام GenAI قد أدى أيضًا إلى ظهور عقبات جديدة، خاصة فيما يتعلق بإدارة البيانات.
قال تشين لـ VentureBeat: “إن مخرجات الذكاء الاصطناعي التوليدي أكثر تنوعًا، ولا يمكن التنبؤ بها، وذاتية، مما يجعل من الصعب تحديد النجاح وقياسه”. “لتحقيق الذكاء الاصطناعي الجاهز للمؤسسات، يجب تصميم النماذج خصيصًا لبيانات عالية الجودة مصممة خصيصًا لحالات استخدام محددة.”
لقد برز جمع البيانات المخصصة كطريقة أساسية لجمع بيانات التدريب لنماذج GenAI، مما يعكس تحولًا أوسع بعيدًا عن البيانات العامة من الإنترنت لصالح مجموعات البيانات المخصصة والموثوقة.
2. إن نشر الذكاء الاصطناعي المؤسسي وعائد الاستثمار آخذ في الانخفاض
على الرغم من الإثارة المحيطة بالذكاء الاصطناعي، كشف التقرير عن اتجاه مثير للقلق: عدد أقل من مشاريع الذكاء الاصطناعي التي تصل إلى التنفيذ، وتلك التي تحقق عائد استثمار أقل. اعتبارًا من عام 2021، انخفض متوسط النسبة المئوية لمشاريع الذكاء الاصطناعي التي وصلت إلى التنفيذ بنسبة 8.1%، في حين انخفض متوسط النسبة المئوية لمشاريع الذكاء الاصطناعي المنفذة التي تظهر عائدًا كبيرًا على الاستثمار بنسبة 9.4%.
ويرجع هذا الانخفاض بشكل أساسي إلى التعقيد المتزايد لنماذج الذكاء الاصطناعي. تعتبر حالات الاستخدام البسيطة مثل التعرف على الصور وأتمتة الكلام الآن تقنيات ناضجة، لكن الشركات تتجه نحو مبادرات الذكاء الاصطناعي الأكثر طموحًا، مثل الذكاء الاصطناعي التوليدي، والتي تتطلب بيانات مخصصة وعالية الجودة ويصعب تنفيذها بنجاح.
وأوضح تشين أن “الذكاء الاصطناعي التوليدي يتمتع بقدرات أكثر تقدمًا في الفهم والاستدلال وإنشاء المحتوى، ولكن تنفيذ هذه التقنيات بطبيعتها أكثر صعوبة”.
3. جودة البيانات أمر ضروري – ولكنها في تراجع
يسلط التقرير الضوء على قضية بالغة الأهمية لتطوير الذكاء الاصطناعي: انخفضت دقة البيانات بنسبة 9٪ تقريبًا منذ عام 2021. ومع تطور نماذج الذكاء الاصطناعي، أصبحت البيانات التي تحتاجها أيضًا أكثر تعقيدًا، وغالبًا ما تتطلب شروحًا متخصصة وعالية الجودة. .
وتقوم الآن نسبة مذهلة تبلغ 86% من الشركات بإعادة تدريب نماذجها أو تحديثها كل ثلاثة أشهر على الأقل، مما يسلط الضوء على الحاجة إلى بيانات جديدة ذات صلة. ومع ذلك، مع زيادة وتيرة التحديثات، يصبح ضمان دقة هذه البيانات وتنوعها أمرًا صعبًا بشكل متزايد. وتلجأ الشركات إلى موفري البيانات الخارجيين لتلبية هذه المطالب، حيث يعتمد ما يقرب من 90% من الشركات على مصادر خارجية لتدريب نماذجها وتقييمها.
وقال تشين: “على الرغم من أننا لا نستطيع التنبؤ بالمستقبل، إلا أن أبحاثنا تظهر أن إدارة جودة البيانات ستظل تمثل تحديًا كبيرًا للشركات”. “مع وجود نماذج الذكاء الاصطناعي التوليدية الأكثر تعقيدًا، أصبح تحديد مصادر البيانات وتنظيفها ووضع العلامات عليها بمثابة اختناقات رئيسية.”
4. اختناقات البيانات تزداد سوءًا
يكشف تقرير Appen عن زيادة بنسبة 10% على أساس سنوي في مصادر البيانات وتنقيتها ووضع علامات على الاختناقات. تؤثر هذه الاختناقات بشكل مباشر على قدرة الشركات على تنفيذ مشاريع الذكاء الاصطناعي بنجاح. ومع ازدياد تخصص حالات استخدام الذكاء الاصطناعي، يصبح التحدي المتمثل في إعداد البيانات الصحيحة أكثر حدة.
وقال تشين: “لقد تفاقمت مشاكل إعداد البيانات”. “إن الطبيعة المتخصصة لهذه النماذج تتطلب مجموعات بيانات جديدة ومصممة خصيصًا.”
ولمعالجة هذه المشكلات، تركز الشركات على الاستراتيجيات طويلة المدى التي تؤكد على دقة البيانات واتساقها وتنوعها. يسعى الكثيرون أيضًا إلى إقامة شراكات استراتيجية مع موفري البيانات للمساعدة في التغلب على تعقيدات دورة حياة بيانات الذكاء الاصطناعي.
5. أصبح الرجل الموجود في الحلقة أكثر أهمية من أي وقت مضى
بينما تستمر تكنولوجيا الذكاء الاصطناعي في التطور، تظل المشاركة البشرية ضرورية. ووجد التقرير أن 80% من المشاركين أكدوا على أهمية التعلم الآلي البشري، وهي عملية يتم فيها استخدام الخبرة البشرية لتوجيه نماذج الذكاء الاصطناعي وتحسينها.
وقال تشين: “تظل المشاركة البشرية حاسمة لتطوير أنظمة الذكاء الاصطناعي عالية الأداء والأخلاقية وذات الصلة بالسياق”.
يحظى الخبراء البشريون بأهمية خاصة لضمان تخفيف التحيز وتطوير الذكاء الاصطناعي الأخلاقي. ومن خلال توفير المعرفة الخاصة بالمجال وتحديد التحيزات المحتملة في مخرجات الذكاء الاصطناعي، فإنهم يساعدون في تحسين النماذج ومواءمتها مع السلوك والقيم في العالم الحقيقي. وهذا أمر بالغ الأهمية بشكل خاص للذكاء الاصطناعي التوليدي، حيث يمكن أن تكون النتائج غير متوقعة وتتطلب مراقبة دقيقة لمنع النتائج الضارة أو المتحيزة.
انظر Appen ممتلئ تقرير حالة الذكاء الاصطناعي 2024 هنا.