انضم إلى نشراتنا الإخبارية اليومية والأسبوعية للحصول على آخر التحديثات والمحتوى الحصري حول التغطية الرائدة للذكاء الاصطناعي. يتعلم أكثر
جلب إدخال ChatGPT نماذج لغوية واسعة النطاق (LLM) إلى الاستخدام على نطاق واسع في كل من الصناعات التكنولوجية وغير التكنولوجية. تعود هذه الشعبية في المقام الأول إلى عاملين:
- LLM كمستودع للمعرفة: يتم تدريب LLMs على كمية هائلة من بيانات الإنترنت ويتم تحديثها على فترات منتظمة (مثل GPT-3، GPT-3.5، GPT-4، GPT-4o وغيرها)؛
- القدرات الناشئة: مع نمو ماجستير إدارة الأعمال، تظهر أيضًا القدرات غير موجود في نماذج أصغر.
فهل هذا يعني أننا وصلنا بالفعل إلى مستوى الذكاء البشري، وهو ما نسميه الذكاء العام الاصطناعي (AGI)؟ يحدد جارتنر الذكاء الاصطناعي العام (AGI) هو شكل من أشكال الذكاء الاصطناعي الذي يمتلك القدرة على فهم المعرفة وتعلمها وتطبيقها في مجموعة واسعة من المهام والمجالات. إن الطريق إلى الذكاء الاصطناعي العام طويل، وإحدى العقبات الرئيسية هي الطبيعة التراجعية التلقائية للتدريب على ماجستير إدارة الأعمال، والتي تتنبأ بالكلمات بناءً على تسلسلات سابقة. باعتباره أحد رواد أبحاث الذكاء الاصطناعي، يان ليكون يشير إلى أن LLM يمكن أن يؤدي ذلك إلى الابتعاد عن الإجابات الصحيحة بسبب طبيعتها التراجعية التلقائية. وبناء على ذلك، فإن LLMs لديها عدة قيود:
- معرفة محدودة: على الرغم من تدريبهم على البيانات الضخمة، إلا أن الحاصلين على ماجستير إدارة الأعمال يفتقرون إلى المعرفة الحديثة بالعالم.
- المنطق المحدود: تتمتع LLMs بقدرة تفكير محدودة. كما يشير سوباراو كامبهامباتي LLMs هم مستردون جيدون للمعرفة، ولكن فهي ليست مرنانات جيدة.
- لا توجد ديناميكية: LLMs ثابتة ولا يمكنها الوصول إلى المعلومات في الوقت الفعلي.
للتغلب على تحديات LLM، هناك حاجة إلى نهج أكثر تقدما. هذا هو المكان الذي يصبح فيه الوكلاء أساسيين.
وكلاء للإنقاذ
مفهوم وكيل ذكي في منظمة العفو الدولية تطورت على مدى عقدين من الزمن، وتغيرت التطبيقات مع مرور الوقت. اليوم، تتم مناقشة الوكلاء في سياق LLM. ببساطة، الوكيل يشبه سكين الجيش السويسري في مواجهة تحديات LLM: فهو يمكن أن يساعدنا على التفكير، ويوفر وسيلة للحصول على معلومات محدثة من الإنترنت (حل مشكلة الديناميكيات مع LLM)، ويمكنه إنجاز المهمة بشكل مستقل. مع LLM باعتباره العمود الفقري، يتضمن الوكيل رسميًا الأدوات والذاكرة والتفكير (أو التخطيط) ومكونات الإجراء.
مكونات وكلاء الذكاء الاصطناعي
- تسمح الأدوات للوكلاء بالوصول إلى المعلومات الخارجية — سواء من الإنترنت أو قواعد البيانات أو واجهات برمجة التطبيقات — مما يسمح لهم بجمع البيانات التي يحتاجون إليها.
- يمكن أن تكون الذاكرة قصيرة المدى أو طويلة المدى. يستخدم الوكلاء ذاكرة المسودة لتخزين النتائج مؤقتًا من مصادر مختلفة، بينما يعد سجل الدردشة مثالاً على الذاكرة طويلة المدى.
- يمكّن Reasoner الوكلاء من التفكير بشكل منهجي، وتقسيم المهام المعقدة إلى مهام فرعية يمكن التحكم فيها من أجل المعالجة الفعالة.
- الإجراءات: يقوم الوكلاء بتنفيذ إجراءات بناءً على بيئتهم ومنطقهم، والتكيف وحل المهام بشكل متكرر من خلال التعليقات. ReAct هي إحدى الطرق الشائعة لتنفيذ الاستدلال والإجراء بشكل متكرر.
ما الذي يجيده الوكلاء؟
يتفوق الوكلاء في المهام المعقدة، خاصة عندما يكونون متاحين لعب الأدوار الوضع، باستخدام الأداء المحسن لـ LLMs. على سبيل المثال، عند كتابة مدونة، قد يركز أحد الوكلاء على البحث بينما ينخرط وكيل آخر في الكتابة – كل منهم يشارك في عمل ما هدف فرعي محدد. يتم تطبيق هذا النهج متعدد الوكلاء على عدد من مشكلات الحياة الواقعية.
يساعد لعب الأدوار الوكلاء على الاستمرار في التركيز على مهام محددة من أجل تحقيق أهداف أكبر، مما يقلل من الهلوسة بشكل واضح تحديد الأجزاء الإشارات – مثل الدور والتعليمات والسياق. وبما أن أداء LLM يعتمد على تعليمات جيدة التنظيم، فإن أطر العمل المختلفة تضفي الطابع الرسمي على هذه العملية. أحد هذه الأطر، CrewAI، يوفر نهجًا منظمًا لتحديد لعب الأدوار، وهو ما سنناقشه بعد ذلك.
وكلاء متعددون ضد وكيل واحد
لنأخذ مثال إنشاء التنزيل المعزز (RAG) باستخدام وكيل واحد. إنها طريقة فعالة لتمكين LLMs من التعامل مع الاستعلامات الخاصة بالمجال باستخدام المعلومات من المستندات المفهرسة. ومع ذلك، وكيل واحد RAG يأتي مع حدودهمثل أداء التنزيل أو تصنيف المستندات. يتغلب RAG متعدد الوكلاء على هذه القيود باستخدام وكلاء متخصصين لفهم المستندات واسترجاعها وتصنيفها.
في سيناريو متعدد الوكلاء، يتعاون الوكلاء بطرق مختلفة، على غرار أنماط الحوسبة الموزعة: مجموعات الرسائل المتسلسلة أو المركزية أو اللامركزية أو المشتركة. تعمل أطر العمل مثل CrewAI وAutogen وlangGraph+langChain على تمكين حل المشكلات المعقدة باستخدام أساليب متعددة الوكلاء. في هذه المقالة، استخدمت CrewAI كإطار مرجعي لاستكشاف إدارة سير العمل المستقلة.
إدارة سير العمل: حالة استخدام للأنظمة متعددة الوكلاء
تدور معظم العمليات الصناعية حول إدارة سير العمل، سواء كان ذلك معالجة الائتمان، أو إدارة الحملات التسويقية، أو حتى DevOps. ولا بد من خطوات، سواء كانت متتابعة أو دورية، لتحقيق هدف محدد. في النهج التقليدي، تتطلب كل خطوة (على سبيل المثال، التحقق من طلب القرض) من الإنسان أداء المهمة الشاقة والعادية المتمثلة في معالجة كل طلب يدويًا والتحقق منه قبل الانتقال إلى الخطوة التالية.
تتطلب كل خطوة مدخلات من الخبراء في هذا المجال. في الإعداد متعدد الوكلاء باستخدام CrewAI، تتم إدارة كل خطوة بواسطة طاقم متعدد الوكلاء. على سبيل المثال، عند التحقق من طلب القرض، قد يتحقق وكيل واحد من هوية العميل عن طريق التحقق من خلفية المستندات مثل رخصة القيادة، بينما يتحقق وكيل آخر من التفاصيل المالية للعميل.
وهذا يطرح السؤال التالي: هل يمكن لطاقم واحد (مع عدة وكلاء في صف واحد أو في تسلسل هرمي) إدارة جميع خطوات معالجة القروض؟ على الرغم من أنه ممكن، إلا أن هذا يعقد الطاقم، ويتطلب ذاكرة مؤقتة واسعة النطاق، ويزيد من خطر الابتعاد عن الهدف والهلوسة. يتمثل النهج الأكثر كفاءة في التعامل مع كل خطوة من خطوات معالجة القرض كطاقم منفصل، وعرض سير العمل بأكمله كرسم بياني لعقد الطاقم (باستخدام أدوات مثل langGraph) التي تعمل بشكل تسلسلي أو دوري.
نظرًا لأن ماجستير إدارة الأعمال لا يزال في المراحل الأولى من الذكاء، فإن إدارة سير العمل الكاملة لا يمكن أن تكون مستقلة تمامًا. مطلوب وجود إنسان في الحلقة في المراحل الرئيسية للتحقق من المستخدم النهائي. على سبيل المثال، بعد أن يكمل الطاقم خطوة التحقق من طلب القرض، يكون الإشراف البشري ضروريًا لتأكيد النتائج. وبمرور الوقت، ومع تزايد الثقة في الذكاء الاصطناعي، قد تصبح بعض الخطوات مستقلة بشكل كامل. حاليًا، تعمل إدارة سير العمل القائمة على الذكاء الاصطناعي في دور داعم، مما يبسط المهام الشاقة ويقلل وقت المعالجة الإجمالي.
تحديات الإنتاج
يمكن أن يمثل تقديم حل متعدد الوكلاء للإنتاج العديد من التحديات.
- النطاق: مع تزايد عدد الوكلاء، يصبح التعاون والإدارة أمرًا صعبًا. توفر الأطر المختلفة حلولاً قابلة للتطوير – على سبيل المثال، يتولى Llamindex مسؤولية سير العمل القائم على الأحداث لإدارة وكلاء متعددة على نطاق واسع.
- زمن الاستجابة: غالبًا ما يتسبب أداء الوكيل في زمن الاستجابة لأنه يتم تنفيذ المهام بشكل متكرر، مما يتطلب مكالمات LLM متعددة. تعد برامج LLM المُدارة (مثل GPT-4o) بطيئة بسبب جدران الحماية الضمنية وزمن وصول الشبكة. تعتبر LLMs المستضافة ذاتيًا (مع التحكم في GPU) مفيدة في حل مشكلات زمن الوصول.
- مشكلات الأداء والهلوسة: نظرًا للطبيعة الاحتمالية لـ LLM، قد يختلف أداء الوكيل مع كل عملية تنفيذ. يمكن أن تساعد تقنيات مثل إخراج النماذج (على سبيل المثال، تنسيق JSON) وتقديم الكثير من الأمثلة في الاستعلامات في تقليل تباين الاستجابة. يمكن تقليل مشكلة الهلوسة بشكل أكبر من خلال وكلاء التدريب.
الأفكار النهائية
مثل يشير أندرو نجالوكلاء هم مستقبل الذكاء الاصطناعي وسيستمرون في التطور جنبًا إلى جنب مع LLM. سوف تتقدم الأنظمة متعددة الوكلاء في معالجة البيانات متعددة الوسائط (النصوص والصور والفيديو والصوت) وحل المهام المتزايدة التعقيد. في حين أن الذكاء الاصطناعي العام والأنظمة المستقلة بالكامل لا تزال في الأفق، فإن الوكلاء المتعددين سوف يقومون بسد الفجوة الحالية بين LLM وAGI.
ابهيشيك غوبتا هو كبير علماء البيانات برنامج تالينتيكا.
صانعو قرارات البيانات
مرحبًا بك في مجتمع VentureBeat!
يعد DataDecisionMakers مكانًا يستطيع فيه الخبراء، بما في ذلك الأشخاص المعنيون بالبيانات التقنية، مشاركة رؤى البيانات والابتكارات.
إذا كنت تريد أن تقرأ عن أحدث الأفكار والمعلومات وأفضل الممارسات ومستقبل البيانات وتكنولوجيا البيانات، انضم إلينا في DataDecisionMakers.
قد تفكر أيضًا في المساهمة بمقالك الخاص!
اقرأ المزيد من DataDecisionMakers