الدكاء AI

صغيرة ولكنها قوية: تتحدى نماذج الذكاء الاصطناعي الجديدة من H2O.ai عمالقة التكنولوجيا في تحليل المستندات


انضم إلى نشراتنا الإخبارية اليومية والأسبوعية للحصول على آخر التحديثات والمحتوى الحصري حول تغطية الذكاء الاصطناعي الرائدة. يتعلم أكثر


H2O.aiأعلنت اليوم الشركة الرائدة في مجال توفير منصات الذكاء الاصطناعي مفتوحة المصدر، عن نموذجين جديدين للغة الرؤية مصممين لتحسين مهام تحليل المستندات والتعرف البصري على الأحرف (OCR).

نماذج، مسماة H2OVL ميسيسيبي-2B و H2OVL-ميسيسيبي-0.8بإظهار أداء تنافسي مقارنة بالنماذج الأكبر بكثير من شركات التكنولوجيا الكبيرة، مما قد يوفر حلاً أكثر كفاءة للشركات التي تتعامل مع سير عمل كثيف المستندات.

ديفيد ضد جالوت: كيف تتفوق نماذج H2O.ai الصغيرة على عمالقة التكنولوجيا

لقد تفوق نموذج H2OVL Mississippi-0.8B، الذي يحتوي على 800 مليون معلمة فقط، على جميع النماذج الأخرى، بما في ذلك تلك التي تحتوي على مليارات المعلمات الإضافية، على التعرف على النص OCRBench مهمة. وفي الوقت نفسه، أظهر نموذج H2OVL Mississippi-2B الذي يحتوي على 2 مليار معلمة أداءً عامًا قويًا عبر مجموعة من معايير اللغة المرئية.

قال سري أمباتي، الرئيس التنفيذي ومؤسس H2O.ai في مقابلة حصرية مع “لقد صممنا نماذج H2OVL Mississippi لتكون حلاً عالي الأداء وفعال من حيث التكلفة، حيث يوفر التعرف الضوئي على الحروف المدعوم بالذكاء الاصطناعي والفهم البصري وتوثيق الذكاء الاصطناعي للمؤسسات”. فينشربيت. “من خلال الجمع بين الذكاء الاصطناعي المتقدم متعدد الوسائط والكفاءة، تقدم H2OVL Mississippi حلول ذكاء اصطناعي دقيقة وقابلة للتطوير عبر مجموعة من الصناعات.”

يمثل إصدار هذه النماذج خطوة مهمة في استراتيجية H2O.ai لجعل تكنولوجيا الذكاء الاصطناعي أكثر سهولة. من خلال صنع نموذج متاح مجانًا على Hugging Faceمنصة شائعة لمشاركة نماذج التعلم الآلي، تسمح H2O.ai للمطورين والشركات بتعديل النماذج وتكييفها مع احتياجات مستندات الذكاء الاصطناعي المحددة.

يتفوق نموذج H2OVL Mississippi-0.8B الجديد من H2O.ai (أقصى اليمين، الأصفر) على النماذج الأكبر لعملاق التكنولوجيا في مهام التعرف على النص في مجموعة بيانات OCRBench، مما يدل على إمكانات نماذج الذكاء الاصطناعي الأصغر والأكثر كفاءة لتحليل المستندات. (الائتمان: H2O.ai)

الكفاءة تجتمع مع الفعالية: نهج جديد لمعالجة الوثائق

وشدد أمباتي على المزايا الاقتصادية للنماذج الأصغر المتخصصة. وقال: “إن نهجنا تجاه المحولات التوليدية المدربة مسبقًا ينبع من استثمارنا العميق في Document AI، حيث نتعاون مع العملاء لاستخراج المعنى من مستندات الأعمال”. “يمكن تشغيل هذه النماذج في أي مكان، وبمساحة صغيرة، بكفاءة واستدامة، مما يتيح ضبط الصور والمستندات الخاصة بالمجال بجزء بسيط من التكلفة.”

ويأتي هذا الإعلان في الوقت الذي تبحث فيه الشركات عن طرق أكثر فعالية لمعالجة واستخراج المعلومات من كميات كبيرة من المستندات. غالبًا ما تعاني أساليب التعرف الضوئي على الحروف وتحليل المستندات التقليدية من عمليات المسح الضوئي ذات الجودة الرديئة، أو تتطلب الكتابة اليدوية أو المستندات المعدلة بشكل كبير. تهدف نماذج H2O.ai الجديدة إلى معالجة هذه المشكلات مع تقديم بديل أكثر كفاءة في استخدام الموارد لنماذج اللغات الأكبر حجمًا والتي يمكن أن تكون مبالغة في مهام محددة متعلقة بالمستندات.

ويشير محللو الصناعة إلى أن نهج H2O.ai يمكن أن يعطل المشهد الحالي الذي يهيمن عليه عمالقة التكنولوجيا. ومن خلال التركيز على نماذج أصغر وأكثر تخصصًا، يمكن لشركة H2O.ai الاستحواذ على جزء كبير من السوق للشركات التي تقدر الكفاءة والربحية.

تُظهر مقارنة متوسط ​​الدرجات عبر ثمانية معايير صور فردية أن طراز H2O.ai H2OVL Mississippi-2B الجديد (باللون الأصفر) يتفوق في الأداء على العديد من المنافسين، بما في ذلك العروض المقدمة من Microsoft وGoogle. يتتبع النموذج فقط Qwen2 VL-2B في الأداء العام بين النماذج ذات الحجم المماثل في اللغة المرئية. (الائتمان: H2O.ai)

مفتوح المصدر وجاهز للمؤسسات: استراتيجية H2O.ai لاعتماد الذكاء الاصطناعي

“في H2O.ai، جعل الوصول إلى الذكاء الاصطناعي ليس مجرد فكرة. قال أمباتي لـ VentureBeat: “إنها حركة”. “من خلال إطلاق سلسلة من النماذج الأساسية الصغيرة التي يمكن ضبطها بسهولة لمهام محددة، فإننا نقوم بتوسيع إمكانيات إنشاء واستخدام الذكاء الاصطناعي.”

جمعت H2O.ai 256 مليون دولار من المستثمرين بما في ذلك بنك الكومنولث, نفيديا, جولدمان ساكسو ويلز فارجو. وقد ساعد نهج الشركة مفتوح المصدر والتركيز على حلول الذكاء الاصطناعي العملية والجاهزة للمؤسسات في بناء مجتمع يضم أكثر من 20000 مؤسسة وأكثر من نصف Fortune 500 كعملاء.

مع استمرار الشركات في مواجهة التحول الرقمي والحاجة إلى استخلاص القيمة من البيانات غير المنظمة، يمكن أن توفر نماذج لغة الرؤية الجديدة من H2O.ai خيارًا مقنعًا لأولئك الذين يتطلعون إلى تنفيذ حلول الذكاء الاصطناعي للمستندات دون التكلفة الحسابية للنماذج الأكبر حجمًا. سيكون الاختبار الحقيقي في التطبيقات الحقيقية، ولكن عرض H2O.ai للأداء التنافسي مع نماذج أصغر بكثير يشير إلى اتجاه واعد لمستقبل الذكاء الاصطناعي للمؤسسات.


مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى