صراحة نيوز- تواجه نماذج الذكاء الاصطناعي قيدًا حرجًا يُعرف بأنه عنق الزجاجة للنصوص الطويلة، والذي يُحدّ من قدرتها على معالجة المستندات المطولة.
وقد تحدى مجموعة من الباحثين من الصين واليابان طريقة كشفت عنها قبل عدة أشهر شركة الذكاء الاصطناعي الصينية الناشئة “ديب سيك”، والتي صُممت لتحسين قدرة الذكاء الاصطناعي على التعامل مع النصوص الطويلة، وهو ما يُعد حالة نادرة يتم فيها التشكيك علنًا في أبحاث الشركة.
ووفقًا لباحثين من جامعة توهوكو اليابانية والأكاديمية الصينية للعلوم، فإن منهجية “DeepSeek-OCR” (التعرف الضوئي على الأحرف)، المصممة لضغط النصوص باستخدام تمثيلات بصرية، والتي كان من شأنها إحداث ثورة في كيفية تعامل نماذج الذكاء الاصطناعي مع النصوص الطويلة، معيبة بسبب الأداء غير المتسق، بحسب تقرير لصحيفة ساوث تشاينا مورنينغ الصينية، اطلعت عليه “العربية Business”.
في دراستهم وجد فريق البحث أن أسلوب “ديب سيك” يعتمد بشكل كبير على المعرفة اللغوية المسبقة -أي ميل نماذج الذكاء الاصطناعي للاستناد إلى الأنماط التي تعلمتها من كميات هائلة من النصوص- بدلًا من الفهم البصري الذي تدعي الشركة تحقيقه، مما يجعل مقاييس الأداء التي تُعلن عنها الشركة الصينية “مضللة”.
وأشار الباحثون إلى أن نماذج الذكاء الاصطناعي تواجه قيدًا حرجًا يُعرف باسم “عنق الزجاجة للسياق الطويل”، والذي يُقيّد قدرتها على معالجة المستندات الطويلة أو المحادثات المطولة.
وقد سعت الشركات والمعاهد البحثية حول العالم إلى تحقيق تحسينات في هذا المجال، لما لذلك من أثر كبير على رفع أداء أنظمة الذكاء الاصطناعي.
وقيل إن تقنية “DeepSeek-OCR”، التي نُشرت في أكتوبر، قادرة على التعامل مع المستندات الكبيرة والمعقدة باستخدام الإدراك البصري كوسيلة للضغط.
وقالت الشركة حينها: “ضغط السياق البصري يمكن أن يحقق تقليلًا كبيرًا في عدد الرموز – من سبعة إلى 20 ضعفًا… مما يُقدّم اتجاهًا واعدًا” للتعامل مع تحديات السياق الطويل في الذكاء الاصطناعي.
مع ذلك، وجدت الأبحاث الجديدة، في سلسلة من التجارب المصممة بعناية، أن دقة إجابات “DeepSeek-OCR” على الأسئلة المرئية انخفضت إلى حوالي 20% عند تزويدها بنص إضافي للتأثير على استنتاجها، مقارنةً بدقة تزيد عن 90% للنماذج القياسية للذكاء الاصطناعي.
وقال الباحثون إن هذه الفجوة “تطرح في النهاية تساؤلات حول ما إذا كانت الطرق الحالية للضغط البصري تمثل مسارًا قابلًا للتطبيق لحل قيود السياق الطويل في نماذج الذكاء الاصطناعي”، وأشاروا إلى أن استراتيجيات بديلة قد تكون ضرورية.
في المقابل، وصف بعض علماء الحاسوب خوارزمية “DeepSeek-OCR” بأنها سلاح ذو حدين أكثر من كونها عيبًا جوهريًا، إذ لا يوجد حل سحري لجميع الحالات.
وقال لي بوجي، الحاصل على دكتوراه في علوم الحاسوب من جامعة العلوم والتكنولوجيا الصينية، والذي يدير حاليًا شركته الناشئة في مجال الذكاء الاصطناعي في بكين، إنه بالنسبة للمخطوطات التي يصعب تمييزها، قد يساعد الاعتماد على المعرفة المكتسبة الذكاء الاصطناعي في فهم النص، لكنه قد يكون عيبًا بالنسبة للمواد المطبوعة بوضوح

