فريق كايمنغ هي من MIT يُصدر نموذجًا لتوسيع اللغة ELF بتدريب على 45 مليار رمز تدريب

بحسب Beating، أصدرت مؤخرًا فرق كيمينغ هي من معهد ماساتشوستس للتكنولوجيا نموذج ELF (Embedded Language Flows)، وهو نموذج لنشر اللغة ينحرف عن أسلوب التنبؤ التتابعي بـ"التنبؤ بالرمز التالي" المستخدم في نماذج من نمط GPT. وبدلًا من ذلك، يجري ELF توليد النص في فضاء تضمينات مستمر، ولا يحوِّله إلى رموز متقطعة إلا في الخطوة الأخيرة.

في اختبارات التوليد غير المشروط ضمن OpenWebText، حقق ELF-B، الذي يضم 105M من المعلمات، حوالي 24.1 من مقلوبية التوليد (Gen. PPL) مع أخذ عينات على 32 خطوة، متفوقًا على عدة نماذج أساسية في اللغات القائمة على الانتشار المتقطع والمستمر. وعلى نحو لافت، احتاج ELF-B إلى نحو 45 مليار رمز تدريبي فقط، أي أقل بحوالي رتبة واحدة من الطرق المماثلة التي عادةً تتجاوز 500 مليار رمز.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات