فتح نماذج الأساسات ذات الخلية الواحدة بمعلمات أقل بنسبة 96٪ نماذج اللغة الكبيرة ذات الخلية الواحدة (scLLMs) تعلمت معرفة بيولوجية مذهلة من ملايين الخلايا. لكن لديهم نقطة ضعف حاسمة: إخراجهم من سياق تدريبهم — مرض جديد، نوع غير مرئي، مجموعة خلايا غير محددة — وتصبح توقعاتهم غير موثوقة. الحل القياسي هو الضبط الدقيق. لكن الضبط الدقيق يفوق معلمات النموذج الأصلية، مما يسبب "نسيان كارثي" للمعرفة البيولوجية التي تم تعلمها مسبقا. وهي مكلفة حسابيا، وتتطلب موارد كبيرة من وحدات معالجة الرسوميات لا يمتلكها العديد من الباحثين. يقترح في هي والمؤلفون المشاركون scPEFT — إطار عمل ضبط دقيق فعال من حيث المعلمات يجمد العمود الفقري الأصلي ل scLLM ويدرب فقط محولات صغيرة منخفضة الأبعاد. أربعة أنواع من المحولات (محول الرمز، محول البادئة، LoRA، محول المشفر) تنتقل إلى أجزاء مختلفة من بنية النموذج، وتتعلم التعديلات الخاصة بالمهمة دون لمس الأوزان المدربة مسبقا. مكاسب الكفاءة ملحوظة: scPEFT يقلل من المعلمات القابلة للتدريب بأكثر من 96٪ ويقلل من استهلاك ذاكرة GPU بأكثر من النصف. لكن ما يهم هو — في الواقع الأداء أفضل من الضبط الكامل. في مجموعات البيانات الخاصة بالأمراض (NSCLC، MS، COVID-19)، يحقق scPEFT تحسينات في الدقة بنسبة 39.7–81.7٪ مقارنة بالنماذج الأصلية ومكاسب بنسبة 4.3–15٪ مقارنة بالإصدارات المضبوطة بدقة، وذلك تحديدا لأنه يحافظ على المعرفة المدربة مسبقا بدلا من أن يكتب فوقها. يتيح الإطار أيضا النقل بين الأنواع من النماذج المدربة على البشر: تحسن بنسبة 14٪ في خلايا الفئران، 39٪ على الخلايا الجرثومية في المكاك، و144٪ على C. elegans—وكل ذلك باستخدام خرائط جينية متعامدة. يحدد تحليل الانتباه الجينات المرتبطة بكوفيد في حالات محددة من خلايا التائية ويكشف عن مجموعات فرعية ذات صلة بيولوجية غير مرئية للنماذج المضبوطة بدقة. الدلالة الأوسع: مع انتشار النماذج الأساسية في علم الأحياء، نحتاج إلى طرق فعالة لتكييفها دون تدمير ما تعلمته. يظهر scPEFT أنه أحيانا التحديث القليل يعني تعلم المزيد. الورقة: