أوراكل الاستقرار: أداة فعالة لهندسة البروتينات المستقرة

أكتوبر، 2024

في عالم التكنولوجيا الحيوية سريع التطور، تمثل القدرة على هندسة البروتينات ذات الثبات المعزز تحديًا بالغ الأهمية. وسواء أكان تطوير محفزات حيوية صناعية أو تصميم أدوية بيولوجية صيدلانية أكثر فعالية، فإن البروتينات التي يمكنها تحمل عدم التشكّل والتجمع ضرورية. يمكن للطرق الحسابية التي يمكنها التنبؤ بدقة بكيفية تأثير طفرات الأحماض الأمينية على الاستقرار الديناميكي الحراري للبروتين أن تحدث ثورة في عملية هندسة البروتين. ومع ذلك، وحتى الآن، واجهت الأدوات الحسابية الحالية صعوبة في تحديد الطفرات التي تؤدي إلى استقرار البروتين بشكل موثوق.

أدخل أوراكل الاستقرار (Stability Oracle)، وهو إطار عمل جديد للتعلم العميق يتفوق على أحدث الأساليب في التنبؤ بالطفرات البروتينية التي تعمل على استقرار البروتين من الناحية الديناميكية الحرارية. يمثل Stability Oracle، الذي طوره فريق من الباحثين في جامعة تكساس في أوستن، قفزة كبيرة إلى الأمام في قدرتنا على هندسة البروتينات حسابيًا مع تعزيز استقرارها.

الحاجة إلى تحسين التنبؤ بالاستقرار

تُعد البروتينات من أهم ما يميز علم الأحياء، حيث تقوم بمجموعة كبيرة من الوظائف الحيوية داخل الكائنات الحية. وتُعد قدرتها على الانطواء في تراكيب ثلاثية الأبعاد معقدة والحفاظ على تلك التراكيب أمراً ضرورياً لوظيفتها. وغالباً ما تكون البروتينات المعرضة للتفكك أو التكتل أقل فعالية أو حتى غير فعالة تماماً.

وهذا تحدٍ كبير في تطوير التقنيات الحيوية القائمة على البروتين. فالإنزيمات الصناعية المستخدمة في عمليات التصنيع، على سبيل المثال، يجب أن تكون قادرة على تحمل الظروف القاسية مثل درجات الحرارة المرتفعة أو وجود مذيبات عضوية. وبالمثل، يجب أن تحافظ العقاقير البروتينية الصيدلانية على سلامتها الهيكلية أثناء الإنتاج والتخزين والإعطاء. يعد تحسين الاستقرار الديناميكي الحراري لهذه البروتينات أولوية رئيسية.

تقليدياً، كانت هذه عملية شاقة تعتمد على التجربة والخطأ. حيث يقوم الباحثون بإجراء طفرات متكررة على تسلسل البروتين، واختبار التأثيرات على استقرار البروتين تجريبيًا، والعمل تدريجيًا على إيجاد متغير أكثر استقرارًا. لكن هذا النهج يستهلك الكثير من الوقت والموارد. يمكن للطرق الحسابية التي يمكنها التنبؤ بدقة بتأثيرات الطفرات على استقرار البروتين أن تسرّع هذه العملية إلى حد كبير.

على مدار الخمسة عشر عامًا الماضية، تم تطوير مجموعة متنوعة من أدوات التنبؤ بالثبات الحسابي باستخدام كل من الأساليب القائمة على الفيزياء والتعلم الآلي. ومع ذلك، واجهت هذه الأساليب العديد من المشكلات الرئيسية التي منعتها من إحداث تأثير تحويلي في هندسة البروتين.

ويوضح دانيال دياز، أحد المؤلفين الرئيسيين لدراسة Stability Oracle، قائلاً: "إن نقص البيانات ومشاكل هندسة التعلم الآلي منعت خوارزميات التعلم العميق من إحداث تأثير ثوري مماثل في التنبؤ باستقرار البروتين كما حدث في مجالات أخرى من علم الأحياء والكيمياء".

تشمل التحديات الرئيسية ندرة البيانات والتحيز والتسرب، بالإضافة إلى استخدام مقاييس أداء غير مناسبة. تنحاز مجموعات البيانات الحالية بشكل كبير نحو الطفرات المزعزعة للاستقرار، حيث تشكل الطفرات المستقرة 30% فقط أو أقل من البيانات. هناك أيضًا تداخل كبير بين مجموعات التدريب ومجموعات الاختبار، مما يؤدي إلى تقييمات أداء مفرطة في التفاؤل لا تعكس التعميم في العالم الحقيقي.

ولعل الأهم من ذلك أن المجال ركز بشكل مفرط على مقاييس مثل ارتباط بيرسون وجذر متوسط الخطأ المربع (RMSE)، والتي لا تعكس بشكل كافٍ قدرة النموذج على تحديد الطفرات المثبتة - وهو الهدف الرئيسي لتطبيقات هندسة البروتين.

ويشير دياز إلى أن "التحسينات في هذه المقاييس لا تُترجم بالضرورة إلى تحسينات في تحديد الطفرات المثبتة". "إن مقاييس مثل الدقة والاستدعاء والمنطقة تحت منحنى خاصية التشغيل المتلقي هي أكثر أهمية لتقييم الفائدة العملية لهذه النماذج."

تقديم أوراكل الاستقرار

ولمعالجة هذه التحديات التي طال أمدها، اتبع فريق Stability Oracle نهجاً متعدد الجوانب، حيث قام بتطوير تقنيات جديدة لتنظيم البيانات، وبنى مبتكرة للتعلم العميق، وأساليب أكثر ملاءمة لتقييم الأداء.

إن أساس أوراكل الاستقرار هو شبكة عصبية محولة للرسم البياني تتعلم استخراج السمات الهيكلية من البيئة الكيميائية المحلية المحيطة ببقايا الحمض الأميني المستهدف. ثم يتم دمج هذه "البيئة الدقيقة المقنعة" مع التضمينات التي تمثل الأحماض الأمينية من النوع البري والأحماض الأمينية الطافرة للتنبؤ بالتغير في الاستقرار الديناميكي الحراري (ΔΔG) الناتج عن تلك الطفرة.

ويوضح تشينغيوي غونغ، وهو مؤلف رئيسي آخر، قائلاً: "بدلاً من الاعتماد على البنى الطافرة المولدة حسابياً، والتي يمكن أن تكون مكلفة ومعرضة للأخطاء، تتعلم Stability Oracle أن تضع نموذجاً ضمنياً لكيفية تفاعل الأحماض الأمينية "من" و"إلى" مع الكيمياء المحلية".

يسمح هذا الخيار التصميمي ل Stability Oracle بتوليد تنبؤات بكفاءة لجميع الطفرات المحتملة ذات النقطة الواحدة والبالغ عددها 380 طفرة بدءًا من بنية بروتين واحدة - وهو ما يمثل تحسنًا كبيرًا في الكفاءة الحسابية مقارنةً بالطرق السابقة القائمة على البنية.

ولمعالجة تحديات البيانات، قام الباحثون برعاية العديد من مجموعات بيانات التدريب والاختبار الجديدة. واستخدموا تجميع التسلسل لضمان الحد الأدنى من التداخل بين البروتينات في مجموعات بيانات التدريب والاختبار، وهي خطوة حاسمة لتقييم التعميم بشكل صحيح.

كما قدموا أيضًا تقنية جديدة لزيادة البيانات تسمى "التباديل الديناميكية الحرارية" (TP). تستفيد تقنية TP من خاصية وظيفة الحالة لطاقة جيبس الحرة لتوسيع مجموعة صغيرة نسبيًا من قياسات ΔG التجريبية إلى مجموعة بيانات أكبر بكثير وصالحة من الناحية الديناميكية الحرارية. والأهم من ذلك، يولد TP توزيعًا متوازنًا للطفرات المثبتة والمزعزعة للاستقرار، بدلًا من مجموعات البيانات المنحرفة بشدة المستخدمة في الأعمال السابقة.

يقول دياز: "يسمح لنا TP بتقييم أفضل لقدرة النموذج على تحديد الطفرات المثبتة، وهو الهدف الرئيسي لتطبيقات هندسة البروتين".

وبالإضافة إلى مجموعات البيانات المعززة لبروتين TP، قام الفريق أيضًا بضبط إطار عمل Stability Oracle على مجموعة بيانات ضخمة تضم أكثر من مليوني قياس لثبات البروتين، مستمدة من اختبار تحلل البروتين عالي الإنتاجية على نطاقات البروتين الطبيعية والبروتينات الصغيرة المبتكرة.

التفوق على أحدث ما توصلت إليه التكنولوجيا

With these innovations in data curation and model architecture, Stability Oracle demonstrates a remarkable ability to predict thermodynamically stabilizing protein mutations. On a rigorously curated test set, Stability Oracle achieved a precision of 0.70 and a recall of 0.69 in identifying stabilizing mutations (defined as ΔΔG < -0.5 kcal/mol).

والأهم من ذلك، يتفوق هذا الأداء على أداء الأدوات الحسابية الحديثة الحالية، والتي عادةً ما تحقق نجاحًا بنسبة 20% فقط في تحديد الطفرات المثبتة للاستقرار. تتساوى دقة أوراكل الاستقرار في هذه المهمة مع طرق اضطراب الطاقة الحرة (FEP)، والتي تعتبر المعيار الذهبي للتنبؤ بالاستقرار الحسابي ولكنها مكلفة حسابيًا بشكل باهظ بالنسبة لتطبيقات هندسة البروتين واسعة النطاق.

يقول آدم كليفانز، كبير مؤلفي الدراسة: "إن قدرة أوراكل الاستقرار على مطابقة أداء طرق FEP، مع كونها أسرع بعدة مرات من حيث الحجم، تعد إنجازًا كبيرًا".

كما طوّر الفريق أيضًا نظيرًا قائمًا على التسلسل لنموذج Stability Oracle، يسمى Prostata-IFML، من خلال ضبط نموذج لغة البروتين القوي ESM-2. وفي حين أظهر Prostata-IFML أيضًا أداءً مثيرًا للإعجاب، إلا أن نهج Stability Oracle القائم على البنية لا يزال يتفوق على النموذج القائم على التسلسل فقط عبر مجموعة من المقاييس.

ويوضح غونغ قائلاً: "إن حقيقة أن Stability Oracle، بمعلمات أقل بكثير من Prostata-IFML، يمكن أن تتفوق في الأداء على أحدث نماذج التسلسل، تسلط الضوء على قيمة دمج المعلومات الهيكلية". "تحتوي هياكل البروتين على معلومات مهمة تتجاوز مجرد تسلسل الأحماض الأمينية."

كما يتضح الوعي البنيوي لنموذج الاستقرار أوراكل من خلال قدرته على التنبؤ بدقة بالطفرات المثبتة للاستقرار عبر مناطق مختلفة من البروتين. لم يُظهر تحليل تنبؤات النموذج أي تحيز تجاه تحديد الطفرات المثبتة للاستقرار على سطح البروتين مقابل جوهره، وهو أحد القيود الشائعة للطرق السابقة القائمة على البنية.

ويشير دياز إلى أن "برنامج Stability Oracle قادر على التعميم بشكل جيد على الطفرات في كل من المناطق المعرضة للمذيبات والمناطق المدفونة في البروتين". "وهذه قدرة مهمة لهندسة البروتينات ذات الثبات المعزز."

تسريع هندسة البروتينات

تتجاوز الآثار المترتبة على أداء أداة Stability Oracle ما هو أبعد من مجرد القياس الأكاديمي. فهذه الأداة لديها القدرة على تسريع تطوير مجموعة واسعة من التقنيات الحيوية القائمة على البروتين بشكل كبير.

يقول أندرو إلينغتون، وهو مؤلف مشارك وخبير في هندسة البروتينات: "سيؤثر التحديد الدقيق للطفرات المثبتة على كل شيء بدءًا من التنبؤ بالعلاجات البروتينية ذات العمر الافتراضي الأكبر، إلى هندسة الإنزيمات التي يمكنها تحمل الظروف الصناعية القاسية".

على سبيل المثال، في تطوير العقاقير القائمة على البروتين، يمكن أن تؤدي القدرة على فحص ملايين الطفرات المحتملة حسابيًا وتحديد أكثرها استقرارًا إلى تقليل وقت وتكلفة التحسين التجريبي إلى حد كبير. وبالمثل، في مجال التحفيز الحيوي الصناعي، يمكن أن توجه أوراكل الاستقرار هندسة الإنزيمات الأكثر مقاومة للتمسخ، مما يوسع نطاق العمليات التي يمكن تطبيقها عليها.

وبعيداً عن مجرد التنبؤ بتأثيرات الطفرات أحادية النقطة، يعمل فريق Stability Oracle بالفعل على توسيع إطار العمل للتعامل مع الطفرات ذات الترتيب الأعلى. ويوضح دياز قائلاً: "تمثل ندرة البيانات تحدياً أكبر في التنبؤ بتأثيرات الطفرات المتزامنة المتعددة". "لكن الابتكارات التي طورناها مع Stability Oracle، مثل التباديل الديناميكية الحرارية، توفر خارطة طريق لمعالجة هذه المشكلة."

كما يرى الباحثون أيضًا أن أوراكل الاستقرار هي نقطة انطلاق نحو هدف أوسع نطاقًا يتمثل في استخدام التعلم العميق لتوجيه التصميم الجديد لسقالات بروتينية عالية الاستقرار. يقول كليفانز: "إذا تمكنا من وضع نموذج دقيق لكيفية تأثير الطفرات على الاستقرار، فإن الحدود التالية هي استخدام هذه المعرفة لتصميم هياكل بروتينية جديدة تمامًا من الصفر حسابيًا".

الطريق إلى الأمام في هندسة البروتينات

يمثل تطوير Stability Oracle علامة فارقة في السعي إلى تسخير قوة التعلم العميق لهندسة البروتين. من خلال معالجة التحديات القائمة منذ فترة طويلة في جودة البيانات وبنية النموذج وتقييم الأداء، يوضح هذا الإطار إمكانية تصميم البروتين الموجه بالذكاء الاصطناعي لتحويل مجموعة واسعة من التقنيات الحيوية.

ويخلص دياز إلى أن "أوراكل الاستقرار يؤسس معيارًا جديدًا للتنبؤ بالاستقرار الحسابي، ويوفر مسارًا واضحًا للمضي قدمًا في ضبط المحولات القائمة على البنية بدقة لأي نمط ظاهري للبروتين تقريبًا". "هذه مهمة ضرورية لتسريع تطوير التقنيات الحيوية القائمة على البروتين في السنوات القادمة."

مع استمرار تطور مجال هندسة البروتين، لا شك أن أدوات مثل Stability Oracle ستلعب دورًا محوريًا متزايدًا. من خلال تمكين الباحثين من هندسة منتجات أكثر استقرارًا وفعالية قائمة على البروتين، يمكن أن يكون لهذه التكنولوجيا تأثيرات بعيدة المدى على صناعات تتراوح من الأدوية إلى الطاقة النظيفة. يبدو مستقبل التكنولوجيا الحيوية أكثر استقرارًا من أي وقت مضى.

المرجع (المراجع)

  1. https://doi.org/10.1038/s41467-024-49780-2

 

انقر على TAGS للاطلاع على المقالات ذات الصلة :

علم الأحياء | التكنولوجيا الحيوية | تطوير الأدوية | الطب الصيدلاني | البروتينات

ثبتها على بينتريست

دارك دارك دوغ

مجاناً
عرض