
تعداد نشریات | 45 |
تعداد شمارهها | 1,219 |
تعداد مقالات | 10,473 |
تعداد مشاهده مقاله | 20,217,913 |
تعداد دریافت فایل اصل مقاله | 13,905,907 |
Examining the Impact of Variable Selection Methods on Classification Outcomes of BCL-2 and BCL-XL Isoform-Selective Ligands | ||
Iranian Journal of Analytical Chemistry | ||
دوره 11، شماره 1، خرداد 2024، صفحه 44-53 اصل مقاله (370.51 K) | ||
نوع مقاله: Full research article | ||
شناسه دیجیتال (DOI): 10.30473/ijac.2024.70820.1290 | ||
نویسنده | ||
Marzieh Sadat Neiband* | ||
Department of Chemistry, Payam Noor University, 19395-4697, Tehran, Iran | ||
چکیده | ||
Feature selection is crucial in Quantitative Structure-Activity Relationship (QSAR) studies, enhancing learning algorithms’ performance and reducing computational costs. This study evaluates the impact of eight variable selection methods on the classification of isoform-selective ligands for Bcl-2 and Bcl-xL targets using three machine learning techniques: Supervised Kohonen Network (SKN), Support Vector Machine (SVM), and Partial Least Squares Discriminant Analysis (PLS-DA). Classification models were assessed using confusion matrix parameters, 10-fold Venetian blind cross-validation, and test sets. The results show that PLS-DA and SVM have comparable classification capabilities, outperforming SKN. However, PLS-DA occasionally leaves some ligands unassigned, making SVM a more robust and efficient choice. Despite using different variable selection methods, no clear advantage was found for any specific method, with all achieving around 70% classification accuracy in validation and test series. This suggests that the choice of variable selection method does not consistently affect outcomes across all techniques. Ensuring the reliability of selected variables involves meticulous data quality assessments, literature review, and robust cross-validation. Eliminating redundant features is essential for accurate classification models, as many physicochemical properties may be irrelevant to target bioactivity. While no single method guarantees superior models, selecting important variables is vital for extracting relevant features. This study highlights the importance of careful variable selection in QSAR studies, emphasizing its role in reducing dimensionality and improving model interpretability. Ultimately, this enhances drug discovery efficiency by identifying safer and more effective compounds, reducing time and cost. | ||
کلیدواژهها | ||
Variable Selection Methods؛ QSAR؛ Drug Design؛ Bcl-2؛ Bcl-xL | ||
عنوان مقاله [English] | ||
بررسی تاثیر روش های انتخاب متغیر بر نتایج طبقه بندی لیگاندهای ایزوفرم انتخابی Bcl-2 و Bcl-xL | ||
نویسندگان [English] | ||
مرضیه سادات نی بند | ||
بخش شیمی، دانشگاه پیام نور، تهران، ایران | ||
چکیده [English] | ||
انتخاب ویژگیها در مطالعات رابطه کمّی ساختار-فعالیت (QSAR) بسیار مهم است، زیرا عملکرد الگوریتمهای یادگیری را بهبود میبخشد و هزینههای محاسباتی را کاهش میدهد. این مطالعه تأثیر هشت روش انتخاب متغیر را بر طبقهبندی لیگاندهای ایزوفورم-انتخابی برای اهداف Bcl-2 و Bcl-xL با استفاده از سه تکنیک یادگیری ماشین: شبکه کوهونن نظارتشده (SKN)، ماشین بردار پشتیبان (SVM) و تحلیل تفکیکی حداقل مربعات جزئی (PLS-DA) ارزیابی میکند. مدلهای طبقهبندی با استفاده از پارامترهای ماتریس سردرگمی، اعتبارسنجی متقاطع ۱۰-تایی و مجموعههای آزمون ارزیابی شدند. نتایج نشان میدهد که PLS-DA و SVM قابلیتهای طبقهبندی مشابهی دارند و از SKN بهتر عمل میکنند. با این حال، PLS-DA گاهی برخی لیگاندها را بدون تخصیص باقی میگذارد، که SVM را به یک انتخاب قویتر و کارآمدتر تبدیل میکند. با وجود استفاده از روشهای مختلف انتخاب متغیر، هیچ مزیت واضحی برای هیچ روش خاصی یافت نشد و همه حدود ۷۰٪ دقت طبقهبندی را در سریهای اعتبارسنجی و آزمون به دست آوردند. این نشان میدهد که انتخاب روش انتخاب متغیر به طور مداوم بر نتایج در تمام تکنیکها تأثیر نمیگذارد. اطمینان از قابلیت اطمینان متغیرهای انتخابشده شامل ارزیابی دقیق کیفیت دادهها، مرور ادبیات و اعتبارسنجی متقاطع قوی است. حذف ویژگیهای زائد برای مدلهای طبقهبندی دقیق ضروری است، زیرا بسیاری از خواص فیزیکوشیمیایی ممکن است به فعالیت زیستی هدف مرتبط نباشند. در حالی که هیچ روش واحدی مدلهای برتر را تضمین نمیکند، انتخاب متغیرهای مهم برای استخراج ویژگیهای مرتبط حیاتی است. این مطالعه اهمیت انتخاب دقیق متغیرها در مطالعات QSAR را برجسته میکند و نقش آن را در کاهش ابعاد و بهبود تفسیر مدلها تأکید میکند. در نهایت، این کارایی کشف دارو را با شناسایی ترکیبات ایمنتر و مؤثرتر افزایش میدهد و زمان و هزینه را کاهش میدهد. | ||
کلیدواژهها [English] | ||
روش انتخاب متغیر, QSAR, طراحی دارو, Bcl-2, .Bcl-xL | ||
آمار تعداد مشاهده مقاله: 339 تعداد دریافت فایل اصل مقاله: 194 |