تعداد نشریات | 41 |
تعداد شمارهها | 1,113 |
تعداد مقالات | 9,524 |
تعداد مشاهده مقاله | 17,175,058 |
تعداد دریافت فایل اصل مقاله | 12,024,236 |
مقایسۀ کارایی روشهای ردهبندیکننده رگرسیون لجستیک و رگرسیون درختی برای متغیر وابسته باینری | ||
دوفصلنامه گستره علوم آماری | ||
مقاله 1، دوره 1، 2 (بهار و تابستان 1395)، آذر 1395، صفحه 7-14 اصل مقاله (158.19 K) | ||
نوع مقاله: علمی- پژوهشی | ||
نویسنده | ||
علیرضا پاکگهر* | ||
مربی، آمار، دانشگاه پیام نور | ||
چکیده | ||
در این مقاله میزان کارایی مدلهای ردهبندی رگرسیون لجستیک باینری و رگرسیون درختی روی متغیر وابسته باینری بررسی میشود. شیوۀ پردازش مدل، استفاده از تمام دادهها در مرحلۀ آموزشی است. مجموعه دادههای مورد مطالعه از یک گزارش مطالعاتی دربارۀ سوابق بیماری زردی به دست آمده است که یک مجموعه داده شامل متغیرهای کمی و کیفی است. میزان کارایی دو روش طبقهبندیکننده رگرسیون لجستیک و رگرسیون ردهبندی درخت تصمیم، بر اساس معیارهای کارایی آماری نظیر دقت، توجه به موارد خاص، و تحلیل حساسیت است. نتایج تجربی ما نشان میدهد که رگرسیون لجستیک، دقت بالای 83% و رگرسیون درختی میزان دقت حدود 73% را بر روی مجموعه نشان دادهاند. به همین ترتیب میزان حساسیت رگرسیون لجستیک باینری برابر 77% و رگرسیون درختی برابر 66% است. همچنین اندازه توجه به موارد خاص مدل رگرسیون برابر 85% وبرای رگرسیون درختی برابر 76% است. نتایج کارایی مدل نشان میدهد رگرسیون لجستیک باینری بهتر از رگرسیون درختی عمل کرده است. | ||
کلیدواژهها | ||
داده کاوی؛ رگرسیون لجستیک؛ رگرسیون درختی؛ دقت؛ حساسیت و مشخصه بودن | ||
عنوان مقاله [English] | ||
Performance Comparison of Logistic Regression and Classification Regression tree Models for Binary Dependent Variable | ||
نویسندگان [English] | ||
Alireza Pakgohar | ||
چکیده [English] | ||
This paper describes the performance analysis of two classifier models common in statistics and data mining on binary dependent variable, binary Logistic Regression (B.LR) and Classification Regression Tree (CART). The evaluation method is using all data in training stage. The using data set is from “Evaluation of patients with Jaundice on children” report. Data set is collection of categorical and continues independent variables. The classification performance of two classifiers is presented by using statistical performance measures like accuracy, specificity and sensitivity. Experimental result showed that accuracy of LR is more than 83% and CLASSIFICATION AND REGRESSION TREE is nearly 73%. So the sensitivity measure for BINARY LOGISTIC REGRESSION is nearby 77% and 66% for CLASSIFICATION AND REGRESSION TREE as well the specificity scale is 85% for BINARY LOGISTIC REGRESSION and 76% for CLASSIFICATION AND REGRESSION TREE. The result shows the performance of BINARY LOGISTIC REGRESSION classifier is found to be better than CLASSIFICATION AND REGRESSION TREE. | ||
کلیدواژهها [English] | ||
Data Mining, Binary Logistic Regression, Classification Regression tree, Accuracy, sensitivity, Specificity | ||
مراجع | ||
[1] Jiwaei Han, Kamber Micheline, Jian Pei Data mining: Concepts and Techniques, Morgam Kaufmann Publishers (Mar 2006). [2] Pakgohar, Alireza. Statistical applications in data mining: special view in logistic regression. Islamic Azad University, branch of Mashad. department of Science. M.A degree thesis. 2006. [Persian language]. [3] Pakgohar, Alireza. Evaluation of patients with gastroenteritis, Pneumonia and Jaundice on children, Payame Noor University, Report. 2012. [Persian Language]. [4] SPSS 18(PASW) help file. http//www-.spss.com [5] Pakgohar, Alireza. Tabrizi, Reza Sigari. Khalili, Mohadeseh. Esmaeili, Alireza. The role of human factor in incidence and severity of road crashes based on the CART and LR regression: a data mining approach, Procedia Computer Science, Volume 3, 2011, Pages 764-769, ISSN 1877-0509, 0.1016/j.procs.2010.12.126. [6] Alaa M. Elsayad “Predicting the severity of breast masses with ensemble of Bayesian classifiers” journal of computer science 6 (5): 576-584, 2010, ISSN 1549-3636. | ||
آمار تعداد مشاهده مقاله: 1,645 تعداد دریافت فایل اصل مقاله: 3,427 |