Köktürk, Fürüzan
Master Thesis | 2012 | Bülent Ecevit Üniversitesi, Sağlık Bilimleri Enstitüsü, Biyoistatistik Anabilim Dalı
Tıp alanında bulunan mevcut veri oldukça fazla ve hayati öneme sahiptir. Veri madenciliği teknikleri ile hayati öneme sahip olan bu verilerden daha fazla yararlanmak mümkündür. Veri madenciliği son yıllarda oldukça önemli bir konu haline gelmesine ve hemen hemen her alanda uygulama sahası bulmasına rağmen ülkemizde sağlık alanında çok yaygın kullanılmamaktadır. Bu tez çalısmasında veri madenciliği yöntemlerinden, k-en yakın komşuluk, yapay sinir ağları ve karar ağaçları yöntemlerinin sınıflandırma başarılarının karşılastırılması amaçlanmıstır. Bu amaçla Bülent Ecevit Üniversitesi Uygulama ve Araştırma Hastanesi Kadın Hastalıkları ve . . . Doğum Polikliniği’ne başvuran erken ve zamanında doğum yapan gebelerden elde edilen veri setine bu üç teknik uygulanarak, sınıflandırma başarıları hesaplanmıstır. Yapılan analizler sonucunda doğru sınıflandırma oranları, k-en yakın komşuluk analizi için % 78.3, yapay sinir ağı tekniği için % 90.8 ve karar ağacı yöntemi için ise % 82.5 olarak bulunmuş ve yapay sinir ağı tekniğinin diğer iki yönteme göre sınıflandırma başarısının daha iyi olduğu görülmüştür. The amount of medical data is huge and vital. It is possible to obtain more benefit from these data by data mining techniques. Although the data mining has been becoming a very important subject and being used in almost all fields in recent years, it has no widely use in the health sector in our country. In this thesis study, it was aimed to compare of the classification success of the knearest neighbor, artifical neural network and the decision trees techniques. For this purpose, these three techniques were applied and the classification success was measured on the pregnants those gave preterm birth and those gave birth in time in Departments of Obstetrics and Gynecology of Bulent Ecevit University. After the analysis of the results, the correct classification ratios found to be 78.3 % for knearest neighbor method, 90.8 % for artifical neural network, 82.5 % for decision trees method and it was concluded that the artifical neural network is more successful than the other two methods Daha fazlası Daha az
Büyükuysal, Mustafa Çağatay
Doctoral Thesis | 2014 | Bülent Ecevit Üniversitesi, Sağlık Bilimleri Enstitüsü, Biyoistatistik Anabilim Dalı
Normal dağılım varsayımı parametrik testlerin uygulanabilmesi için olması gereken en önemli varsayımlardan biridir. Normallik testleri, ilgili dağılımın normal dağılıma uygunluğunu test etmektedirler. Literatürde pek çok normal dağılım testi geliştirilmiştir. Bu çalışmada normal dağılım testlerinden en yaygın kullanılan ve paket programlarda yer alan 5 normal dağılım testi belirlenmiştir. Bu testlerin kullanım yerleri verinin yapısına ve örneklem genişliğine göre farklılık göstermektedir. Bu amaç doğrultusunda belirli kuramsal dağılım ve farklı örneklem genişliklerinde dağılımlar türetilmiş ve Monte-Carlo simülasyonu ile bu testler . . .Tip-I hata ve güç bakımından karşılaştırılmışlardır. Simülasyon sonucunda Shapiro-Wilk testi en iyi sonucu verirken, örneklem genişliği azaldıkça Anderson-Darling testi de Shapiro-Wilk testi kadar iyi sonuçlar vermiştir. Örneklem genişliği azaldıkça tüm testlerin güçlerinde düşüş olduğu ve bu durumda sadece test sonuçlarıyla değil, grafiksel yöntemlerle de desteklenmesi tavsiye edilmektedir. One of the most important assumption for parametric tests is normality of a distribution. Many normality tests are available in the literature. In our study we compare 5 normality tests which are most popular and available in statistical softwares. Usage of normality tests differs due to samples size or nature of data. For that purpose distributions are generated from different theoretical distributions and sample sizes by Monte-Carlo simulation. Type-I error and power used for comparison of normality tests. According to simulation results, Shapiro-Wilk test has the best results, when the sample size decreases, Anderson-Darling has also good results as Shapiro-Wilk test. All normality tests‟ power getting lower with a decrease of sample sizes. At that situation we suggest to provide normality test results with graphical techniques Daha fazlası Daha az