15 Eylül 2012 Cumartesi
GRUPLARARASI VE GRUP İÇİ KARŞILAŞTIRMA YÖNTEMLERİ
Uzm. Derya ÖZTUNA –
Yrd. Doç. Dr. Atilla Halil ELHAN
1. ÖNEML L K (H POTEZ) TESTLER
Önemlilik testleri, arastırma sonucunda elde edilen degerlerin ya da varılan sonuçların
istatistiksel olarak önem tasıyıp tasımadıgını bir diger deyisle anlamlı olup olmadıgını test etmek için
basvurulan yöntemlerdir.
Hipotez testlerinin amacı; arastırmacılara evrenden çekilen örneklem(ler) yardımıyla evren
hakkında bir karara varma konusunda yardımcı olmaktır.
Önemlilik testlerinden elde edilen sonuçlara göre bazı kararlara varıldıgı için önemlilik
testlerinin dogru ve uygun olarak seçilmesi çok önemlidir.
1.1. Önemlilik Testleri Hakkında Genel Bilgiler
1.1.1.Hipotezler
Önemlilik testleri hipotezleri test etmek için yapılır. Bu yüzden bazen önemlilik testi yerine
“hipotez testi” de denmektedir.
*statistiksel hipotezler örneklemlerin çekildigi evren parametreleri ile ilgili önermelerdir.
*statistikte kullanılan iki tür hipotez vardır.
H0 Farksızlık hipotezi, Sıfır hipotezi, Yokluk hipotezi
H1 Alternatif hipotez, Seçenek hipotez
Test sonucunda H0 kabul edilirse H1 ret edilir. H0 ret edilirse H1 kabul edilir.
Hipotezler tek yönlü (one-sided) ya da çift yönlü (two-sided) olarak kurulabilir.
Tek yönlü hipoteze örnek;
H0: μ =20 ya da H0: μ =20
H1: μ <20 H1: μ >20
*ki yönlü hipoteze örnek;
H0: μ =20
H1: μ ¹ 20
Örnegin;
H0= *ki grubun ortalaması arasında fark yoktur.
Yas ve boy degiskenleri iliskisizdir.
A ilacı ile B ilacının iyilestirme yüzdeleri arasında fark yoktur.
H1=*ki grubun ortalaması farklıdır.
Yas ve boy degiskenleri iliskilidir.
A ilacı ile B ilacının iyilestirme yüzdeleri arasında fark vardır.
1.1.2. Yanılma Düzeyi/Önemlilik Seviyesi (a)
Tablo1: Arastırma ve Evren Sonuçlarına *liskin Çapraz Tablo
GERÇEK (Evren)
ARASTIRMA SONUÇLARI
(Örneklem) Tedaviler
farklıdır
Tedaviler farklı
degildir
Tedaviler farklıdır Dogru
(1-b )
Tip I Hata
(a)
Tedaviler farklı degildir Tip II Hata
(b )
Dogru
Yanılma düzeyi / Önemlilik seviyesi, dogru sıfır hipotezinin reddedilmesi (Tip I hata) olup
buna a denir ve genellikle 0.05 olarak alınır.
Gerçekte bir fark oldugu halde yapılan arastırma sonucunda bir fark bulunmamasından
kaynaklanan Tip II hatanın olusma ihtimalini belirten degere de beta seviyesi denir. Tip II hata yapma
olasılıgı genellikle 0.20 olarak alınır. Yani arastırma sonucunda gerçekte olan bir farkı atlama sansı
1/5 oranındadır.
1-Beta= Testin Gücünü ifade eder.
1.1.3. P Degeri
P,
gruplar arasında fark vardır, ya da iliski vardır derken yapılan hata miktarı,
Ho hipotezi dogru iken onu yanlıslıkla reddetme olasılıgı,
evrende olmayan ve örneklemde gözlenen iliski ya da farklılıgın tamamen sans eseri olarak
ortaya çıkma olasılıgı
olarak tanımlanabilir.
Örnegin;
30 kisilik bir çalısmada kilo ile kolesterol düzeyi arasındaki iliski r=0.70 ve p=0.02 olarak
bulunsun. Aslında kitlede (yani gerçekte) r=0 iken r’nin sans eseri olarak 0.70 çıkma olasılıgı 0.02’dir.
Burada iki olasılık mümkündür.
1- Gerçekten sans eseri olarak r=0.70 olarak bulunmustur.
2- H0 hipotezi dogru degildir. Gerçekte iliski anlamlıdır.
P degeri istatistiksel testin uygulanmasından sonra elde edilir. Paket programların tümü sonuç
asamasında elde edilen test istatistiklerine iliskin p degerini direkt olarak verir.
p>0.05 Gruplar arasında fark yoktur.
p<0.05
p<0.01 Gruplar arasında fark vardır.
p<0.001
1.2. Önemlilik Testlerinin Seçiminde Kullanılan Kriterler
Önemlilik testleri en genel anlamda ikiye ayrılır:
1- Parametrik testler
2- Parametrik olmayan testler
Parametrik testlerde ham veriler üzerinden ortalama, varyans gibi ölçütler elde edilerek
islemler yapılır. Parametrik olmayan testlerde ise ham veriler sıralanır ve sıra numaraları verilir.
*slemler bu sıra numaraları üzerinden yapılır.
Parametrik testler, parametrik olmayan testlere göre daha güçlü testlerdir. Fakat
kullanılabilmeleri için bazı varsayımların saglanması gerekir.
Uygun test seçimi asagıdaki durumlara baglıdır:
1- Verilerin ölçüm biçimi
Verilerin ölçüm biçimi kullanılacak testin seçimini etkileyen en önemli faktörlerden biridir.
Sunumumuzda testlerin sınıflaması sayımla (nitel) ve ölçümle (nicel) belirtilen degiskenler
için ayrı ayrı yapılmıstır.
Tablo 2: Degisken Türleri
Nitel veriler
Sınıflanabilir nitel veri (Nominal) Sıralanabilir nitel veri (Ordinal)
Kan grupları
1: 0 grubu
2: A grubu
3: B grubu
4: AB grubu
Egitim Durumu
1: Okur-yazar degil
2: *lkögretim
3: Lise
4: Üniversite
5: Yüksek lisans/Doktora
Nicel veriler
Sürekli nicel veri (Metric Continuous) Kesikli nicel veri (Metric
Discrete)
Kan basıncı, boy, kilo, yas, hemoglobin
düzeyi
Çocuk sayısı, geçirilen operasyon
sayısı,
Haftada geçirilen astım krizi sayısı
2- *ncelenen grupların bagımlı ya da bagımsız olması
*ncelenen grupların bagımsız olması grupların ayrı bireylerden olusması bir diger deyisle bir
grupta bulunan bir denegin diger grupta bulunmaması demektir. Örnegin kadın ve erkeklerde açlık kan
sekeri düzeylerini karsılastırırken gruplar bagımsızdır.
Bir denek üzerinde birden çok gözlem yapıldıgında gruplar bagımlı olur. Örnegin;
kadınlarda açlık kan sekeri ve tokluk kan sekeri düzeyleri karsılastırılırken gruplar bagımlıdır.
Bagımlılık için bir baska örnek söyledir. *ki doktorun teshis tutarlılıgını ölçmek için aynı hastaların
her iki doktor tarafından muayene edilmesi durumunda gruplar bagımlı olur.
3-Verilerin Dagılımı - Normal Dagılım
*statistiksel analiz yapılırken dagılımın özelligi çok önemlidir. Çünkü parametrik testlerin
uygulanabilmesi için dagılımın normal ya da normale yakın olması gerekir.
Genellikle ölçümle elde edilen sürekli veriler normal dagılıma uyma egilimi gösterirler.
Ancak ölçüm biçimi sıralanabilir nitel olan bir degiskenin kategori sayısı altıdan büyükse ve denek
sayısı yeterliyse normal dagılıma uyma ihtimali büyüktür.
Normal Dagılım
Grafik 1: Hemoglobin Düzeylerinin Frekans Dagılımı
Hemoglobin düzeyi ölçümlerine ait yukarıdaki histogram incelendiginde, ölçümlerin büyük
bir bölümünün ortalama etrafında yogunlastıgı ve ortalamadan uzaklastıkça frekans sayılarının
azaldıgı görülür.
Sürekli nicel veri tipinde olan degiskenlerin çogu (özellikle denek sayısı arttıkça) bu tür bir
dagılım gösterme egilimindedir. Sekil olarak “çan”a benzeyen ve simetrik bir yapıya sahip olan bu tür
dagılıma “normal dagılım ” denir.
4- Örneklem büyüklügü
Gruplardaki denek sayısı arttıkça kullanılan testin gücü ve güvenilirligi artar.
Gruplardaki denek sayısı fazla ise verilerin normal dagılıma uyma ihtimali artar dolayısıyla
Parametrik test kullanma sansı artmıs olur. Gruplardaki denek sayısı az oldugunda ise (30’un altında)
genellikle parametrik olmayan testler tercih edilir.
0
5
10
15
20
25
6,1-8,0
8,1-10,0
10,1-12,0
12,1-14,0
14,1-16,0
Hemoglobin Düzeyi
Frekans
VER ÖLÇÜMLE(N CEL) ELDE ED LD G NDE VE GRUPLAR BAGIMSIZ OLDUGUNDA;
Mann Whitney
U testi
Parametrik test
varsayımları
saglanmadıgında
ki ortalama
arasındaki
farkın önemlilik testi
(Student's t test)
Parametrik test
varsayımları
saglandıgında
Karsılastırılacak grup sayısı: ki
Kruskal Wallis
Varyans Analizi
Parametrik test
varsayımları
saglanmadıgında
Varyans Analizi
Parametrik test
varsayımları
saglandıgında
Grupların bagımlılık durumu: Bagımsız
Veri tipi: Ölçüm
Karsılastırılacak grup sayısı: Üç ya da daha fazla
Karsılastırılacak grup sayısı: ki
Grupların bagımlılık durumu: Bagımlı
Veri Tipi : Ölçüm
Karsılastırılacak grup sayısı: Üç ve daha fazla
varsayımları
Parametrik test
saglanmadıgında
Parametrik test
saglandıgında
varsayımları
Wilcoxon Testi 0ki es arasındaki
(Paired t test)
farkın önemlilik testi
Parametrik test
saglanmadıgında
varsayımları
Parametrik test
varsayımları
saglandıgında
Friedman Testi
Varyans analizi
Tekrarlı ölçümlerde
VER ÖLÇÜMLE (N CEL) ELDE ED LD G NDE VE GRUPLAR BAGIMLI OLDUGUNDA;
VER SAYIMLA(N TEL) ELDE ED LD G NDE;
Asagıdaki hipotezleri test etmek için hangi önemlilik testleri kullanılmalıdır?
Örnek 1. Düsük dogum agırlıklı 35 ve Normal dogum agırlıklı 30 bebegin annelerinin yas
ortalamaları karsılastırılmak isteniyor.
Soru 1. Karsılastırılacak degiskenin ölçüm biçimi nedir?
Sürekli nicel veri
Soru 2. Karsılastırılacak gruplar arasındaki bagımlılık yapısı?
Bagımsız
Soru 3. Karsılastırılacak grup sayısı?
*ki
Soru 4. Gruplardaki denek sayıları nedir?
35 ve 30 kisi
Soru 5. Her bir grupta yas degerleri normal dagılıma uyuyor mu?
Normal dagılıma uygun
Bu bilgilere göre gruplarda yas ortalamalarının ki ortalama arasındaki farkın önemlilik testi
(Student’s t testi) kullanılarak test edilmesine karar verilmistir.
Örnek 2. Düsük dogum agırlıklı çocuk sahibi olan 35 kadın ve normal agırlıklı çocuk sahibi
olan 30 kadında gebelik sayıları karsılastırılmak isteniyor.
Soru 1. Karsılastırılacak degiskenin ölçüm biçimi nedir?
Kesikli nicel veri
Soru 2. Karsılastırılacak gruplar arasındaki bagımlılık yapısı?
Bagımsız
Soru 3. Karsılastırılacak grup sayısı
test
Beklenen deger
5'den
büyükse
Fisher Exact
Beklenen deger
5'den
küçükse
Karsılastırılacak grup sayısı: ki
(2x2)
Ki-Kare testi
Karsılastırılacak grup sayısı: Üç +
(nx2),(2xm),(nxm)
Grupların bagımlılık durumu: B agımsız
Mc Nemar Testi
Karsılastırılacak grup sayısı: ki
(2x2)
Grupların bagımlılık durumu:
Ki-kare testi veya
iki yüzde arasındaki
farkın önemlilik testi
Bagımlı
*ki
Soru 4. Gruplardaki denek sayıları nedir?
Birinci grupta 35, ikinci grupta 30 kisi
Soru 5. Gebelik sayıları normal dagılıma uyuyor mu?
Normal dagılıma uygun degil
Bu bilgilere göre gruplarda gebelik sayısı ortancalarının farklı olup olmadıgı Mann Whitney
U testi kullanılarak karsılastırılmalıdır.
Örnek 3. 30 annenin dogum öncesi ve dogum sonrası kilo ortalamaları karsılastırılmak
isteniyor.
Soru 1. Karsılastırılacak degiskenlerin ölçüm biçimi nedir?
Sürekli nicel veri
Soru 2. Karsılastırılacak gruplar arasındaki bagımlılık yapısı?
Bagımlı
Soru 3. Karsılastırılacak grup sayısı?
*ki
Soru 4. Gruplardaki denek sayıları nedir?
30 kisi
Soru 5. Kilo degerleri arasındaki fark normal dagılıma uyuyor mu?
Normal dagılıma uygun
Bu bilgilere göre dogum öncesi ve dogum sonrası kilo ortalamalarının ki es arasındaki farkın
önemlilik testi (Paired t testi) kullanılarak test edilmesine karar verilmistir.
Örnek 4. 25 bebegin dogumda ve dogumdan 6 ay sonraki Apgar skorları karsılastırılmak
isteniyor.
Soru 1. Karsılastırılacak degiskenin ölçüm biçimi nedir?
Sıralanabilir Nitel Veri (10’lu)
Soru 2. Karsılastırılacak gruplar arasındaki bagımlılık yapısı?
Bagımlı
Soru 3. Karsılastırılacak grup sayısı
*ki
Soru 4. Gruplardaki denek sayıları nedir?
Her grupta 25 kisi
Soru 5. Apgar skorları arasındaki fark normal dagılıma uyuyor mu?
Normal dagılıma uygun degil
Bu bilgilere göre dogumda ve dogumdan 6 ay sonraki Apgar skorlarının ortancalarının farklı
olup olmadıgı Wilcoxon testi kullanılarak karsılastırılmalıdır.
Örnek 5. Dört ayrı hepatit türünde sedimantasyon ortalamaları karsılastırılmak isteniyor.
Soru 1. Karsılastırılacak degiskenin ölçüm biçimi nedir?
Sürekli nicel veri
Soru 2. Karsılastırılacak gruplar arasındaki bagımlılık yapısı?
Bagımsız
Soru 3. Karsılastırılacak grup sayısı?
Dört
Soru 4. Gruplardaki denek sayıları nedir?
Her grupta 35 kisi
Soru 5. Her bir grupta sedimantasyon degerleri normal dagılıma uyuyor mu?
Normal dagılıma uygun
Bu bilgilere göre hepatit türlerinde sedimantasyon ortalamalarının Varyans Analizi
kullanılarak test edilmesine karar verilmistir.
Örnek 6. Kanserin 3 degisik evresinde AgNor degerleri karsılastırılmak isteniyor.
Soru 1. Karsılastırılacak degiskenin ölçüm biçimi nedir?
Sürekli nicel veri
Soru 2. Karsılastırılacak gruplar arasındaki bagımlılık yapısı?
Bagımsız
Soru 3. Karsılastırılacak grup sayısı
Dört
Soru 4. Gruplardaki denek sayıları nedir?
*ki grupta 10, iki grupta 8
Soru 5. Her bir grupta AgNor degerleri normal dagılıma uyuyor mu?
Normal dagılıma uygun degil
Bu bilgilere göre evrelerdeki AgNor degerleri ortancalarının farklı olup olmadıgı Kruskal-
Wallis Varyans Analizi kullanılarak karsılastırılmalıdır.
Örnek 7. 32 bireyin diyet öncesi, diyet sonrası ve diyetten 3 ay sonraki beden-kitle indeksi
(BMI) degerleri karsılastırılmak isteniyor.
Soru 1. Karsılastırılacak degiskenin ölçüm biçimi nedir?
Sürekli nicel veri
Soru 2. Karsılastırılacak gruplar arasındaki bagımlılık yapısı?
Bagımlı
Soru 3. Karsılastırılacak grup sayısı?
Üç
Soru 4. Gruplardaki denek sayıları nedir?
32 kisi
Soru 5. BMI degerleri arasındaki farklar normal dagılıma uyuyor mu?
Normal dagılıma uygun
Bu bilgilere göre diyet öncesi, diyet sonrası ve diyetten 3 ay sonraki beden-kitle indeksi
ortalamalarının Tekrarlı Ölçümlerde Varyans Analizi kullanılarak test edilmesine karar verilmistir.
Örnek 8. 15 bireyin ameliyat öncesi, ameliyatta ve ameliyat sonrası VAS skorları
karsılastırılmak isteniyor.
Soru 1. Karsılastırılacak degiskenin ölçüm biçimi nedir?
Sıralanabilir nitel veri (10’lu)
Soru 2. Karsılastırılacak gruplar arasındaki bagımlılık yapısı?
Bagımlı
Soru 3. Karsılastırılacak grup sayısı?
Üç
Soru 4. Gruplardaki denek sayıları nedir?
15 kisi
Soru 5. VAS skorları arasındaki farklar normal dagılıma uyuyor mu?
Normal dagılıma uygun degil
Bu bilgilere göre ameliyat öncesi, ameliyatta ve ameliyat sonrası VAS skorları
ortalancalarının Friedman Testi kullanılarak test edilmesine karar verilmistir.
Örnek 9. Sigaranın Düsük dogum agırlıgına etkisini incelemek amacıyla Düsük dogum
agırlıklı çocuk sahibi olan ve olmayanlarda Sigara kullanma yüzdeleri karsılastırılmak isteniyor.
Soru 1. Karsılastırılacak degiskenin ölçüm biçimi nedir?
Sınıflanabilir Nitel Veri
Soru 2. Karsılastırılacak gruplar arasındaki bagımlılık yapısı?
Bagımsız
Soru 3. Karsılastırılacak gruplarda kategori sayısı
2 x 2
Soru 4. Beklenen degeri 5’ten küçük bir göze var mı?
Yok
Bu bilgilere göre Düsük Dogum Agırlıklı çocuk sahibi olan ve olmayanlarda Sigara içme
durumlarının farklı olup olmadıgı Ki- Kare testi veya ki yüzde arasındaki farkın önemlilik testi
kullanılarak test edilmelidir.(Beklenen degerin 5’ten küçük oldugu göze olması durumunda Fisher’in
Kesin Ki-kare Testi kullanılarak test edilmelidir.)
Örnek 10. Sosyoekonomik düzeyin Düsük dogum agırlıgına etkisini incelemek amacıyla
Düsük dogum agırlıklı çocuk sahibi olan ve olmayanların Sosyoekonomik düzeylerine göre dagılımları
karsılastırılmak isteniyor.
Soru 1. Karsılastırılacak degiskenin ölçüm biçimi nedir?
Sıralanabilir Nitel Veri
Soru 2. Karsılastırılacak gruplar arasındaki bagımlılık yapısı?
Bagımsız
Soru 3. Karsılastırılacak gruplarda kategori sayısı
2 x 3
Bu bilgilere göre Düsük Dogum Agırlıklı çocuk sahibi olan ve olmayanların Sosyoekonomik
düzeylerinin farklı olup olmadıgı Çok-gözlü düzenlerde Ki- Kare testi kullanılarak test edilmelidir.
Örnek 11. Aynı hastalar üzerinde uygulanan iki farklı yöntemin (PET ve SPECT) benzer tanı
koyma olasılıkları (Pozitif/Negatif) karsılastırılmak isteniyor.
Soru 1. Karsılastırılacak degiskenin ölçüm biçimi nedir?
Sınıflanabilir Nitel Veri
Soru 2. Karsılastırılacak gruplar arasındaki bagımlılık yapısı?
Bagımlı
Soru 3. Karsılastırılacak gruplarda kategori sayısı
2 x 2
Bu bilgilere göre PET ve SPECT yöntemlerinde tanı koyma olasılıklarının farklı olup
olmadıgı Mc-Nemar testi kullanılarak test edilmelidir.
KAYNAKLAR
1. Akgül, A. (2003). Tıbbi Arastırmalarda statistiksel Analiz Teknikleri “SPSS
Uygulamaları” (2. Baskı). Emek Ofset Ltd. Sti., Ankara.
2. Bowers, D. (2002). Medical Statistics from Scratch. John Wiley and Sons, Ltd.,
England.
3. Conover, W., J. (1980). Practical Nonparametric Statistics (2nd Edition), John Wiley &
Sons.
4. Dawson-Saunders B., Trapp, R., G. (1990). Basic and Clinical Biostatistics. Appleton
& Lange.
5. Siegel, S., Castellan, N., J., Jr. (1988). Nonparametric Statistics for the Behavioral
Sciences. McGraw-Hill Inc., New York.
6. Sümbüloglu, K., Sümbüloglu, V. (2002). Biyoistatistik (10. Baskı). Hatiboglu Basım
ve Yayım San. Tic. Ltd. Sti, Ankara.
7. Swinscow, T., D., V. (1997). Statistics at Square One (9th Edition). BMJ Publishing
Group. Erisim: [http://bmj.bmjjournals.com/collections/statsbk/13.shtml].
Kaydol:
Kayıt Yorumları (Atom)
Hiç yorum yok:
Yorum Gönder