KLİNİK ARAŞTIRMALARDA SÜREKLİ SONUÇLU ÖLÇÜM...
Transcript of KLİNİK ARAŞTIRMALARDA SÜREKLİ SONUÇLU ÖLÇÜM...
1
TÜRKİYE CUMHURİYETİ
ANKARA ÜNİVERSİTESİ
SAĞLIK BİLİMLERİ ENSTİTÜSÜ
KLİNİK ARAŞTIRMALARDA SÜREKLİ
SONUÇLU ÖLÇÜM TEKNİKLERİNİN
UYUMUNUN İNCELENMESİNDE
KULLANILAN İSTATİSTİKSEL
YÖNTEMLER
Gamze AKKOCA
BİYOİSTATİSTİK ANABİLİM DALI
YÜKSEK LİSANS TEZİ
DANIŞMAN
Doç. Dr. Yasemin GENÇ
2012 – ANKARA
ii
Ankara Üniversitesi Sağlık Bilimleri Enstitüsü
Biyoistatistik Anabilim Dalı Yüksek Lisans Programı
çerçevesinde yürütülmüş olan bu çalışma, aşağıdaki jüri tarafından
Yüksek Lisans Tezi olarak kabul edilmiştir.
Tez Savunma Tarihi: 08 / 05 / 2012
Doç. Dr. Yasemin GENÇ
Ankara Üniversitesi
Jüri Başkanı
Prof. Dr. Atilla Halil ELHAN Doç. Dr. Pınar ÖZDEMİR
Ankara Üniversitesi Hacettepe Üniversitesi
Yrd. Doç. Dr. S. Kenan KÖSE Yrd. Doç. Dr. Derya ÖZTUNA
Ankara Üniversitesi Ankara Üniversitesi
iii
İÇİNDEKİLER
Kabul ve Onay ii
İçindekiler iii
Önsöz v
Simgeler ve Kısaltmalar vi
Şekiller vii
Çizelgeler viii
1. GİRİŞ 1
1.1. Genel Kavramlar 3
1.1.1. Doğruluk ve Kesinlik (Accuracy and Precision) 3
1.1.2. Ölçüm Hatası (Measurement Error) 6
1.1.3. Güvenilirlik (Reliability) 9
1.1.4. Geçerlilik (Validity) 11
1.2. Metot Karşılaştırma Çalışmalarında Uyumun Değerlendirilmesi 12
1.2.1. Uyumu Değerlendirmede Kullanılan İstatistiksel Yaklaşımlar 15
1.2.1.1. Tanımlayıcı Yöntemler 16
1.2.1.1.1. Saçılım Grafiği (Scatter Plot) 16
1.2.1.1.2. Bland – Altman Uyum Sınırları Grafiği (Difference Plot) 17
1.2.1.2. Ölçeklendirilemeyen Uyum İndisleri (Unscaled Summary
Indices)
19
1.2.1.2.1.Bland-Altman Yöntemi ile Uyum Sınırları (Limits of
Agreement with Bland-Altman Approach)
19
1.2.1.2.1.2. Karşılaşılabilecek Problemler ve Çözüm Yolları 25
1.2.1.2.1.2.1. Logaritmik Dönüşüm 25
1.2.1.2.1.2.2. Regresyon Yaklaşımı 27
1.2.1.2.2. Tekrarlanabilirlik (Repeatability) 30
1.2.1.2.2.1. Tekrarlı Ölçümler Kullanıldığında Uyumun Hesaplanması 32
1.2.1.2.2.1.1. Gerçek Değerin Değişmediği Durumlarda Her Bir
Denek Üzerinden Eşit Sayıda Tekrarlı Ölçüm Elde Edilmesi Durumu
33
1.2.1.2.2.1.2. Gerçek Değerin Değişmediği Durumlarda Her Bir
Denek Üzerinden Eşit Sayıda Olmayan Tekrarlı Ölçüm Elde Edilmesi
39
1.2.1.2.2.1.3. Gerçek Değerin Değiştiği Durumlarda Tekrarlı
Ölçümler
ile Oluşturulan Eşleştirilmiş Çiftler
40
1.2.1.2.3. Tekrar Elde Edilebilirlik (Reproducibility) 42
1.2.1.3. Ölçeklendirilebilen Uyum İndisleri (Scaled summary indices) 43
1.2.1.3.1. Sınıf İçi Korelasyon Katsayısı (Intraclass Correlation
Coefficient)
43
1.2.1.3.1.1. Çalışmanın Tasarımına Göre SKK Tahminleri 45
1.2.1.3.1.1.1. İki Yönlü Karma Etki Modeli 46
1.2.1.3.1.2. Çalışmanın Amacına Göre SKK Tahminleri 48
1.2.1.3.1.3. Kullanılan Ölçümlerin Elde Edilme Biçimine Göre SKK
Tahminleri
49
1.2.1.3.2. Concordance Korelasyon Katsayısı (Concordance
Correlation Coefficient)
52
1.2.1.3. Regresyon Yöntemleri 57
iv
1.2.1.3.1. Deming Regresyon Yöntemi 57
1.2.1.3.2. Passing - Bablok Yöntemi 62
2. GEREÇ VE YÖNTEM 65 2.1. Uygulama Verisi 65
2.2. Veri analizinde Kullanılan Programlar 67
3. BULGULAR 70
4. TARTIŞMA 87
5. SONUÇ VE ÖNERİLER 90
ÖZET 91
SUMMARY 92
KAYNAKLAR 93
ÖZGEÇMİŞ 96
v
ÖNSÖZ
Klinik araştırmalarda, metot karşılaştırma çalışmaları oldukça önemlidir. Tıpta,
zaman içersinde teknolojik gelişmelere paralel olarak daha çabuk yanıt veren, daha
ekonomik yeni bir metot önerilebilir. Geliştirailen yeni metodun ölçümlerinin,
referans (eski) metodun ölçümleri ile uyumu metot karşılaştırma yöntemleri
yardımıyla incelenir ve önerilen yeni metodun kullanılabilir olup olmadığına karar
verilir.
Yüksek Lisans tez konusunu seçerken ve tez süresince önemli katkıları olan, her
türlü yardım ve desteği sağlayan danışman hocam Doç. Dr. Yasemin GENÇ’e
teşekkür ederim.
Ayrıca tezin hazırlanma aşamasında yardımlarını ve desteğini hiç esirgemeyen
annem, babam, nişanlım Güvenç GÜRBÜZ, kardeşlerim Umut Can ve Onur
AKKOCA’ya teşekkür ederim.
vi
SİMGELER VE KISALTMALAR
BSI British Standards Institute
CKK Concordance Korelasyon Katsayısı
EKK En Küçük Kareler
FDA Food and Drug Administration
ISO International Organization for Standardization
SKK Sınıf-İçi Korelasyon Katsayısı
vii
ŞEKİLLER
Şekil 1.1. “ Doğruluk ” ve “ Kesinlik” kavramlarının görsel ifadesi 5
Şekil 1.2. Hata türlerinin şematik gösterimi 7
Şekil 1.3. Sabit Hata 7
Şekil 1.4. Orantısal Hata 7
Şekil 1.5. Rastgele Hata 8
Şekil 1.6. Hata türleri 8
Şekil 1.7. Eşitlik Doğrusu ile Saçılım Grafiği 13
Şekil 1.8. Saçılım grafiği ve Bland-Altman grafiğinin karşılaştırılması 19
Şekil 1.9. İki farklı metotla elde edilen kan basıncı değerleri 27
Şekil 1.10. Deming Regresyon ve EKK regresyon yöntemlerinde hata
değerlerinin minimize edilmesi
60
Şekil 2.1. Kifotik deformasyonu ölçmek için kullanılan metotlar 67
Şekil 2.2. MedCalc programının ana menüsü 68
Şekil 2.3. MedCalc programında metot karşılaştırma menüsü 69
Şekil 3.1. TL değerlerinin Post-op ve Bending metodu ile elde edilen
ölçümlerinin farklarına karşı ortalamalarının grafiği
72
Şekil 3.2. TL değerlerinin Post-op ve Truga metodu ile elde edilen
ölçümlerinin farklarına karşı ortalamalarının grafiği
74
Şekil 3.3. PT değerleri için Deming regresyon grafiği 78
Şekil 3.4. MT değerleri için Deming regresyon grafiği 80
Şekil 3.5. . MT değerleri için Passing-Bablok regresyon grafiği 81
Şekil 3.6. Kifoz deformasyonu ölçmede Metot 1 ve Metot 2 Karşılaştırması 84
Şekil 3.7. Kifoz deformasyonu ölçmede Metot 1 ve Metot 3 Karşılaştırması 84
Şekil 3.8. Kifoz deformasyonu ölçmede Metot 1 ve Metot 4 Karşılaştırması 85
viii
ÇİZELGELER
Çizelge 1.1. Sınıf içi korelasyon katsayısının hesaplanmasında kullanılan veri
seti için uygun notasyonel veri seti
44
Çizelge 1.2. Varyans analizi modelleri için varyans bileşenleri 46
Çizelge 1.3. SKK’nın kabul edilebilir seviyeleri 48
Çizelge 1.4. Çalışmanın tasarımına, amacına ve ölçümlerin elde edilme
biçimlerine göre hesaplanabilecek farklı SKK türleri
51
Çizelge 1.5. CKK’nın kabul edilebilir seviyeleri 56
Çizelge 2.1. Kifotik deformasyonu ölçmede kullanılan metotların tanımları 67
Çizelge 3.1. Veri setindeki değişkenlerin tanımlayıcı istatistikleri 70
Çizelge 3.2. Bland-Altman yönteminin uygulanabilmesi için Bending TL ve
Post-op TL ölçümlerine ilişkin varsayımların testi
71
Çizelge 3.3. Bland-Altman yöntemi uygulanan Bending TL ve Post-op TL
ölçümlerine ilişkin sonuçlar
72
Çizelge 3.4. Bland-Altman yönteminin uygulanabilmesi için Truga TL ve
Post-op TL ölçümlerine ilişkin varsayımların testi
73
Çizelge 3.5. Bland-Altman yöntemi uygulanan Truga TL ve Post-op TL
ölçümlerine ilişkin sonuçlar
74
Çizelge 3.6. Bending metodu ile elde edilen MT değerleri ile Post-op MT
değerleri arasındaki SKK tahmini
75
Çizelge 3.7. Truga metodu ile elde edilen MT değerleri ile Post-op MT
değerleri arasındaki SKK tahmini
76
Çizelge 3.8. Bending metodu ile elde edilen MT değerleri ile Post-op MT
değerleri arasındaki CKK tahmini
76
Çizelge 3.9. Truga metodu ile elde edilen MT değerleri ile Post-op MT
değerleri arasındaki CKK tahmini
77
Çizelge 3.10. PT değerleri için Deming regresyon analizi sonuçları 78
Çizelge 3.11. MT değerleri için Deming regresyon sonuçları 79
Çizelge 3.12. MT değerleri için Passing-Bablok regresyon analizi sonuçları 80
Çizelge 3.13. Veri setindeki değişkenlerin tanımlayıcı istatistikleri 82
Çizelge 3.14. Kifoz deformasyonu ölçmede kullanılan metotların Bland-
Altman yöntemi ile uyumunun değerlendirilmesi
85
Çizelge 3.15. Kifoz deformasyonu ölçmede kullanılan metotların SKK ile
uyumunun değerlendirilmesi
86
1
1. GİRİŞ
Teknolojik gelişmelere paralel olarak her geçen gün eskisinden daha iyi olduğu
düşünülen yeni metotlar önerilmektedir. Örneğin kan basıncı, kalp atışı oranı,
kolesterol düzeyi gibi klinik ölçümleri elde etmek için kullanılan referans (eski)
metotların yerini teknolojik ilerlemelerle birlikte yeni metotlar alabilir. Ancak
klinisyenlerin, konu ya da denek üzerindeki diğer etkiler olmadan ölçülen değerin
gerçek değerini (true value) tespit etmesi neredeyse imkansızdır. Tüm ölçümlerin
belirli bir hata içermesinin kaçınılmaz olduğu unutulmamalıdır. Güvenilir ve doğru
ölçüm basitçe, yeni ölçümün gerçek değer ile aynı olması veya gerçek değer ile
uyumlu olması olarak tanımlanabilir. Fakat yeni ölçümün, gerçek değer ile tam
olarak aynı olması pratikte pek mümkün değildir. Yeni ölçüm tolere edilebilecek bir
hata miktarı ile kabul edilebilir. Bu nedenle, yeni metot gerçek değerler yerine
referans metot ile kıyaslanarak değerlendirilir. Klinisyenler, bir parametreyi
ölçmeye yarayan ve eskisine göre daha ucuz ve çabuk yanıt veren yeni bir metot
bulunduğunda, bu metodu yaygın olarak kullanılan referans metot ile karşılaştırarak
metotların ne derece uyumlu sonuç verdiğini bulmak isterler. Burada uyum ile
kastedilen iki yöntemden elde edilen ölçüm değerlerinin eşit olmasıdır. Aynı
parametreyi ölçmek için kullanılan farklı metotlara ait ölçümler arasında genellikle
tam bir uyumun olması mümkün değildir. Ancak yeni metodun referans (eski)
metottan ne kadar farklı olduğunu bulmak mümkündür. Bu fark, klinik
yorumlamada problem yaratacak düzeyde değilse, yeni yöntem eski yöntem yerine
kullanılabilir ya da değişimli olarak her ikisi de kullanılabilir (Bland ve Altman,
1999).
Yeni bir ölçüm metodu ile referans olarak kullanılan ölçüm metodunun uyum
düzeyi çeşitli istatistiksel yöntemler kullanılarak incelenir. Daha önceki yıllarda
yapılan metot karşılaştırma çalışmalarında, uyumun ölçümünde genellikle klasik
istatistik yöntemlerinin kullanıldığı görülmektedir. Ancak bilinen bu klasik
2
yöntemlerin uyumu ölçmede yanlış sonuçlar verdiği gözlenmiş ve bu yöntemlere
alternatif yöntemler önerilmiştir.
Pearson korelasyon katsayısı, regresyon analizi, bağımlı gruplarda t testi gibi klasik
istatistiksel yöntemlere karşılık, Sınıf-İçi Korelasyon Katsayısı (SKK), Concordance
Korelasyon Katsayısı (CKK), Bland-Altman yöntemi, Deming regresyon ve
Passing-Bablok yöntemleri önerilen yöntemlerden bazılarıdır.
Ölçümlerin güvenilirliğini ve doğruluğunu ölçmek amacıyla yapılan çalışmalar 1886
yılında Galton ile başlamış olup, Bartko (1966), Shrout ve Fleiss (1979) ve
Vangeneugden (2004)’in güvenilirlik ölçütlerinden Sınıf-İçi Korelasyon Katsayısı
(SKK) konusundaki çalışmaları ile devam etmiştir. Ardından, SKK’ye alternatif
olarak Lin (1989) Concordance Korelasyon Katsayısını (CKK) geliştirmiş; Donner
(1998), Dunn (2002), Shoukri (2004) ise güvenilirlik çalışmalarının dizaynı
konusunda çalışmalar yapmışlardır. Deming (1943), klasik regresyon analizinden
farklı olarak her iki değişkenin de hata içerebileceği konusu üzerinde durmuş;
Passing ve Bablok (1983) da Deming regresyon tekniğine ek olarak her iki
değişkene ait verilerin hata değerlerinin normal dağılım varsayımını sağlamaması
durumu üzerinde durmuşlardır. Metotlar arasındaki uyumu değerlendirmek amacıyla
ise, Bland ve Altman (1986, 1995, 1999); Banhart (2002, 2005) gibi önemli
araştırmacılar farklı ölçütler geliştirmişlerdir.
Metot karşılaştırma çalışmalarında uyumu ölçmek için geliştirilen yaklaşımlar
aşağıdaki gibi sınıflandırılabilir:
(1) Tanımlayıcı yöntemler:
45 0 ’lik eşitlik doğrusu (identity (equality) line) ile eşleştirilmiş veri çiftleri
için saçılım grafiği
Bland – Altman saçılım grafiği
3
(2) Ölçeklendirilmeyen özet indisler (Unscaled summary indices):
Bland-Altman yöntemi ile uyum sınırları
Ölçümlerin farklarının mutlak değerine dayanan tekrarlanabilirlik
(repeatabilitiy) ve tekrar elde edilebilirlik (reproducibility) katsayıları
(3) Ölçeklendirilebilen özet indisler (Scaled summary indices):
Sınıf-İçi Korelasyon Katsayısı
Concordance Korelasyon Katsayısı
(4) Regresyon Modelleri
Deming regresyon yöntemi
Passing – Bablok regresyon yöntemi
Bu tez çalışmasında amaç, metot karşılaştırma çalışmalarında uyum düzeyini
belirlemek amacıyla geliştirilen istatistiksel yöntemleri tanıtmak, aralarındaki
farkları incelemek, metot karşılaştırma çalışmalarının dizaynını sunmak ve çalışma
dizaynına en uygun yöntemin nasıl seçileceğini açıklamaktır.
1.1. Genel Kavramlar
Uyum kavramını ve uyum düzeyini ölçmede kullanılan yöntemleri kavrayabilmek
için öncelikle, bu çalışmalarda sıklıkla kullanılan, “Doğruluk ve Kesinlik”, “Ölçüm
Hatası”, “Güvenilirlik” ve “Geçerlilik” kavramlarının anlaşılması önemlidir. Bu
amaçla, aşağıda bu kavramlara ilişkin açıklamalar yer almaktadır.
1.1.1. Doğruluk ve Kesinlik (Accuracy and Precision)
Birçok bilim dalında, bir ölçüm sisteminin doğruluğu, bir niceliğin ölçüm değerinin
asıl (gerçek) değerine olan yakınlığının derecesidir. Bir ölçüm sisteminin kesinliği
4
(tekrarlanabilirliği veya yinelenebilirliği) ise, aynı koşullarda elde edilen tekrarlı
ölçümlerin aynı sonucu verme derecesidir; ancak birçok sözlükte, “doğruluk” ve
“kesinlik” eş anlamlı olarak kullanılır. Doğruluk, “hatadan veya yanlışlıktan
arınmışlık” veya “ölçüm değerinin, gerçek veya standart değer ile uyumunun
derecesi” olarak tanımlanır. Kesinlik ise, “elde edilen ölçümlerin saflığının
(refinement) derecesi” veya “elde edilen tekrarlı ölçüm değerlerinin birbirine
yakınlığı” olarak tanımlanır. Burada saflığın derecesi (degree of refinement) ve
uyumun derecesi (degree of conformity) aynı şeyi ifade etmektedir. Bu iki terim
arasındaki ince fark, gerçek (referans) değere gereksinim duyulup duyulmamasıdır
(Barnhart ve ark., 2007). Bir ölçüm sisteminin doğruluğu belirlenmek istendiğinde,
gerçek değere gereksinim duyulurken; kesinlik belirlenmek istendiğinde elde edilen
ölçümlerin birbirine ne kadar yakın olduğu ile ilgilenilir ve bu nedenle gerçek
değere gereksinim duyulmaz.
Geçmişten bu yana, “doğruluk” ve “kesinlik” kavramlarının anlamları birbiriyle
karıştırılmaktadır. Bu iki kavram arasındaki karmaşa, her bir kavramın farklı
tanımlarının olmasından ve zaman zaman birbirlerinin yerine kullanılmalarından
dolayı günümüzde de giderilebilmiş değildir. Örneğin, biyoanalitik metot doğrulama
kılavuzu (Food and Drug Administration (1999)) olan FDA doğruluğu, “bir metot
ile elde edilen test sonuçlarının ortalamasının gerçek değere yakınlığı (closeness)”
olarak tanımlamıştır. Ortalamanın gerçek değerden sapması, yani sistematik
yanlılık, doğruluğun değeridir. FDA, kesinlik terimini ise, benzer koşullar altında
aynı homojen örneklemden seçilen örneklerden elde edilen bir grup ölçüm değeri
arasındaki uyumun yakınlığı olarak tanımlar. Bunun yanı sıra, ISO (International
Organization for Standardization (1994)), doğruluk terimini hem sistematik yanlılık
(trueness) hem de rastsal hatanın (kesinliğin) ölçüsü olarak kullanmıştır. Burada,
sistematik yanlılık, elde edilen birçok test sonucunun ortalaması ile gerçek değer
(veya kabul edilen referans değer) arasındaki uyumun yakınlığını (closeness of
agreement) ifade ederken; kesinlik, test sonuçları arasındaki uyumunun yakınlığını
ifade etmektedir. Diğer bir ifadeyle, ISO’nun tanımına göre “doğruluk” teriminin,
sistematik yanlılık ve rastsal hatanın her ikisini birden içerdiği söylenebilir.
5
ISO’nun, hem sistematik yanlılık (sistematik hata) hem de rastsal hatanın ölçümü
için sadece “doğruluk” terimini kullanmasına rağmen, istatistiksel araştırmalarda ve
medikal literatürde sistematik yanlılığı ölçmek için “doğruluk” teriminin; rastsal
hatayı ölçmek için ise “kesinlik” teriminin sıklıkla kullanıldığı gözlenmektedir. Bu
nedenle, bu tez çalışmasında da, sistematik yanlılık “doğruluk” teriminin ifadesi
olarak kullanılırken; “kesinlik” terimi beklenen değer etrafındaki rastsal hatanın
ifadesi olarak kullanılacaktır.
Doğruluk ve kesinlik kavramları arasındaki farkın daha iyi anlaşılması açısından
Şekil 1.1’in incelemesi faydalı olacaktır.
Düşük doğruluk Düşük doğruluk
Düşük kesinlik Yüksek kesinlik
Yüksek doğruluk Yüksek doğruluk
Düşük kesinlik Yüksek kesinlik
Şekil 1.1. “ Doğruluk ” ve “ Kesinlik ” kavramlarının görsel ifadesi
Şekil 1.1’de verilerin ortadaki nokta içersinde yer alması ölçümlerin doğruluğunun
arttığı anlamına gelirken; verilerin birbirine olan yakınlığı ise ölçümlerin
kesinliğinin arttığını ifade eder. Ölçümlerin hem birbirine yakın olması hem de
6
gerçek değere yakın olması ise hem doğruluğun hem de kesinliğin yüksek olduğunu
gösterir.
1.1.2. Ölçüm Hatası (Measurement Error)
Ölçüm, gerek ölçülen değişkeni, gerekse ölçüm işlemlerini az ya da çok etkileyen
birçok etkenin etkisi altında yapılan bir işlemdir.
Ölçülen özelliğin gerçek değeri ile ölçüm sonucu arasındaki farka ölçüm hatası
denir. İstatistiksel anlamda “hata” terimi, bağımsız değişkenle açıklanamayan
değişkenliğin bütün kaynakları olarak tanımlanır (Bruton ve ark., 2000).
Ölçüm sonuçlarına karışan hatalar, gözlemciden, ölçme aracından veya
metodundan, ölçümün elde edildiği ortamdan, ölçümlerin elde edildiği deneklerin
sözü edilen bu etkenlerle etkileşiminden kaynaklanabilir.
Klinik çalışmalarda tam olarak güvenilir ölçümler elde etmek neredeyse
imkânsızdır. Çünkü bütün gözlemcilerin, ölçüm aletlerinin, ölçümleri elde eden
kişilerin (raters) ölçümlerini bir miktar hata ile elde etmesi olasıdır; benzer olarak
deneklerden elde edilen yanıtlar da tutarlı olmayabilir. Bu nedenle, gözlenen ölçüm
değeri ( ix ), gerçek değer ( it ) ve hata ( ie ) bileşenlerinden oluşur. Bu durum,
iii etx
şeklinde gösterilebilir.
Sistematik hata (SE), rastgele hata (RE) olmak üzere iki hata türü vardır. Sistematik
hata da kendi içinde sabit ve orantısal hata olmak üzere ikiye ayrılır. Şekil 1.2. ve
1.6.’da hata türleri gösterilmiştir.
7
Şekil 1.2. Hata türlerinin şematik gösterimi
Sistematik hata (SE veya bias), ölçülen değerin, gerçek değerden uzaklaşma
derecesidir. Ölçülen büyüklüğe, ölçümü elde eden kişiye ve ölçme koşullarına bağlı
olarak sistematik hatalar değişebilir. Sabit hata, hata miktarının her ölçümde aynı
olması, değişmemesidir. Her bir ölçme işlemi için aynı yönde olup, hata miktarı her
bir ölçüm için değişmez. Orantısal hata ise, ölçümlerin büyüklüğü ile orantılı olarak
azalan ya da artan hatalardır ve regresyon doğrusunun eğiminden bulunur. Sabit ve
orantısal hataya ilişkin grafikler Şekil 1.3. ve Şekil 1.4’te gösterilmiştir.
Şekil 1.3. Sabit Hata Şekil 1.4. Orantısal Hata
Rastgele hata (RE), ölçülen değer için verilerin ortalama etrafındaki dağılımına göre
değişir. Verilerin ortalama etrafında yayılım ölçütü olan standart sapma (s) düzeyi,
rastgele hatanın göstergesidir. Hatanın kaynağı bilinmez. Ölçme sonuçlarına gelişi
HATA
RASTGELE HATA SİSTEMATİK HATA
SABİT HATA ORANTISAL HATA
ORANTISAL HATA
8
güzel karışan ve şansla ortaya çıkan hatalardır. Çok sayıda ölçme yapılarak rastgele
hataların ortalaması sıfıra yaklaştırılır.
Şekil 1.5. Rastgele Hata
Şekil 1.6. Hata türleri
Toplam hata ise, matematiksel olarak rastgele hata ve sistematik hatanın toplamı
olarak tanımlanabilir.
9
1.1.3. Güvenilirlik (Reliability)
Uzun yıllardan bu yana, güvenilirliği (reliability) ölçmek amacıyla farklı yöntemler
geliştirilmektedir. Güvenilirlik ilk olarak, sosyal ve davranışsal bilimler ile eğitim
alanlarında yapılan çalışmalarda kullanılmış; ardından psikoloji, biyoloji ve medikal
bilimlerde de yaygın olarak kullanılmaya başlanmıştır (Bartko, 1966; Donner, 1998;
Fisher, 1925; Lord ve Novick, 1968; Müller ve Büttner, 1994; McGraw ve Wong,
1996; Shrout ve Fleiss, 1979; Shrout, 1998; Shoukri ve arkadaşları, 2004;
Vangeneugden ve ark., 2004).
Güvenilirlik, tekrarlı ölçümlerin tutarlılığı ya da ölçümlerin tekrarlanabilirliği olarak
tanımlanır ve gerçek farklardan kaynaklanan toplam varyansın miktarının bir
ölçüsüdür (Bruton ve ark., 2000).
Gözlenen ölçüm değeri ( ix ), gerçek değer ( it ) ve ölçüm hatası ( ie ) unsurlarını da
dikkate alarak aşağıdaki şekilde ifade edilir:
iii etx
Uygulamada, sadece gözlem değeri ( ix ) olan ölçüm değeri bilinebilir. Gerçek değer
( it ) ve hata değeri ( ie ) hakkında bir bilgi elde edilemez. Hataların rastgele olarak
dağıldığı varsayımıyla, hatalar rastgele olarak pozitif ve negatif yönde gelişir ve
birbirlerini elemeleri sayesinde ölçüm hataları ortalaması sıfır olur (E( ie )=0). Bu
varsayımdan hareketle ölçmenin varyansı aşağıdaki gibi formüle edilebilir (Ercan ve
ark., 2004) :
222
etx
2
x : Gözlenen değerlerin varyansı
2
t : Gerçek değerlerin varyansı
10
2
e : Ölçüm hatalarının varyansı
Klasik test teorisinde, yukarıdaki bilgilerden faydalanarak bir ölçme aracının ne
derece güvenilir olduğu, gerçek değerlerin varyansının, toplam varyansa (gözlenen
değerler varyansına, 2
x ) oranıyla elde edilen güvenilirlik katsayısı ile anlaşılır.
Güvenilirlik katsayısı aşağıdaki formül yardımıyla bulunur:
2
2
x
tx
Elde edilen ölçümler, gerçek değere yaklaştıkça, ölçeğin güvenilirliği artar. Elde
edilen ölçümün gerçek değere yaklaşması, yani hata değerinin sıfıra yaklaşması
durumunda güvenilirlik katsayısı 1’e yaklaşır; bu durumda ise ölçme aracının
güvenilirlik düzeyi mükemmel olur. Bu durumun tam aksine, hata miktarı arttıkça
güvenilirlik azalır ve güvenilirlik katsayısı ise sıfıra yaklaşır (Bruton ve ark., 2000).
Literatürde yaygın olarak kullanılan güvenilirlik indisleri,
Yanlılık için hipotez testleri (Örneğin eşleştirilmiş t-testi, varyans analizi
vb.)
Korelasyon katsayıları (Örneğin Pearson korelasyon katsayısı, SKK vb.)
Ölçümlerin standart hatası
Değişim katsayısı
Tekrarlanabilirlik katsayısı
Bland-Altman %95 uyum sınırları
dır (Bruton ve ark., 2000).
11
1.1.4. Geçerlilik (Validity)
Geçerlilik, bir metodun ölçmeyi amaçladığı özelliği, başka herhangi bir özellikle
karıştırmadan, doğru olarak ölçebilme derecesidir. Başka bir ifadeyle, bir ölçme
aracının, geliştirilmiş bulunduğu konuda amaca hizmet etmesidir. Söz gelimi,
uzunluk ölçmek için geliştirilmiş bir araç olan metre, kişilerin boylarını ölçme
amacına hizmet eder; fakat kişilerin ağırlıklarını ölçme amacına hizmet etmez. Bu
demektir ki, bir ölçme aracı olarak metre uzunluk ölçmede geçerlidir; fakat ağırlık
ölçmede geçerli değildir.
Bir metodun kullanılmadan önce, geçerliliğinin incelenmesi ve değerlendirilmesi
gerekir. Bir metodun geçerliliğinin nasıl değerlendirileceği sorusundan önce
bilinmesi gereken konu, bir metotta birden çok geçerlilik türünün ve yönteminin
olabileceğidir. Uygulamada, geçerliliği birden fazla yöntemle belirlenmiş metotların
daha çok tercih edildiği bilinmektedir.
Seçilen referans değere (kriter veya gold standart) bağlı olarak, içerik geçerliliği
(content validity), yapı geçerliliği (construct validity), ölçüt geçerliliği (criterion
validity) gibi bazı önemli geçerlilik türleri vardır (Barnhart, 2007). İçerik
geçerliliği, geliştirilen ölçüm metodunun incelenen konuların tüm önemli alt
konularını içermesi olarak tanımlanır (Alpar, 2010). Yapı geçerliliği, doğrudan
ölçülemeyen bir özelliği ölçen bir metodun ölçme derecesi olarak tanımlanır ve
endişe, merak gibi doğrudan gözlemlenemeyen gizli yapıların ölçülmesi için
kullanılır. Ölçüt geçerliliği, bir referans değere göre geçerliliğin belirlenme sürecidir
ve uyum (concurrent) ve kestirim (predictive) geçerliliği olmak üzere ikiye ayrılır.
Uyum (var olan durum) geçerliliği, geçerli olduğu bilinen referans metot yerine
daha az zaman alan ya da kişiye belirli oranda daha az zarar vermesi gibi
nedenlerden dolayı başka bir metot önerildiğinde kullanılır. Kestirim geçerliliği,
standart ölçümü kestiren metot ya da değişkenlerden elde edilen bir ölçümü
kullanarak standardın kestirilme derecesi olarak tanımlanabilir (Alpar, 2010;
Barnhart, 2007).
12
Geçerli bir metotta bulunması gereken en önemli özellik, metodun güvenilir
olmasıdır. Metodun güvenilirliği ile ilgili kavramlardan bir önceki bölümde
bahsedilmiştir.
1.2. Metot Karşılaştırma Çalışmalarında Uyumun Değerlendirilmesi
Metot karşılaştırma çalışmalarında, aynı denek üzerinden farklı metotlarla elde
edilen ölçümler arasındaki uyum düzeyi merak edilir. Uyum, farklı metotlar ile elde
edilen ölçümlerin birbirine benzerliği iken; uyumsuzluk, elde edilen ölçümlerin
birbirine benzer olmayışlık düzeyini ifade eder. Ancak benzer koşullar altında aynı
metotla aynı denek üzerinden elde edilen tekrarlı ölçüm değerleri veya aynı amaç
için geliştirilmiş metotlarla aynı denek üzerinden alınan ölçümler, her bir ölçüm
prosedüründe karşılaşılması kaçınılmaz olan hata değeri nedeniyle genellikle
tamamen aynı olmazlar. Bu nedenle, ölçüm değerleri arasındaki uyumun ya da
yakınlığın tespit edilmesi gerekir.
Uyum, hem doğruluk (accuracy) hem de kesinlik (precision) terimlerini içerir. Eğer
ölçüm değerlerinden biri referans değer olarak kabul edilirse, uyum aynı zamanda
geçerlilik terimi ile de ilgili olacaktır. Bütün ölçüm değerlerinin aynı dağılımdan
geldiği varsayılırsa, uyum, bu ölçüm değerlerinin ortalamaları etrafındaki kesinliği
(precision) değerlendirir. Ölçüm değerleri arasında uyumsuzluk söz konusu
olduğunda, uyumsuzluğun sistematik yanlılıktan mı (systematic bias) ya da rastsal
hatadan mı kaynaklandığı tespit edilmelidir. Çünkü sistematik yanlılık (inaccuracy)
genellikle kalibrasyon yardımıyla sabitlenebilir; ancak rastsal hatayı (imprecission)
kontrol altına almak oldukça güçtür (Barnhart, 2007).
Uyum düzeyinin tahminine, iki metot ile aynı denek üzerinden elde edilen ölçümler
arasındaki farkın hesaplanması ile başlanır. Tüm denekler için ölçüm değerleri
birbirine eşit olduğunda, iki metot ya da aletin sonuçları arasında mükemmel uyum
olduğu söylenebilir. Bu durumda, iki metot ile elde edilen ölçüm değerlerine ait
13
saçılım grafiği çizildiğinde Şekil 1.7.’de görüleceği gibi tüm noktalar eşitlik doğrusu
üzerinden geçer (Bland ve Altman, 1999).
Şekil 1.7. Eşitlik Doğrusu ile Saçılım Grafiği
Daha önce de bahsedildiği gibi, ölçüm değerleri çoğu zaman bir miktar hata ile elde
edildiğinden yukarıdaki grafik ile genellikle karşılaşılmaz. Elde edilen ölçüm
değerleri çoğunlukla birbirine yakın değerler çıkar. Bu nedenle, ölçüm değerleri
arasındaki uyum ya da yakınlığa (closeness) ihtiyaç duyulur.
Uyum, mutlak uyum ve ilişkisel uyum olmak üzere iki şekilde incelenebilir. Mutlak
uyum, Stine (1989) tarafından tanımlanan ilişkisel (relational) uyum kavramının
özel bir durumudur (Barnhart, 2007). Uyum ölçüm değerleri arasındaki farkın
mutlak değerinin bir fonksiyonu olarak tanımlandığında, bu tür uyuma mutlak uyum
denir (Barnhart, 2007).
Her bir denekten aynı ölçüm değerinin elde edilmesi bekleniyorsa veya elde edilen
ölçüm değerleri arasındaki herhangi bir sistematik fark tolere edilmiyorsa mutlak
uyum kavramı kullanılır. Mutlak uyum, farklı metotlar ile aynı denek üzerinden elde
edilen ölçümlerin uyumunu mutlak farklara dayanarak değerlendirir ve literatürde
yaygın olarak kullanılan uyum türüdür (Barnhart, 2006).
14
İlişkisel uyum, metotlardan biriyle elde edilen ölçüm değerlerinin, diğeriyle elde
edilen ölçüm değerlerinin bir fonksiyonu olması durumudur (Barnhart, 2006).
İlişkisel uyum katsayısını tanımlamak için, öncellikle uyumu sağlamak amacıyla
ölçüm değerlerine uygulanacak olan dönüşümler (transformations) tanımlanmalıdır.
Örneğin, iki metot ile elde edilen iki ölçüm değeri arasındaki fark bir sabitse,
metotlar ile elde edilen ölçüm değerleri birbirleri ile uyumludur ve bu durumda
uygulanacak dönüşüm, aynı sabit değeri her bir ölçüm değerine eklemektir
(eklemeli uyum (additive agreement) ile ilgilidir). Yani metotlardan biriyle elde
edilen ölçüm değerlerinin her birine aynı sabit değer eklendiğinde diğer metoda ait
ölçüm değerleri elde edilir. Bu durum,
axxT )(
şeklinde gösterilebilir.
Benzer olarak, ilgilenilen durum doğrusal (linear) uyum olduğunda, metotlardan
biri ile elde edilen ölçümler, diğer metot ile elde edilen ölçümler ile sabit bir
doğrusal fonksiyon oluşturuyorsa, metotlar ile elde edilen ölçümlerin birbirleri ile
uyumlu olduğu söylenir (Barnhart, 2007). Bu durum ise,
bxaxT )( , 0b
şeklinde gösterilebilir.
İlişkisel uyum kavramına daha çok sosyal bilimler ile ilgili çalışmalarda rastlanır.
Biyomedikal ya da sağlık bilimlerinde ise, ilgilenilen her bir denek için gerçek
değerin belirlenmesi istendiğinden yaygın olarak mutlak uyum kavramı kullanılır.
Metot karşılaştırma çalışmalarında uyum gibi güvenilirlik kavramı ile de sıkça ve
farklı şekillerde karşılaşılır. Vangeneugden ve arkadaşları (2005) ve Molenberghs ve
arkadaşlarına (2007) göre, uyum bir denekten elde edilen ölçümlerin yakınlığının
15
derecesini değerlendirirken; güvenilirlik denekler arasındaki farkın derecesini yani
bir popülasyonda deneklerin birbirlerinden ayrılışlarını değerlendirir (Barnhart,
2007).
Güvenilirlik değerlendirilirken, ölçüm hataları, denekler arasındaki değişkenlik ile
ilgilidir ve deneklerin birbirinden ayrılışları hakkında bilgi edinilmesini sağlar. Eğer
deneklerden elde edilen değerler birbirinden farklı ise, ölçüm hatası denekler
arasındaki ayrılışın tespit edilmesini engellemeyecektir; ancak deneklerden elde
edilen ölçüm değerleri birbirine çok yakınsa, ölçüm hatası ile denekler arasındaki
ayrılış tespit edilemeyecek ve güvenilirlik parametreleri oldukça küçük çıkacaktır.
Bu nedenle, homojen popülasyonlarda uyum düzeyi yüksek, güvenilirlik düzeyi
düşük çıkarken; heterojen popülasyonlarda uyum düzeyi düşük, güvenilirlik düzeyi
yüksek çıkabilir. Bu durum, ölçeklendirilemeyen indisler uyumu değerlendirmede,
ölçeklendirilebilen indisler ise güvenilirliği değerlendirmede kullanılıyorsa
geçerlidir. Çünkü ölçeklendirilebilen indisler kimi zaman denekler arası
değişkenliğe (between-subject variability) bağlıdır ve sonuç olarak, bir
popülasyondan seçilen deneklerin birbirinden ayrılışlarının derecesini değerlendirir
(Barnhart, 2007).
Medikal çalışmalarda uyumun değerlendirilmesi konusuna, metot karşılaştırma ve
deney doğrulama çalışmalarında sıkça rastlanır. Bu tez çalışmasında, uyumu
değerlendirmek için kullanılan istatistiksel yaklaşımlar tanımlayıcı yöntemler,
ölçeklendirilemeyen uyum indisleri, ölçeklendirilebilen uyum indisleri ve regresyon
teknikleri başlıkları altında sınıflandırılacak ve tartışılacaktır.
1.2.1. Uyumu Değerlendirmede Kullanılan İstatistiksel Yaklaşımlar
Bu bölümde, metot karşılaştırma çalışmalarında uyumu değerlendirmek amacıyla
kullanılan yöntemler; tanımlayıcı yöntemler, ölçeklendirilemeyen özet indisler,
16
ölçeklendirilebilen özet indisler başlıkları altında incelenecek ve
detaylandırılacaktır:
1.2.1.1. Tanımlayıcı Yöntemler
Tanımlayıcı istatistikler, karşılaştırılacak metotlar ile elde edilen ölçüm değerleri
hakkında sezgisel olarak tahminlerde bulunabilmek açısından önem teşkil eder;
ancak bu tanımlayıcı istatistikler m metot ile elde edilen ölçüm değerleri arasındaki
uyumun derecesini ölçmek için yeterli değildir.
Metot karşılaştırma çalışmalarında, tanımlayıcı yöntemler saçılım grafiği (scatter
plot) ve Bland – Altman grafiği (difference plot) başlıkları altında incelenecektir. Bu
grafikler, verileri görsel olarak yorumlamak ve ölçümler arasındaki ilişkileri
incelemek açısından da önemlidir.
1.2.1.1.1. Saçılım Grafiği (Scatter Plot)
n birimden elde edilen X, Y değerler çifti xy koordinat alanında X değerleri x
ekseni, Y değerleri y ekseni ölçekleri kullanılarak kesişme noktaları biçiminde
belirlenir. Bu noktalardan oluşan grafiğe saçılım grafiği denir (Özdamar, K., 2003).
Saçılım grafiği, iki değişken arasındaki ilişkinin tipini, yönünü ve büyüklüğünü
belirlemeye yardımcı olan bir grafik türüdür.
Bu grafik, iki metoda ait tüm ölçümlerin tam olarak eşit olduğunu varsayan eşitlik
doğrusunu da (identity line) göstermektedir. Regresyon doğrusu için hesaplama
yapılmaz ya da regresyon doğrusu çizilmez. Çünkü burada bir metodun diğer metot
aracılığıyla bulunan tahmini ile ilgilenilmez; ancak teorik eşitlik ilişkisi ve bu
eşitlikten sapmalar ile ilgilenilir. Eşitlik doğrusu, yatay ve dikey eksendeki
ölçümlerin eşit olmasını simgeler ve her iki eksene de 45 0 lik açı yapar. Bu doğru,
17
görsel olarak metotlar arasındaki uyum düzeyinin ne kadar iyi olduğunu
değerlendirmeyi kolaylaştırır. Fakat metot karşılaştırmada ölçümlere ait değişim
aralığı geniş olduğunda, bu tür bir saçılım grafiğinin anlaşılması güç olabilir (Bland
ve Altman, 1999).
1.2.1.1.2. Bland – Altman Uyum Sınırları Grafiği (Difference Plot)
Aynı denekler üzerinden iki metot ile elde edilen ölçüm değerleri arasındaki
farkların, ortalamalarına karşı gösterildiği saçılım grafiğidir. Bu grafiğe aynı
zamanda “Bland – Altman Uyum Sınırları Grafiği” de denir.
Bland – Altman grafiğinde x eksenini, gerçek değerin bilinmemesinden dolayı,
gerçek değerin en iyi tahmin edicisi olan aynı denek üzerinden iki metot ile elde
edilen ölçümlerin ortalama değerleri oluşturur. y eksenini ise, iki metot ile aynı
denek üzerinden elde edilen ölçümler arasındaki fark değerleri oluşturur.
Gerçek değeri içeren referans metodun olduğu çalışmalarda, Bland – Altman
grafiğinin x-ekseni, araştırmacının hata yapma eğiliminden dolayı iki metotla elde
edilen ölçümlerin ortalaması yerine referans metodun ölçümlerini gösterir (Mantha,
2000).
Farklara karşı her bir değeri ayrı ayrı göstermek hatalıdır. Çünkü bu durumda farklar
birbiriyle ilişkili olur ki bu çok iyi bilinen istatistiksel bir problemdir.
Bland - Altman grafiği, ortalamalar (gerçek değer) ve farklar (hata) arasındaki olası
bir korelasyonun değerlendirilmesine de imkan verir (Mantha, 2000). Fark ve
ortalama değerleri arasında herhangi bir ilişkinin olması durumunda, bu ilişkinin
giderilmesi gerekir. Fark ve ortalamalar arasında ilişki olmaması gerekliliğinin
nedeni, sonuçların güven aralıkları da verilerek diğer popülasyonlara genellenmek
istenmesinden ileri gelir (Mantha, 2000).
18
Metotlar ile elde edilen ölçümler arasındaki ilişki doğrusal değilse veya standart
sapma ölçüm aralığı boyunca sabit değilse, doğrusallık ve ölçüm aralığı boyunca
sabit standart sapma verilerin logaritmik dönüşümünün alınması yoluyla sağlanabilir
(Carstensen, 2010).
Yukarıda anlatılanların yanı sıra, Bland – Altman grafiği yanlılığın (farkların
sistematik olarak sıfırdan farklı olup olmadığının) ve rastgele hatanın (farkların ne
kadar yaygın olduğunun) değerlendirilmesine de olanak tanır. Grafikteki noktaların,
x eksenine yatay uzanan uyum sınırları ( DD S96.1 ) arasında olması beklenir.
Metotlar arasındaki uyumsuzluk ise, işaretlenen noktaların yatay olarak çizilen sıfır
ekseninden sapmalarıyla ölçülebilir.
Metot karşılaştırma çalışmalarında, Bland – Altman grafiği, ölçüm değerleri
arasındaki farkların büyüklüğünü ve bu değerlerin gerçek değerden (true value) ne
derece farklı olduğu hakkında bilgi vermesi nedeniyle saçılım grafiğine göre daha
üstündür.
Aşağıdaki Bland – Altman ve saçılım grafiği, Mayil S. Krsihnam ve arkadaşlarının
2009 yılında yaptıkları çalışmada göğüs aortik hastalıkları için SSFP MR anjiyografi
ve klasik CE-MRA metotlarının karşılaştırılması çalışmasından alınmıştır
(Krishnam ve ark., 2009):
19
Şekil 1.8. Saçılım grafiği ve Bland-Altman grafiğinin karşılaştırılması
a. Saçılım grafiği SSFP MRA ve CE-MRA metotları arasındaki korelasyonun
(r=0.99) oldukça fazla olduğu görülmektedir.
b. Bland-Altman grafiğinde bütün noktaların uyum sınırları içinde olduğu
gözlenmektedir.
1.2.1.2. Ölçeklendirilemeyen Uyum İndisleri (Unscaled Summary Indices)
1.2.1.2.1. Bland-Altman Yöntemi ile Uyum Sınırları (Limits of Agreement with
Bland-Altman Approach)
Metot karşılaştırma çalışmalarında esas amaç, iki metodun değişimli olarak
kullanılabilmesi için elde edilen sonuçların yeterince uyumlu olup olmadığını
belirlemektir. Uyumu belirlemek amacıyla kullanılan klasik yöntemler olan,
kalibrasyon istatistikleri olarak da bilinen, korelasyon ve en küçük kareler regresyon
analizi çoğu zaman araştırmacıyı yanlış yönlendirir. Uyumu araştırmada bu
yöntemlerin kullanılması aşağıdaki nedenlerden dolayı doğru değildir:
20
1. Korelasyonun derecesi örneklemdeki sonuçların dağılım genişliğine bağlıdır.
Dağılım genişliği büyük olan örneklemlerde, dağılım genişliği dar olan
örneklemlere göre korelasyon daha yüksek çıkar. Örneğin, bu durum 3.0 ve 5.5 g/dl
gibi dar dağılım genişliğine sahip Albümin değerleri için dezavantajken, 0 ve 43
gibi büyük dağılım genişliğine sahip ALT ölçümleri için avantajdır (Genç ve ark.,
2003).
2. Örneklemdeki sonuçların dağılım genişliğine bağlı olarak, dağılım genişliği
büyük olan örneklemlerde korelasyon yüksek çıkarken, elde edilen ölçüm
değerlerinin arasındaki farkın büyük olabilmesinden dolayı uyum düşük çıkabilir.
Çünkü korelasyon katsayısı rastgele hataya duyarlı iken, orantısal hataya duyarlı
değildir. Örneğin, A metodu, B metodu ile elde edilen ölçümlerin 2 katını veriyorsa,
iki metodun sonuçları arasında tam bir korelasyon bulunurken, zayıf bir uyumluluk
elde edilecektir. Çünkü bu durumda ölçümler arasında rastgele hata yokken,
kuvvetli bir orantısal hata vardır ve korelasyon katsayısı bu hatayı belirleyemez
(Genç ve ark.,2003).
3. Korelasyon katsayısının anlamlılığının testi, “iki metot arasında ilişki ya da
bağıntı yoktur” hipotezinin testidir. Aynı değeri ölçmek için dizayn edilen iki
metodun ilişkili olup olmadığını test etmek gereksizdir. Çünkü aynı metodu ölçmek
için dizayn edilen iki metodun ilişkili olması beklenen bir durumdur (Genç ve ark.,
2003).
4. Regresyon doğrusunun eğimi iki metot arasındaki uyum ile ilgili bilgi verebilir;
ancak regresyon doğrusunun eğimi elde edilen ölçüm değerlerinin dağılım
genişliğinden önemli ölçüde etkilenir (Pollock, 1992).
5. Doğrusal regresyon analizi metot karşılaştırma çalışmalarında kullanılan klasik
yöntemlerden bir diğeridir. Regresyon analizinin amacı, noktalara en yakın doğruyu
çizebilmek için a ve b katsayılarını kestirmektir ( bxay ). a ve b katsayılarının
testi 0’a karşı yapılır. Fakat uyumu göstermede regresyon analizi kullanılacaksa,
21
regresyon eğrisi a=0 ve b=1’e karşı test edilmelidir. Yani iki metoda ait değerler
saçılım grafiğinde eşitlik doğrusu (line of equality) üzerinde olmalıdır.
6. Regresyon analizi X bağımsız değişkeni ile Y bağımsız değişkeni arasındaki
ilişkiyi inceler. Uyumu göstermede regresyon analizi kullanılırken hangi yönteme
ait verilerin X, hangilerinin Y olarak kabul edilmesi gerektiğine dair bir bilgi yoktur
(Saraçlı, 2009).
7. Regresyon analizinde, iki metot ile yapılan ölçüm sonuçlarından birincisi Y,
ikincisi X ölçümleri olarak düşünüldüğünde, klasik regresyon yöntemleri
doğasından dolayı X metodu ile yapılan ölçümlerin hata içermediği, mevcut hatanın
Y metodundan kaynaklandığı varsayılır. X metodu ile elde edilen ölçümlerde
meydana gelebilecek hatalar dikkate alınmadığından yanlış sonuçlara ulaşılacaktır.
Klasik istatistik yöntemlerinin yukarıda bahsedilen dezavantajlarından dolayı, bu
yöntemlere alternatif olarak, Bland ve Altman iki metoda ait ölçümler arasındaki
uyumu değerlendirmek için farklı bir istatistiksel yöntem önermişlerdir ve zaman
içersinde Bland-Altman yönteminin kullanım sıklığının arttığı gözlenmiştir. 1995
yılında yayınlanan metot karşılaştırma çalışmalarında Bland - Altman yönteminin
kullanım oranı %8 iken, bu oran 1996 yılında %14, son yıllarda ise %31-36’lara
kadar artmıştır (Mantha, 2000).
Bland ve Altman tarafından geliştirilen uyum sınırları (Limits of Agreement
(LOA)), iki metodun uyumunu değerlendirirken yaygın olarak kullanılan bir
yöntemdir. Bu yöntem, ilk olarak iki metodu karşılaştırmak için kullanılmış, daha
sonraları J metodun ikili karşılaştırmaları için de kullanılmaya başlanmıştır
(Barnhart, 2007).
Bland – Altman yönteminin ilk adımı, aynı denek üzerinden iki metot ile elde edilen
değerlerin farklarının alınmasıdır (Barnhart, 2007). Daha sonraki aşamada ise, iki
metottan elde edilen ölçümlerin ortalamasına karşı saçılım grafiği çizilir. Bu grafik,
22
tanımlayıcı yöntemler konusunda daha önce bahsedildiği gibi, ölçüm hataları
(farklar) ve gerçek değerler (gerçek değerler genellikle elde edilemediğinden onun
en iyi kestiricisi olan ortalamalar) arasında olabilecek herhangi bir ilişkinin
incelenmesine de olanak sağlar. Ayrıca bu grafikten yanlılığın (bias) (farkların
sistematik olarak sıfırdan farklı olup olmadığının) ve hatanın (farkların ne kadar
yaygın olduğunun) incelenmesi de mümkündür (Genç ve ark., 2003).
Örneklemdeki deneklerden elde edilen değerlere ait farkların ortalaması (metotlar
arası fark) tahmin edilen yanlılıktır. Ayrıca, farkların standart sapması ( DS ) ise, bu
ortalama etrafındaki rastsal dalgalanmaların ölçülmesini sağlar.
Farklar ve ortalamalar arasında ilişki yoksa iki metot arasındaki uyum, farkların
ortalaması ( d ) ve standart sapması ( DS ) kullanılarak incelenebilir.
21 iii YYD , i. denek üzerinden, iki metot ile elde edilen tek (single) ölçüm
değerleri arasındaki fark olsun. iD ’lerin normal dağıldığı varsayımı altında
)( iD DE ve )(2
iD DVar ’dir. Bulunan farklar normal dağılıma sahip
olduğunda, farkların sıfırın etrafında rastgele dağılması ve %95’inin “ DD 96.1
ile DD 96.1 ” arasında olması beklenir. Bu durum altında ortalamalar ve farklar
arasında ilişki olmadığı söylenebilir. Bu yöntemde, DD 96.1 “uyum sınırları”
olarak adlandırılır ve iki metot ile elde edilen ölçüm değerleri arasındaki farkların
%95’inin uyum sınırları arasında olması beklenir. Küçük örneklemler için uyum
sınırları bulunurken, tablo değerini (n-1) serbestlik derecesi için t tablosundan
yararlanarak bulmak daha doğru olacaktır. (Barnhart, 2007, Genç ve ark., 2003).
Uyum sınırları daha açık bir ifadeyle şu şekilde açıklanabilir. Metot-1 biyokimyasal
bir değeri ölçmede rutin olarak kullanılan bir metot olsun. Metot-2 ise, Metot-1
yerine kullanılması düşünülen yeni bir metot olsun. D= Metot-1 - Metot-2 olarak
düşünüldüğünde, Metot-1 ile elde edilen ölçüm değerleri ve Metot-2 ile elde edilen
23
değerleri arasındaki fark %95 güven düzeyinde DD 96.1 arasında olmalıdır. Bu
sınırların kabul edilebilir düzeyde olup olmadığının istatistiksel bir cevabı yoktur.
Buna araştırmayı planlayan kişi karar verebilir. Kabul edilebilir uyum sınırlarına,
veriler toplanmaya başlanmadan önce çalışma planlandığı zaman karar verilmelidir.
İstatistiksel olarak bulunan limitin mutlak değeri, kabul edilebilir fark ( 0d )
değerinden daha az ise, iki metodun uyumunun iyi olduğu söylenebilir, yani iki
metot için bulunan “uyum sınırları” (farkların ortalaması DS96.1 ) klinik olarak
anlamlı ise, iki metodun değişimli olarak kullanılabileceği sonucuna varılır.
Tekrarlı olmayan veriler için uyum sınırları, D yerine iD ’nin örneklem ortalaması
olan d , 2
D yerine de iD ’nin örneklem varyansı olan 2
DS konarak tahmin edilebilir.
Farkların normal dağıldığı varsayımı sağlandığında, uyum sınırları için güven
aralıkları ve standart hata hesaplanabilir. n örneklem genişliği olduğunda, d ’nin
varyansı n
SD
2
, DS ’nin varyansı ise yaklaşık olarak )1(2/2 nSD olarak tahmin edilir.
Çünkü 2
DS ’nin dağılımı )1/(22 nD şeklindedir ve 2 ’nin varyansı yaklaşık
olarak 2
1’dir. Bu durumda uyum sınırlarının varyansı aşağıdaki gibi olur (Barnhart,
2007, Bland ve Altman, 1999):
)(96.1)()96.1( 2
dd SVardVarSdVar
)1(2
96.12
22
n
S
n
S dd
22
)1(2
96.11dS
nn
(1.1)
n yeterince büyük olduğunda bu eşitlik, aşağıdaki ifadeye yaklaşır:
n
SSdVar d
d
22
2
96.11)96.1(
24
n
Sd
2
92.2
n
S
n
S dd
22
392.2 (1.2)
olur. Bu durumda tahmin edilen uyum sınırlarının standart hatası,
n
SSdSE d
d
2
3)96.1(
)(71.1 dSE (1.3)
olacaktır.
Uyum sınırlarına ait varyansın bulunmasının amacı, tahmin edilen uyum sınırının
kesinliğini (precision) belirleyebilmektir.
Farklar ve ortalamalar arasında ilişki olmadığında, n örneklem genişliği olduğunda
%95 güven düzeyinde n-1 serbestlik derecesi ile t tablosundan yararlanılarak
farkların ortalaması )(d için güven aralığı,
n
SDtd (1.4)
olarak bulunur.
Tahmin edilen uyum sınırları için %95 güven aralığı (GA) ise aşağıdaki gibi elde
edilir (Barnhart, 2007, Mantha ve ark., 2000):
Uyum alt sınırı için güven aralığı
25
Ortalama için GA - 1.96 DS =
n
StSd D
D
2
3)96.1(
Uyum üst sınırı için güven aralığı
Ortalama için GA + 1.96 DS =
n
StSd D
D
2
3)96.1( (1.5)
Farklar ve ortalamalar arasında ilişki gözlenirse, uyum sınırları yukarıda verilen
yöntemle bulunamaz. Fark ve ortalama arasında ilişki olmaması gerekliliği,
sonuçların diğer popülasyonlara genellenmek istenmesinden doğar. Bu problemi
ortadan kaldırmak için uygulanabilecek ilk yöntem verilere logaritmik dönüşüm
uygulamaktır. Bu yöntemle var olan bu ilişki ortadan kaldırılabilirse uyum sınırları
anti-logaritma kullanılarak tekrar hesaplanabilir.
1.2.1.2.1.2. Karşılaşılabilecek Problemler ve Çözüm Yolları
Metot karşılaştırma çalışmalarında karşılaşılabilecek en önemli problemler, farklar
ile ortalamalar arasında ilişki olması durumu ve sabit olmayan varyanslılık
durumudur.
Farklar ve ortalamalar arasında ilişki olmaması ve ölçüm değerleri aralığı boyunca
varyansların sabit olması (homoscedasticity) anlamına gelen sabit varyanslılık
varsayımlarının sağlanıp sağlanmadığı, Bland – Altman saçılım grafiğinde görsel
olarak fark edilebilir. Bu problemlerin giderilebilmesi için literatürde en sık
kullanılan yöntem logaritmik dönüşüm ve regresyon yöntemleridir.
1.2.1.2.1.2.1. Logaritmik Dönüşüm
Metot karşılaştırma çalışmalarında yukarıda bahsedilen problemlerden biriyle
karşılaşıldığında, daha hızlı ve kolay yorumlanabildiği için öncelikle logaritmik
26
dönüşüm yöntemine başvurulur. Analize başlamadan önce her iki ölçüm değerine
uygulanan logaritmik dönüşüm, standart yaklaşımı kullanmaya olanak tanır (Bland
ve Altman, 1999). Prensipte diğer dönüşümler de kullanılabilirken (karekök alma ya
da tersini alma gibi), sadece logaritmik dönüşümün orijinal verilerle ilgili kolayca
yorum yapılabilmesine olanak tanıması tercih edilmesini sağlar.
Logaritmik dönüşüm uygulandıktan sonra elde edilen sonuçlar farkların yüzdesel
logaritmik değerleri olduğundan yorumlanması oldukça güçtür. Verilere logaritmik
dönüşüm uygulandığında, çıkan sonuçlar ilgili verilerin logaritmik oranlarıdır.
Ancak, logaritmik dönüşüm uygulanan verilere geri-dönüşüm (anti-log)
uygulandığında, y ekseninde gerçek ölçüm değerlerinin oranlarına ait sınırlar elde
edilirken; x ekseninde gerçek değerlerin geometrik ortalaması elde edilir (Bland ve
Altman, 1999, Carstensen, 2010). Böylelikle, logaritmik değerlerin farklarıyla
uğraşmak yerine, kolaylıkla her bir denek için elde edilen iki ölçüm değerinin oranı
hesaplanabilir ve bu değerlerin ortalaması ve standart sapması kullanılarak Şekil
1.9’da görüldüğü gibi ilgili uyum limitleri hesaplanabilir (Bland ve Altman, 1999).
Bu nedenle, logaritmik dönüşüm uygulanan veriler hakkında yorum yapmak
kolaydır.
Bir örnekle anlatılacak olursa, Bland ve Altman’ın 1999 yılında yayınladıkları
makalede denekler üzerinden kan basıncı değerleri elde edilmiş ve elde edilen
Bland- Altman grafiği (Şekil 1.9.a) yardımıyla farklar ve ortalamalar arasında ilişki
olduğu gözlenmiştir. Bu probleme çözüm olarak, verilere logaritmik dönüşüm
uygulanmıştır. Logaritmik dönüşüm uygulandığında ise, bu ilişkinin giderildiği
görülmektedir (Şekil 1.9.b). Bahsedilen grafikler aşağıdaki gibidir:
27
Şekil. 1.9. İki farklı metotla elde edilen kan basıncı değerleri.
a. Logaritmik dönüşüm uygulanmayan verilere ait Bland-Altman grafiğidir.
b.Verilere logaritmik dönüşüm uygulanmış verilere ait grafiktir.
Standart sapmanın ölçüm büyüklükleri ile birlikte artması durumunda, Bland-
Altman logaritmik dönüşümü önerirken; diğer bazı araştırmacılar y eksenindeki
değerlerin yüzde değerlerinin bulunmasını önermişlerdir ve bu yaklaşımlar arasında
sonuçların çok farklı bulunmadığını gözlemlemişlerdir. Bazı çalışmalarda, örneğin
Haixin Lei ve arkadaşlarının (2002) Clinical Chemistry’de yayınladıkları makalede,
yüzdesi alınmış verilerin grafiğinin çizilmesi tercih edilmiştir. Çünkü bu durumda,
verilere geri dönüşüm uygulamaya gereksinim duyulmadan veriler grafikten direkt
olarak okunabilmektedir.
Verilerin yüzdesini alarak değerlendirme yapmak yaygın olarak kullanılan bir
yöntem olmadığından, bu tez çalışmasında dönüşüm uygulanması gereken bir
durumla karşılaşılması durumunda logaritmik dönüşüm kullanılacaktır.
1.2.1.2.1.2.2. Regresyon Yaklaşımı
Bazı durumlarda, farklar ve ortalamalar arasındaki ilişki karmaşık olabilir ve
logaritmik dönüşüm bu problemi çözmede yeterli olmayabilir. Örneğin, metotlar ile
28
elde edilen ölçüm değerlerinden küçük olanlar için farklar bir yönde eğilim
gösterirken; büyük ölçüm değerleri için diğer yönde eğilim gösterebilir. Logaritmik
dönüşüm, ölçüm değerlerinin büyüklüğü ile farklar arasındaki ilişkiyi gidermez
(Bland ve Altman, 1999).
Sabit varyanslılık varsayımının sağlanıp sağlanmadığı Bland – Altman saçılım
grafiği ile anlaşılabilir. Grafikte, ölçüm değerlerinin büyüklüğüne bağlı olarak
ölçüm değerleri arasındaki fark değerlerinin artması ya da azalması durumu
gözlenirse, bu probleme regresyon yaklaşımı kullanılarak çözüm getirilebilir
(Carstensen, 2010). Bu durumda ilk olarak, iki metoda ait ölçümlerin
ortalamalarının (A) bağımsız değişken, farklarının (D) bağımlı değişken olduğu
varsayılarak regresyon denklemi oluşturulur. Eğer ölçümlere ait saçılım grafiğinde
belirgin bir eğim yoksa regresyon denklemi aşağıdaki gibi olur:
AbbD 10
^
(1.6)
Eğim ( 1b ) istatistiksel olarak anlamlı değilse, ^
D farkların ortalaması olan d ’ye eşit
olur. Eğer 1b sıfırdan önemli düzeyde farklı ise, A (ortalama) olarak tahmin edilen
herhangi bir gerçek değer için Eşitlik 1.6.’dan metotlara ait ölçümler arasındaki fark
tahmin edilir.
Analizin ikinci aşamasında, mükemmel uyum doğrusu (line of best fit) etrafındaki
değişim dikkate alınır. A ile tahmin edilen ölçüm değerinin büyüklüğünün bir
fonksiyonu olarak Eşitlik 1.6.’dan, artıkların saçılım grafiği modellenir. Bu
modelleme, ölçüm değerinin büyüklüğü her ne olursa olsun artıkların normal
dağıldığı varsayımı altında yapılır. A bağımsız değişken ve artıkların mutlak değeri
R olduğunda aşağıdaki eşitlik elde edilir:
AccR 10
^
(1.7)
29
Eğer artıklar sıfır ortalama ve 2 varyans ile normal dağılıyorsa, artıkların mutlak
değeri /2 ortalama ile yarı-normal dağılıma* sahip olur. Böylece, artıkların
standart sapması sabitlenmiş değerlerin 2/ ile çarpılması ile elde edilir. Uyum
sınırları ise, yukarıda gösterilen iki regresyon modelinin birleştirilmesi ile elde edilir
(Carstensen, 2010, Bland ve Altman, 1999).
Eğer DS sabit değilse, ilişkiyi belirlemek için doğrusal regresyon yeterli olacaktır.
Ancak, eğer R ve A arasında önemli bir ilişki yoksa, tahmin edilen standart sapma
Eşitlik 1.6.’da elde edilen artıkların yani düzeltilmiş farkların standart sapmasıdır.
Genel bir ifadeyle, metotlar ile elde edilen ölçüm değerlerinin farklarının beklenen
değeri AbbD 10
^
’dir ve %95 güven düzeyinde uyum sınırları,
^^^^
46.22/96.1 RDRD
veya
AccAbb 1010 46.2 (1.8)
olarak elde edilir.
* Yarı-normal dağılımın 1 standart sapma ile beklenen değeri
0
0
22 |)2/)[exp(2/2()2/exp()2/2()( xdxxxXE
/2)10)(2/2(
30
1.2.1.2.2. Tekrarlanabilirlik (Repeatability)
Tekrarlanabilirlik, aynı koşullar altında elde edilen (aynı metot, aynı laboratuar,
benzer zaman dilimi, her iki ölçüm için de aynı metodu kullanan aynı gözlemci vb.)
ve aynı denek üzerinde tekrar eden ölçümler arasındaki değişimin bir ölçüsüdür.
Aynı denek üzerinden tekrarlı ölçümler alınırken, her bir ölçüm değeri birbirinden
bağımsız olarak elde edilir. Böylelikle, araştırmacının elde ettiği her bir ölçümün bir
önceki ölçüm veya ölçümlerden bağımsız bilgiler içerdiği sonucuna varılabilir.
Pratikte, bu durumu sağlamak zor olabilir; ancak ölçümlerin bu şekilde alınması
sonuçların daha sağlıklı çıkmasını sağlayacaktır (Bland ve Altman, 1999).
Bu ölçüt, bir metodun kullanılabilir olup olmadığına karar vermede önemli bir role
sahip olduğu gibi iki metodu karşılaştırırken de kullanılır. Ancak ilginçtir ki, tekrarlı
ölçümler metot karşılaştırma çalışmalarında nadiren kullanılır. Bu nedenle de, metot
karşılaştırma çalışmaları için önemli olan bir detay göz ardı edilmiş olur. Her bir
metot ile her bir denek üzerinden yalnızca bir ölçüm değeri elde edilirse, hangi
metodun tekrarlanabilirliğinin ya da kesinliğinin (precision) daha iyi olduğu tahmin
edilemez (Bland ve Altman, 1999).
Tekrarlanabilirlik, metotların uyumunu önemli ölçüde etkilemektedir. Metotlardan
birinin zayıf tekrarlanabilirliğe sahip olması, bir bakıma aynı denek üzerinden alınan
tekrarlı ölçümlerin oldukça büyük bir varyasyona sahip olduğu anlamına gelir. Bu
durumda, iki metot arasındaki uyumunun da zayıf olması kaçınılmazdır. İki metoda
ait ölçümlerin ortalama olarak birbirleriyle uyum düzeyi çok benzer olsa bile,
metotlardan biri zayıf tekrarlanabilirliğe sahipse bu iki metot arasındaki uyumun
zayıf olmasına neden olur. Referans metot, zayıf tekrarlanabilirliğe sahipse, yeni
metot mükemmel olsa bile referans metot ile uyumlu çıkmayacaktır. Eğer, her iki
metot da zayıf tekrarlanabilirliğe sahipse, problem daha da büyüyecek ve çok büyük
bir olasılıkla metotlar arasındaki uyum düzeyi zayıf olacaktır (Bland ve Altman,
1999, Genç ve ark., 2003).
31
Metot karşılaştırma çalışmalarında iki metot uyumlu çıkarsa, bu metotlardan
tekrarlanabilirliği yüksek olanın diğerine göre daha üstün olduğu söylenebilir (Genç
ve ark., 2003).
Aynı metot ile elde edilen tekrarlı ölçümler kullanıldığında o metoda ait
tekrarlanabilirliği ölçmek amacıyla, uyum sınırlarını belirlemek için kullanılan
yaklaşıma benzer bir yaklaşım kullanılır. Bir metodun tekrarlanabilirliğinin düşük
ya da yüksek olması, söz konusu metotların standart sapmaları kıyaslanarak
anlaşılabilir. Grup içi (within subject) standart sapma ya da iki ölçüm değeri
arasındaki farkların standart sapması, ws , tek yönlü varyans analizi (ANOVA)
kullanılarak tahmin edilebilir. Her bir standart sapma, aynı metot ile elde edilen iki
ölçüm değerine ait fark değerlerinin sınırlarını belirlemek için de kullanılabilir.
Analizi yapmak çok kolaydır. Çünkü genellikle aynı denekten elde edilen ilk ölçüm
ile ikinci ölçüm arasında sistematik bir fark olması beklenmediğinden, tekrarlar
arasındaki farkların ortalamasının sıfır olması beklenir. Şayet ilk ve ikinci ölçüm
değerleri arasında sistematik bir farklılık olursa, ölçüm değerlerinin gerçek tekrarlar
olmadığı sonucuna varılır (Bland ve Altman, 1999). Gerçek tekrar, ölçüm
değerlerinin aynı koşullar altında elde edilmesi olarak tanımlanır (Barnhart, 2007).
Metotlara ait tekrarlanabilirlik, tekrarlanabilirlik katsayıları hesaplanarak
karşılaştırılabilir. British Standards Institute (BSI) tarafından tanımlanan
tekrarlanabilirlik katsayısı hataların normal dağıldığı varsayımı altında ws296.1
veya ws77.2 olarak tahmin edilir. Deneklerin %95’i için aynı metot ile elde edilen
iki ölçüm değerine ait tekrarlanabilirlik değeri ws296.1 veya ws77.2 olacaktır.
Her bir metot için elde edilen tekrarlanabilirlik katsayıları, %95 güven düzeyindeki
uyum sınırları ile karşılaştırılabilir. %95 güven düzeyindeki uyum sınırları - ws77.2
ve ws77.2 aralığı ile benzerdir. Eğer metotlara ait tekrarlanabilirlik katsayıları ile
uyum sınırları benzerse, metotlar arasındaki uyumsuzluk, tekrarlanabilirliğin düşük
olması olarak açıklanır. Uyum sınırları, elde edilen tekrarlanabilirlik değerinden
32
önemli ölçüde genişse, iki metot arasındaki uyumu düşüren başka faktörler var
demektir (Bland ve Altman, 1986; Bland ve Altman, 1999).
Grup içi standart sapmanın kullanılması, sınıf içi korelasyon katsayısı gibi diğer
tekrarlanabilirlik yaklaşımlarının uygun olmadığı anlamına gelmez. Daha sonraki
bölümlerde diğer tekrarlanabilirlik yaklaşımları da açıklanacaktır.
1.2.1.2.2.1. Tekrarlı Ölçümler Kullanıldığında Uyumun Hesaplanması
Metot karşılaştırma çalışmalarında, iki metot ile aynı denek üzerinden tekrarlı
ölçümler alındığında, elde edilen bütün verilerin kullanılması gerekir. Bu durumda
akla gelecek ilk yöntem, her bir denek üzerinden her bir metotla elde edilen tekrarlı
ölçümlerin ortalamasının hesaplanması, ardından da iki metodu uyum sınırları
yöntemini kullanarak karşılaştırmak için, elde edilen bu ortalama çiftlerinin
kullanılmasıdır (Bland ve Altman, 1999). Daha anlaşılır bir şekilde anlatılacak
olunursa, yukarıdaki adımlar uygulandığında veri şemasında, her bir metot ile her
bir denek üzerinden tek bir ölçüm değeri alınması durumundaki görüntü elde edilir.
Yanlılığın tahmini, ortalamaların kullanılmasından etkilenmeyecektir; fakat farklara
ait standart sapmanın tahmini oldukça küçük olacaktır. Çünkü bazı ölçüm
hatalarının etkisi ortadan kalkacaktır. Burada esas ilgilenilen, tekrarlı ölçümlerin
ortalamaları arasındaki farkların değil, tek ölçümler (single measurements)
arasındaki farkların standart sapmasıdır (Bland ve Altman, 1999). Ancak klasik
yaklaşımda, çoklu ölçümlerin kullanılması daha uygunken, standart klinik ölçümün
tek bir değer (single value) olduğu varsayılır. Örneğin, maksimum nefes alış hızı
(peak expiratory flow) gibi klinik çalışmalarda aynı denek üzerinden elde edilen iki
veya daha fazla tekrarlı ölçüme ait ortalamanın kullanılması alışılmış olandır ve bu
durumda uyum sınırları yöntemi ortalamalar üzerinde direk olarak uygulanır.
Tekrarlı ölçümler için iki farklı durum ele alınabilir. İlk durum, aynı denek
üzerinden elde edilen ölçüm değerlerinin deney süresi boyunca değişmemesi, yani
33
gerçek değerin değişmemesi durumudur. Bu duruma, aynı gün içinde alınan
şahdamarı arter daralması verileri örnek gösterilebilir. Bu gibi değerler, aynı gün
içersinde önemli bir değişim göstermezler. İkinci durum ise, deney süresince elde
edilen kan basıncı, vücutta günlük bazı kimyasalların salgılanması veya bir durumun
farklı koşullar altında öncesi ve sonrası ölçümleri gibi ölçüm değerlerinin sabit
olmaması, yani gerçek değerin değişmesi durumudur. Bu gibi değerler ise, anlık
değişimler gösterebilirler.
Yukarıda açıklanan ilk durum için her bir metot ile her bir denekten elde edilen
tekrarlı ölçüm sayısının eşit olması gerekliliği yok iken; ikinci durumda her bir
metot ile her bir denekten elde edilen tekrarlı ölçüm sayılarının eşit olması gerekir.
Bir sonraki bölümde, eşit sayıda tekrarlı ölçümler alınması ve eşit sayıda olmayan
tekrarlı ölçümler alınması durumları için uyum sınırlarının nasıl bulunduğu
anlatılacaktır (Bland ve Altman,1999; Bland ve Altman, 2007).
1.2.1.2.2.1.1. Gerçek Değerin Değişmediği Durumlarda Her Bir Denek
Üzerinden Eşit Sayıda Tekrarlı Ölçüm Elde Edilmesi Durumu
Her iki metot aracılığıyla aynı denek üzerinden tekrarlı ölçümler alındığında, her bir
metotla elde edilen ölçüm değerleri, yaklaşık olarak o denekten o metot ile elde
edilen ölçümlerin beklenen değeri (ortalaması) etrafında dağılır. Bu ortalamaların
her iki metot için de aynı olması şart değildir. Metotlara ait ölçümlerin ortalamaları
arasındaki fark denekten deneğe değişecektir. Bu değişkenlik metot x denek
etkileşimini meydana getirecektir. İki metoda ait ölçümler X ve Y ile gösterilecektir.
Burada, her bir metot aracılığıyla ölçülen tek ölçümler (single measurements)
arasındaki farka (D = X – Y) ait varyans ile ilgilenilecektir. Her bir metot için
varyans ayrı ayrı incelenecek olursa:
Var (X) = 222
xwxIt
Var (Y) = 222
ywyIt
34
Burada 2
t gerçek değerlere ait varyans, 2
xI ve 2
yI metot x denek etkileşimine ait
varyans, 2
xw ve 2
yw ise aynı metotla elde edilen ölçümlere ait grup içi varyansı
göstermektedir. Her bir metotla elde edilen tek ölçüm değerleri (single
measurements) için gruplar arası farklara ilişkin varyans ise aşağıdaki formül ile
bulunur:
22222)( ywxwyIxIDYXVar (1.9)
Bu varyans değerinin, her bir denek üzerinden elde edilen ölçümlere ait ortalamalar
( YXD ) kullanılarak elde edilmesi istenir ve böylece )( YXVar değerine
ulaşılabilir. Bu durumda, tekrarlara ait ortalamaların kullanılması nedeniyle grup içi
(within subject) varyans azalacaktır; fakat bu deneğe özgü (patient-specific) farkları
gösteren etkileşim terimini etkilemeyecektir. Böylece,
x
xwxIt
mXVar
222)(
bulunur.
Burada xm , X metoduyla elde edilen her bir deneğe ait gözlem sayısını
göstermektedir.
Benzer olarak,
y
yw
yItm
YVar
2
22)(
olur. Böylece,
35
y
yw
Iy
x
xwxI
mmDVarYXVar
2
22
2)()(
olarak elde edilebilir.
D ’nin dağılımı yalnızca hata ve etkileşime bağlıdır. Çünkü gerçek değerler, farkları
alınan X ve Y’nin her ikisini birden içermektedir. Her iki metotla her bir denekten
elde edilen ölçüm değerlerinin farklarına ilişkin varyans değerini bulmak için Eşitlik
1.9’dan aşağıdaki formül elde edilir:
22 11
11)()( yw
y
xw
x mmDVarYXVar
(1.10)
2
ds , grup-içi ortalamalar arasındaki farklara ait gözlenen varyans olduğunda,
düzeltilmiş varyans da denilen 2)( dYXVar değeri aşağıdaki Eşitlik 1.11 ile
tahmin edilir:
2222^ 1
11
1 yw
y
xw
x
dd s
ms
ms
(1.11)
Çalışmalarda yaygın olarak her bir metotla her bir denekten yalnızca iki ölçüm
değeri elde edilmesi nedeniyle Bland-Altman şu formülü öne sürmüştür:
22
222
2^ywxw
dd
sss
Standart hatanın yaklaşık olarak değeri ve uyum sınırları için güven aralığı
aşağıdaki gibi bulunur. Ölçüm hatalarının dağılımı normal dağılıma sahiptir ve
bağımsızdır. Ölçüm hataları, n denek için n( 22 /)1 xwxwx sm , n ( )1xm serbestlik
36
derecesi ile ki-kare dağılımına sahiptir ve bu nedenle 2n ( )1xm varyansa sahiptir.
Böylece,
)1(
2)(
42
x
xwxw
mnsVar
)1(
2)(
4
2
y
yw
ywmn
sVar
(1.12)
Eşitlik 1.11’de verilen düzeltme teriminin varyansı ise,
22 1
11
1 yw
y
xw
x
sm
sm
Var
)1(
211
)1(
211
42
42
y
yw
yx
xw
x mnmmnm
(1.13)
2
4
2
4 )1(2)1(2
y
ywy
x
xwx
nm
m
nm
m
(1.14)
olur.
Benzer olarak, 2
ds ’nin varyansı ise
1
2)(
4
2
nsVar d
d
(1.15)
olur.
Eşitlik 1.14 ve 1.15’de elde edilen değerler ile, Eşitlik 1.11’den elde edilen
denkleme ilişkin varyans,
2
4
2
442^ )1(2)1(2
1
2)(
y
ywy
x
xwxdd
nm
m
nm
m
nVar
(1.16)
37
elde edilir.
İyi bilinen,
)var()(
))((
2
)(
zdz
zdfzfVar
zEz
durumundan, aşağıdaki
2
)(2
1)(
zEzzzVar
)(
)(4
1)( zVar
zEzVar
sonucu elde edilir.
)(^
dVar için,
2
4
2
44
2
^ )1(2)1(2
1
2
4
1)(
y
ywy
x
xwxd
d
dnm
m
nm
m
nVar
=
2
4
2
44
2
)1()1(
12
1
y
ywy
x
xwxd
d nm
m
nm
m
n
(1.17)
Farklarının ortalamasının ( d ) varyansı nd
2^
olarak tahmin edilir ve ortalama ve
farkların standart sapması bağımsızdır. Bu tahminler Eşitlik 1.18’de yerine
konulacak olursa, uyum sınırlarının ( dd^
96.1 ) varyansı aşağıdaki formül ile
tahmin edilir:
2
4
2
44
2^
22^
^ )1()1(
12
96.1)96.1(
y
ywy
x
xwxd
d
dd
nm
sm
nm
sm
n
s
ndVar
(1.18)
38
2 yx mm olduğunda bu eşitlik aşağıdaki gibi olur:
n
s
n
s
n
s
ndVar
ywxwd
d
dd
4412
96.1)96.1(
444
2^
22^
^
1 yx mm olduğunda yani ölçümler tekrarlı olarak alınmadığında, d
^
’nin yerine
direkt ds ’nin tahmini kullanılır ve böylece tıpkı Bölüm 1.2.1.2.1’deki gibi,
12
96.1)96.1(
4
2
22^
n
s
sn
sdVar d
d
dd
=
)1(2
96.11 22
nnsd
olur.
Böylece,
)1(2
96.11)96.1(
22
^
nnsdSE dd
olur. Bu değerler uyum sınırlarının %95 güven aralıkları için de kullanılır.
Burada standart hatayı bulmak için kullanılan formül, Bölüm 1.2.1.2.1.’deki gibi
metotlar ile yalnızca tek bir ölçüm elde edildiğinde kullanılan formül ile benzerdir.
Tekrarlı ölçümlerin kullanılması yalnızca her bir metodun kesinliğinin (precision)
eksikliğinden ve metot x denek etkileşimi bileşeninden kaynaklanan varyansı bir
miktar azaltmaktadır. Eğer bu çok büyükse (yani eğer bir deneğe ait tekrarlı
ölçümlerin farkı çok fazlaysa), her bir denek üzerinden daha fazla tekrarlı ölçümün
alınması uyum sınırlarının kesinliğini arttırmayacaktır. Bu nedenle, her bir denek
39
üzerinden iki tekrarlı ölçüm alınması savunulur. Böylece, her bir metot ile her bir
denek üzerinden iki tekrarlı ölçüm alındığında metotların tekrarlanabilirliği daha
kolay incelenebilir.
1983 yılında Bland ve Altman tarafından yayınlanan makalede metot x denek
etkileşimi göz ardı edilmiştir; ancak yine Bland ve Altman tarafından 1999 yılında
yayınlanan makalede daha önce kullandıkları yaklaşımın yetersiz olduğunu kabul
edip, daha üstün olan bu yaklaşımı makalelerinde sunmuşlardır.
1.2.1.2.2.1.2. Gerçek Değerin Değişmediği Durumlarda Her Bir Denek
Üzerinden Eşit Sayıda Olmayan Tekrarlı Ölçüm Elde Edilmesi
Bu bölümde, her bir denek üzerinden farklı sayıda tekrarlı ölçüm alınması durumu
incelenecektir. X ve Y metodu ile i. denek üzerinden alınan ölçüm sayıları xim ve
yim notasyonları ile gösterilecektir. iW , ortalama ve 2 varyansa sahip olan
im gözlemin ortalaması olduğunda, varyans im/2 olacaktır. Bu durumda,
ortalamaların beklenen varyansı aşağıdaki gibidir:
211
)(
i
imn
WVar (1.19)
i.denek için, X metodu ile elde edilen xim gözlem; Y metodu ile elde edilen yim
gözlem vardır. Her bir denek için, iki metotla elde edilen ölçümlerin ortalamaları
arasındaki fark hesaplanır, ardından da bu farkların varyansları hesaplanır. Bu
varyansın beklenen değeri ise Eşitlik 1.20’deki gibi tahmin edilir:
2222 1111)( yw
yi
yIxw
xi
xImnmn
DVar
(1.20)
40
Böylece xxi mm ve yyi mm olduğunda, bulunan bu değerler Eşitlik 1.10’da
yerine konulursa aşağıdaki formül elde edilir:
22 111
111)()( yw
yi
xw
xi mnmnDVarDVar
(1.21)
Eşit sayıda tekrarlı ölçümler olmaması durumunda, kontrol edilmesi gereken ilk
varsayım, deneklere ait ortalamaların varyanslardan bağımsız olması durumudur.
Her bir metot için ayrı ayrı, denekler içi standart sapmaya karşı denek
ortalamalarının saçılım grafiği çizildiğinde ortalamalar ve varyanslar arasında bir
ilişki olmadığı gözlemlenebilir. Aynı şekilde, her bir denek için iki metodun
ortalamalarına karşı farklarının saçılım grafiği çizilebilir. Yine aynı şekilde
bağımsızlık varsayımı sağlanmalıdır. Metotların her biri için ayrı ayrı tek yönlü
varyans analizi kullanılarak 2
xw ve 2
yw bulunur. Bu durumda,
ximn
11 ve
yimn
11
birbirine eşit olur. Çünkü her bir denek dengelenir.
1.2.1.2.2.1.3. Gerçek Değerin Değiştiği Durumlarda Tekrarlı Ölçümler ile
Oluşturulan Eşleştirilmiş Çiftler
Bölüm 1.2.1.2.2.1.1 ve 1.2.1.2.2.1.2’de gerçek değerin değişmediği yani sabit
olduğu varsayılmıştı; ancak bazı durumlarda gerçek değerin sabit olması mümkün
değildir. Klinik çalışmalarda, kan basıncı gibi bazı değerler kısa zaman dilimleri
içinde bile değişiklik gösterebilir. Gerçek değerin çiftten çifte değiştiği durumlarda,
iki metot ile her bir denek üzerinden elde edilen ölçüm değerleri eşleştirilir ve
varyans bileşenleri yöntemi yardımıyla uyum sınırları elde edilir. Eşleştirilmiş her
41
bir ölçüm çiftinin farkları kullanılır. i.denek üzerinden j. ölçüm çiftinin farkı için
model,
ijiij EIBD
olur.
Bu modelde, B sabit yanlılık değerini, iI metot x denek etkileşim terimini, ijE ise,
ilgili ölçüm çiftinin için denek içi rastsal hatasını belirtmektedir. ijD ’nin varyansı
ise,
222
dwdId
dir.
2
dI ve 2
dw değerleri tek yönlü varyans analizi yöntemi yardımıyla tahmin edilebilir.
n denek ve i.denek için im tane gözlem çiftinin olduğu varsayılsın. Varyans analizi
sonucunda, denekler-içi ya da hatanın kareler ortalaması ( wMS ) ve denekler-arası
kareler ortalaması ( bMS ) elde edilir. Buradan, wdw MS2^
ve
wb
i
iidI MSMS
mn
mm
)1(
222^
olur. Bu tahmin değerlerinin toplamı ise 2^
d değerini verir. id i.denek için farkların
ortalaması olduğunda, ortalama yanlılık ( d ),
i
ii
m
dm olarak tahmin edilir.
Böylece, %95 güven düzeyinde uyum sınırları tahmin edilebilir.
42
1.2.1.2.3. Tekrar Elde Edilebilirlik (Reproducibility)
Tekrar elde edilebilirlik, farklı koşullar altında, aynı metot ile aynı denek üzerinden
elde edilen ölçüm değerlerinin değişiminin ya da kesinliğinin (precision) ölçüsüdür.
Tekrarlanabilirlik gibi tekrar elde edilebilirlik de tekrarlı ölçümler ile çalışıldığında
değerlendirilebilir (Carstensen, 2010). FDA (2001), tekrar elde edilebilirliği iki
farklı laboratuarda elde edilen ölçümlerin ya da kısa bir zaman periyodunda aynı
işlem koşulları altında metotlar ile elde edilen ölçüm değerlerinin kesinliği olarak
tanımlar. ISO (1994) ise, tekrar elde edilebilirliği, tekrar elde edilebilirlik koşulları
altında ölçümlerin aynı metotla aynı (identical) denekler üzerinden; ancak farklı
gözlemcilerin farklı donanımlar kullanarak farklı laboratuarlarda elde edildiği
bağımsız test sonuçları arasındaki uyumun yakınlığı olarak tanımlar.
Literatürde yaygın olarak ISO’nun tanımı kullanılır. Bu terim daha geniş bir şekilde
tanımlanacak olursa, tekrar elde edilebilirlik olası bütün koşullar altında, aynı
denekler üzerinden elde edilen ölçümler arasındaki uyumun yakınlığıdır. Bütün olası
koşullardan kasıt, pratikte farklı laboratuardan farklı gözlemciler vb. gibi somut
durumlar ile elde edilen ölçümlerdir. Ancak bir çalışmada tekrar elde edilebilirlik
değerlendirilmek isteniyorsa, ölçümler alınırken elde edilen ölçüm değerinin (kan
basıncı gibi) zaman içinde değişmediğinden emin olunmalıdır.
Tekrar elde edilebilirlik rastgele seçilen farklı laboratuar, farklı donanımlar vb.
arasındaki değişimi değerlendirir ve pratikte metot karşılaştırma çalışmalarında
nadiren kullanılır.
43
1.2.1.3. Ölçeklendirilebilen Uyum İndisleri (Scaled Summary Indices)
1.2.1.3.1. Sınıf-İçi Korelasyon Katsayısı (Intraclass Correlation Coefficient)
Güvenilirlik (reliability), bir ölçümün rastsal hatadan arınmış olması, ölçümlerin
tekrarlanabilirliği ya da tekrarlı ölçümlerin tutarlılığı olarak tanımlanır. Yani aynı
koşullar altında, aynı ölçüm metodu ya da gözlemci ile aynı denekten alınan tekrarlı
ölçümlerin aynı yanıtı vermesi ölçümün güvenilir olmasının koşuludur.
Bland ve Altman’ın 1996 yılında yayınladıkları makalede bir ölçüm metoduna ait
güvenilirlik, o metot ile elde edilen tekrarlı ölçümler arasındaki korelasyon olarak
tanımlanmıştır (Bland ve Altman, 1996).
Sağlık bilimlerinde, daha çok gözlemci uyumunun incelendiği güvenilirlik
çalışmalarına sıkça rastlanmaktadır; ancak bu çalışma, metotlar arasındaki uyum
incelendiğinden gözlemci yerine metot uyumunun güvenilirliğine dair bir çalışma
olacaktır.
Bu tür çalışmalarda en temel amaç, aynı denekten elde edilen çoklu ölçümlerin
uyumunun değerlendirilmesidir. Bir denekten elde edilen çoklu ölçüm, aynı metot
ile alınan tekrarlı ölçümler olabileceği gibi, iki ya da daha fazla sayıda metot ile
alınan ölçümler de olabilir (Çizelge 1.1). Ölçümler sürekli olduğunda, ilk durumda,
metot-içi uyum, ikinci durumda ise metotlar-arası uyum, sınıf içi korelasyon
katsayısı (SKK) ya da uyum ilişkisi katsayısı kullanılarak değerlendirilir (Ateş ve
ark., 2009).
SKK aynı sınıfa ait ölçümler arasındaki ilişki miktarını belirlemek amacıyla
geliştirilmiştir. Örneğin, bir batında doğan yavruların ağırlıkları (g) arasındaki ilişki,
ikizlerin IQ değerleri veya kan basınçları arasındaki ilişkinin ölçümünde SKK
kullanılır.
44
SKK, toplam varyansın grup-içi ve gruplar-arası varyans olarak ayrılması ile elde
edilen varyans tahminlerinin kullanılarak elde edildiği bir korelasyon katsayısıdır
(Bruton ve ark., 2000). En temel tanımıyla SKK, deneklerden elde edilen ölçümlere
dayanan varyansların oranıdır ve aynı sınıfa ait ölçümler arasındaki ilişki miktarını
belirlemek amacıyla geliştirilmiştir (McGraw ve Wong, 1996).
Çizelge 1.1. Sınıf içi korelasyon katsayısının hesaplanmasında kullanılan veri seti
için uygun notasyonel veri seti
22
2' )(
DİDA
DAijij yycorrSKK
(1.22)
Bu eşitlikte kullanılan, 2
DA ; denekler arası varyansı, 2
Dİ ; denekler içi varyansı
ifade etmektedir.
Üzerinde çalışılan veri, Çizelge 1.1’de de gösterildiği gibi, n değerlendirilen birim
(denek) ve değerlendirilen birimler hakkındaki k farklı değerlendirmeden
oluşmaktadır. Değerlendirilen birimlerin daha geniş bir populasyondan rastgele
seçilmiş bir örneklem olduğu varsayılarak SKK’nın tahmini değeri, bu veriye
uygulanan varyans analizi sonucunda elde edilen kareler ortalamasına
dayandırılmaktadır (McGraw ve Wong, 1996).
45
Temelleri ilk olarak Fleiss ve Shrout tarafından atılan SKK’nın farklı deney
düzenlerinde kullanılmak üzere geliştirilmiş çok sayıda türü bulunmaktadır. Buna
bağlı olarak, çalışmanın tasarımı, amacı ve ölçümlerin elde edilme şekline bağlı
olarak SKK hesaplamasında kullanılan farklı formüller mevcuttur.
1.2.1.3.1.1. Çalışmanın Tasarımına Göre SKK Tahminleri
En uygun SKK’nın seçimi için verilmesi gereken ilk karar, veri setinin tek yönlü ya
da iki yönlü varyans analizi modellerinden hangisi kullanılarak değerlendirileceğidir
(Ateş ve ark., 2009). İlgilenilen veriye tek ya da iki yönlü varyans analizi
uygulanmasına göre uygun korelasyon katsayısı seçilmektedir. Tek ya da iki yönlü
varyans analizinden hangisinin kullanılacağına Çizelge 1.4’te verilen durumlar
yardımıyla karar verilir.
SKK çalışmalarında, denek faktörü her zaman rastgele faktör olarak
değerlendirilirken; metotların, metotlar popülasyonundan rastgele olarak seçildiği ya
da sabit olduğu varsayılır. Metot karşılaştırma çalışmalarında, karşılaştırılacak
metotlar, çalışılan konuya özel metotlar olduğundan herhangi bir metotlar
havuzundan rastgele seçilemez; yani karşılaştırılmak istenen rastgele olarak seçilmiş
iki metot değil, özel olarak belirlenmiş (fixed) iki metottur. Klasik SKK
çalışmalarında modelde her bir metoda ait ölçüm hatası aynı varsayılır ki bu hem
çok güçlü bir varsayımdır hem de gerekçesi, dayanağı yoktur (Bland ve Altman,
1990).
Bu durumda şöyle bir çıkarım yapılabilir; SKK çalışmalarında gözlemci uyumu ile
ilgileniliyorsa, gözlemcinin etkisi modelin tanımlanmasında etkili olur. Eğer
gözlemcinin etkisi rastgele ise, “rastgele etki modeli”, sabit ise “karma etki modeli”
olarak tanımlanır. Ancak metot etkisi rastgele olamayacağından, bu tez
çalışmasında yalnızca iki yönlü karma etki modeli incelenecektir.
46
1.2.1.3.1.1.1. İki Yönlü Karma Etki Modeli
İki yönlü karma etki modeli, n sayıda denek, k sayıda metot ile değerlendirilir. Her
bir denek üzerinden, çalışma için belirlenmiş olan k tane metodun her biri ile en az
bir ölçüm alınır. Metot etkisinin sabit; yani metot havuzundan rastgele seçilmediği
ve denek etkisinin rastgele olduğu varsayılır. Bu durumda, SKK’yi tanımlamak için
iki yönlü karma etkili ANOVA modeli kullanılır (Barnhart, 2006):
ijjiij hmdX i = 1,2,…,n; j= 1,2,….,k (1.23)
Bu eşitlikte, , tüm ölçümler için kitle ortalamasını, id denek etkisini, jm metot
etkisini, ijh ise hata terimini gösterir. id bileşeninin, modeldeki diğer bileşenlerden
bağımsız olduğu, 0 ortalama ve 2
d varyansı ile normal dağıldığı varsayılır. Hata
teriminin ( ijh ) ise, bağımsız olduğu, 0 ortalama ve 2
h varyans ile normal dağıldığı
varsayılır. 0jm kısıtı altında
k
j
jm km1
22 )1/( ’dir (Shrout ve Fleiss, 1979 ).
Çizelge 1.2. Varyans analizi modelleri için varyans bileşenleri
McGraw ve Wong’un 1996 yılında yayınladıkları “Forming Inferences About Some
Intraclass Correlation Coefficient” makalesinde etkileşim faktörü çalışmaya dahil
Değişim Kaynağı Serbestlik Derecesi Kareler Ortalaması Beklenen Kareler
Ortalaması
Denekler arası (DA) n-1 DAKO 22
hdk
Denekler içi (Dİ) n (k-1) Dİ
KO 22
hm
Metotlar arası (MA) k-1 MAKO 22
hmn
Hata (n-1) (k-1) HATAKO 2
h
47
edilmişse de; bu tez çalışmasında, modeller elde edilirken, denek x gözlemci
etkileşiminin etkisi ihmal edilecektir.
İki yönlü karma etki modeli için SKK;
Her bir metotla tek bir ölçüm alındığında,
222
2
)1,3(hmd
dSKK
(1.24)
Her bir metotla tekrarlı ölçümler alındığında,
k
kSKKhmd
d
/)(),3(
222
2
(1.25)
olarak hesaplanır.
SKK değeri,
k metot ya da gözlemci için [-(1/(k-1)), +1]
2 metot ya da gözlemci için [-1, +1]
arasında olmalıdır.
Metotların uyumunu değerlendirmek için bulunan SKK değerleri Çizelge 1.3
yardımıyla yorumlanabilir.
48
Çizelge 1.3. SKK’nın kabul edilebilir seviyeleri
Sınıf içi korelasyon değeri Kabul edilebilir seviye
1.00 – 0.95 mükemmel uyum
0.94 – 0.85 yüksek uyum
0.84 – 0.70 orta düzeyde uyum
0.69 – 0.00 kabul edilemez düzeyde uyum
SKK’nin önemlilik testi 0’a karşı 0F istatistiği kullanılarak yapılır. N denek sayısı
olduğunda, [(N-1), (N-1)] serbestlik derecesi ileHATA
DA
KO
KOF 0 olarak hesaplanır
(Bartko, 1994).
)(SKK ’ye ait )1( % güven aralığı için,
)]1(),1(;/[ 2/10 NNFFFalt
)]1(),1(;[ 2/10 NNFFFüst
olur ve güven aralığı,
]1/[)1()(]1/[)1( üstüstaltalt FFSKKFF
olarak hesaplanır.
1.2.1.3.1.2. Çalışmanın Amacına Göre SKK Tahminleri
SKK tahminleri, ilişkinin “tutarlılık (consistency)” ya da “mutlak uyum (absolute
agreement)” olarak değerlendirilmesine bağlı olarak değişir. İki yönlü modellerde
tutarlılık ve mutlak uyumun her ikisini de temel alan SKK tahminleri elde edilebilir.
Tutarlılık ve mutlak uyum arasındaki kavramsal fark, ölçümlerden veya metotlardan
kaynaklanan sistematik değişkenliğin nasıl değerlendirildiği ile açıklanır. Mutlak
49
uyum için SKK hesaplanırken, metotlar arasındaki sistematik değişkenlik dikkate
alınır ve SKK formülünün paydasına metot varyansı, yani metotların ana etkisi
eklenir. Bu şekilde elde edilen SKK, “mutlak uyum” olarak değerlendirilir. Ancak
metotlar varyans kaynağı olarak kabul edilmiyorsa, SKK formülünün paydasında bu
değişkenliğe ilişkin varyans yer almaz ve elde edilen SKK, “tutarlılık” ölçümü
olarak değerlendirilir. (McGraw ve Wong, 1996; Ateş ve ark., 2009).
2222
2
) (hmmd
duyummutlakSKK
(1.26)
Mutlak uyumun değerlendirildiği çalışmalarda, aynı metot ile elde edilen tekrarlı
ölçümlerin ya da farklı metotlar ile elde edilen ölçümlerin tamamen aynı olması
istenir. Tutarlılığın değerlendirildiği çalışmalarda ise, elde edilen SKK tahminleri
toplanabilirlik indeksidir ve bu indeks bir değişkenin (y) bir diğer değişkene (x) bir
diğer sabit ile (y=x+b) eşitlenmesinin derecesini ölçer.
1.2.1.3.1.3. Kullanılan Ölçümlerin Elde Edilme Biçimine Göre SKK Tahminleri
SKK hesaplanırken temel olarak tekrarlı ölçümler ve tekrarlı olmayan ölçümler
olmak üzere tasarlanmış iki plan vardır. Her bir metot ile yalnızca bir ölçüm değeri
elde ediliyorsa, yani metotlar arasındaki uyum tek bir ölçüm değerine göre
inceleniyorsa “tek (single)”, her bir metot ile her bir denekten çoklu ölçüm alınıp
ortalama değerleri üzerinden uyum inceleniyorsa, “ortalama (average)” seçeneği
kullanılmalıdır. Ortalamalar ile uyum inceleniyorsa, sonuçlar tek ölçüme göre daha
güvenilir olur. Bunun sebebi, çoklu ölçümler ile elde edilen sonuçların daha
güvenilir olmasıdır. Ortalama seçeneğine bağlı olarak SKK tahmini yapılırken,
denekler içi varyans terimi, kullanılan ölçüm sayısına bağlı olarak düzeltilir.
Tek ölçüm güvenilirliği ile ortalama ölçüm güvenilirliği arasında şöyle bir bağıntı
vardır:
50
1)1(
tek
tekortalama
rk
krr (1.27)
Bu bağıntı Spearman-Brown kestirim formülü olarak adlandırılır. Burada, tekr tek
ölçüm güvenilirliğini, ortalamar ise ortalama ölçüm güvenilirliğini göstermektedir. Bu
formülden k çekildiği zaman;
)1(
)1(
tekortalama
ortalamatek
rr
rrk
(1.28)
elde edilir. Bu formülde k, ortalama ölçüm (average measure) için güvenilirliğinin,
güvenilir bir şekilde hesaplanması için uygun olan tekrar sayısını vermektedir.
Ayrıca bu formülde yer alan tekr ve ortalamar ya geçmiş çalışmalardan yararlanılarak
ya da bir pilot çalışmadan yararlanılarak hesaplanır (McGraw ve Wong, 1996).
Bu bölümde, çalışmanın tasarımına, amacına ve ölçümlerin elde ediliş biçimine göre
hesaplanabilecek olası farklı SKK tahminleri özet olarak tabloda gösterilmiştir.
51
Çizelge 1.4. Çalışmanın tasarımına, amacına ve ölçümlerin elde edilme biçimlerine
göre hesaplanabilecek farklı SKK türleri
SKK
Türleri
Tanım
SKK(3,1) C Her bir metot ile her denekten ölçüm alınır. Metot etkisi sabittir.
SKK, tek bir ölçüm kullanılarak hesaplanır.
Tutarlılık tanımına göre SKK hesaplanır.
SKK(3,1) A Her bir metot ile her denekten ölçüm alınır. Metot etkisi sabittir.
SKK, tek bir ölçüm kullanılarak hesaplanır.
Mutlak uyum tanımına göre SKK hesaplanır.
SKK(3,k) C Her bir metot ile her denekten ölçüm alınır. Metot etkisi sabittir.
SKK, “k” ölçümün toplamı ya da ortalaması kullanılarak elde
edilir.
Tutarlılık tanımına göre SKK hesaplanır.
SKK(3,k) A Her bir metot ile her denekten ölçüm alınır. Metot etkisi sabittir.
SKK, “k” ölçümün toplamı ya da ortalaması kullanılarak elde
edilir.
Mutlak uyum tanımına göre SKK hesaplanır.
Bu tabloda SKK değerlerine ilişkin ilk terim model türünü (3: İki yönlü karma etki
modeli), ikinci terim kullanılan ölçümlerin elde edilme biçimini (1: tek ölçüm, k:
toplam/ortalama ölçüm) göstermektedir. SKK (*,*) C , tutarlılık tanımına göre; SKK
(*,*) A ise mutlak uyum tanımına göre hesaplanan SKK tahminini ifade etmektedir
(Ateş ve ark., 2009).
Literatürde, metot içi ve metotlar arası uyumu değerlendirirken en sık kullanılan
güvenilirlik ölçütü SKK’dır ve SKK tahminleri MEDCALC, SPSS gibi paket
programlar yardımıyla kolaylıkla hesaplanabilir.
52
1.2.1.3.2. Concordance Korelasyon Katsayısı (Concordance Correlation
Coefficient)
Metot karşılaştırma çalışmalarında uyumu değerlendirmek için sıkça kullanılan
yöntemlerden biri de Concordance korelasyon katsayısıdır (CKK). CKK ilk olarak,
Lin (1989) tarafından sürekli veriler kullanıldığında metotlar arasındaki uyumu
değerlendirmek amacıyla geliştirilmiştir. Son zamanlarda çıkan makalelerde;
örneğin, Chinchilli ve arkadaşları (1996) metot karşılaştırma ve tekrarlanabilirlik
çalışmaları için Concordance korelasyon katsayısını önermişlerdir. Ayrıca Zar
(1996) çalışmasında, Concordance korelasyon katsayısının, t testine, Pearson
moment çarpım korelasyon katsayısına, regresyon ve varyasyon katsayısına göre
olan üstünlüklerine değinmiştir. Lin (1989)’de, CKK’nin asıl avantajının metot
karşılaştırma ve tekrarlanabilirlik çalışmalarında sistematik yanlılığı ve rastgele
hatayı göz önüne alması olduğunu ileri sürmüştür. (Atkinson ve ark., 1997).
Metot karşılaştırma ve tekrarlanabilirlik çalışmalarında korelasyon katsayısının
kullanılması en geniş olarak Bland ve Altman (1986, 1995) tarafından eleştirilmiştir.
Bunun yanında, SKK’nın kullanılması ise denekler arasındaki değişkenliğin
tamamını ölçmesi ve doğruluğu (ölçmek) konusunda yetersiz olması nedeniyle
Atkinson (1995), Lin (2001), Barnhart ve Williamson (2001) tarafından
eleştirilmiştir. Bu yöntemlerle ilgili esas problem, örneklem heterojenliğine çok
duyarlı olmalarıdır. Bu durumda, geniş varyasyonlu bir örneklemde, çok yüksek
değerli r elde etmek çok kolay olur. Heterojenlik uyum çalışmalarında çok sık
karşılaşılan bir problemdir. Çünkü araştırmacılar metodun sonuçlarını değişkenin
tüm değişim aralığında denemek isterler. Örneğin, Chinchilli ve arkadaşları (1996)
tarafından verilen örnekte kolestrolün dağılım genişliği 50 ile 350 mg/dl arasındadır.
Heterojenliğe karşı olan bu duyarlılık, biyolojik ölçüm araçlarının geçerlilik ve
tekrarlanabilirliklerinin yanlış ölçülmesine sebep olur. SKK ve CKK arasındaki en
belirgin farklardan biri de, CKK’nin metotlar ile elde edilen ölçümlerin yerlerinin
değiştirilemediği durumlarda kullanılmasıdır. Ancak, iki yönlü karma modelde,
mutlak uyuma ilişkin SKK, CKK ile benzer sonuçlar verir (Atkinson ve ark., 1997;
Bland ve Altman, 1986, 1995; Corrasco ve Jover, 2003, Lin 1983 ).
53
CKK, kesim noktasının sıfır olduğu ve eğimin “1” olduğu kısıtları altında aynı ölçek
ile ölçülmüş X ve Y değişkenleri arasındaki doğrusal (lineer) ilişkiyi; yani her bir
ölçüm çiftinin 045 ’lik açı ile çizilen doğruya olan uzaklığını değerlendirir. CKK’yi,
Pearson korelasyon katsayından ayıran bu kısıttır. Pearson korelasyon katsayısında
böyle bir kısıtlama yoktur (Lin, 1989; Chichilli ve ark., 1996).
Her bir metot ile elde edilen ölçümler Y 1i ve Y 2i (i=1, 2, …, n); metotlara ait
ölçümlerin ortalama vektörü ),( 21 ve kovaryans matrisi,
2
2
2
12
2
12
2
1
ile normal dağılımdan bağımsız olarak seçilmiş örnek çiftleri olsun. Lin (1989), X
ve Y arasındaki uyumun derecesi farkların karelerinin beklenen değeri
]))[(( 2
21 YYE ile karakterize etmiştir.
)2(])[( 12
2
2
2
1
2
21
2
21 YYE
21
2
21
2
21 )1(2)(
Bu formülde, , Pearson korelasyon katsayısıdır. Bu ifade aynı zamanda 045 ’lik
doğrudan dikey farklılıkların karelerinin beklenen değerlerine eşittir. Eşitlik
çizgisinden herhangi bir ayrılış 1^
C olmasına neden olur (Lin, 1989).
Buna göre CKK ( C ),
bC CYYYYE
YY
2
21
2
2
2
1
12
21
2
21
21
)(
2
),cov(2])[(
),cov(2 (1.29)
54
olarak formüle edilir. Bu formülde, )( 11 YE , )( 22 YE , )var( 11 Y ,
)var( 22 Y ve ),cov( 2112 YY ’dır. C , +1 ve –1 arasında değişir. -1, negatif
yönlü mükemmel bir uyumu ifade ederken; 0, uyumun olmadığını; +1 ise, pozitif
yönlü mükemmel uyumu ifade eder.
12 ]2/)/1[( uCb
21 /
2121 /)( u
dir. bC , “yan düzeltme faktörü ” olarak adlandırılır ve eşitlik doğrusunun regresyon
denkleminden elde edilen doğruya uzaklığının ölçüsü olarak tanımlanır. bC ’ye
doğruluk ölçüsü (measure of accuracy) de denebilir ve 0 ile 1 arasında ( 10 bC )
değer alır. bC =1 olması, eşitlik doğrusundan ayrılış olmadığı anlamına gelmektedir.
Eşitlik doğrusundan herhangi bir ayrılış 1 olsa bile 1C olmasına neden olur
(Lin, 1989).
CKK ( C ), aşağıdaki özellikleri taşır:
-1 ile +1 arasında değer alır ve Pearson korelasyon katsayısının mutlak
değerinden daha büyük bir değer alamaz. Yani, 11 c
Pearson korelasyon katsayısının sadece sıfıra eşit olduğu bir durumda
CKK’da sıfıra eşit olacaktır.
Ortalamalar ve varyanslar birbirine eşit ise, C , Pearson korelasyon
katsayısına eşit olur. Yani, YX ve YX olduğu durumda C
olur.
Sadece aşağıdaki durumlarda 1C olur.
01222
YXYXYX ya da
1 , YX ve YX ya da
55
Metotlar ile elde edilen ölçüm çiftleri arasında mükemmel bir uyum
(örneğin, 1, 1; 2, 2; 3, 3; 4, 4; 5, 5) var ise 1C veya mükemmel
ters yönde bir ilişki (örneğin, 5, 1; 4, 2; 3, 3; 2, 4; 1, 5) var ise
1C olur.
n bağımsız örneklem çifti için, C ’nin örneklem tahmini,
2
212
2
2
1
12^
)(
2
YYSS
Sc
(1.30)
olur. Bu formülde,
n
i
ijj Yn
Y1
1,
2
1
22 )(1
i
jijj YYn
S , j= 1, 2 (1.31)
ve
n
i
ii YYYYn
S1
221112 ))((1
(1.32)
dir.
C ile ilgili istatistiksel çıkarsama yapabilmek için, Lin (1989) iki değişkenli
normal dağılım gösteren örneklemler için ters hiperbolik tanjant dönüşümünün (ya
da Z dönüşümünün) kullanılmasını önerir. Z dönüşümü,
C
CCZ
1
1ln
2
1)(tanh 1
(1.33)
şeklinde elde edilir.
56
Z’nin ^
Z kestirimini bulmak için, C ’nin yerine ^
C konulur. ^
Z transformasyonu
yapılmasının sebebi, ^
Z ’nin, ^
C ’den daha iyi asimtotik özellikler taşımasıdır. Lin
(1989), ^
Z ’nin asimtotik varyansını aşağıdaki gibi tanımlar:
222
44
22
23
22
222
)1(
2
)1(
)1(4
)1(
)1(
2
1^
C
C
C
CC
C
C
Z n
(1.34)
Bu formülde, 21
12
ve
4/1
21
21 )(
’dir. Z için asimtotik %100(1- )
güven aralığı,
),(),( 2/1,2
^^
2/1,2
^^^^^^
nZnZUL tZtZZZ
olur.
Metotların uyumunu değerlendirmek için bulunan CKK değerleri Çizelge 1.5
yardımıyla yorumlanabilir.
Çizelge 1.5. CKK’nın kabul edilebilir seviyeleri
Concordance korelasyon değeri Kabul edilebilir seviye
> 0.99 mükemmel uyum
0.95 – 0.98 yüksek uyum
0.90 – 0.94 orta düzeyde uyum
< 0.89 kabul edilemez düzeyde uyum
57
1.2.1.3. Regresyon Yöntemleri
Klinik çalışmalarda, ele alınan iki metot arasındaki uyumu araştırmada yaygın
olarak kullanılan yöntemlerden birinin de regresyon yöntemi olduğu dikkat
çekmektedir. Ele alınan iki metotla elde edilen ölçümler dikkate alındığında,
metotlardan herhangi birisi bağımlı, diğeri bağımsız değişken olarak düşünülür. Bu
durumda, klasik regresyon yaklaşımında En Küçük Kareler (EKK) yöntemi
varsayımına göre bağımsız değişkenin herhangi bir ölçüm hatası içermediği, yani
standart sapmasının sıfır olduğu, ortaya çıkan hataların bağımlı değişken olarak
seçilen metottan kaynaklandığı ve bağımlı değişkene ait standart sapmanın ölçüm
aralığı boyunca sabit olduğu varsayılmaktadır ve regresyon denklemindeki eğim
katsayısı sıfıra karşı sınanmaktadır. Ancak, her iki metot ile elde edilen ölçümlerin
de hata içermesinin mümkün olabileceği düşünüldüğünde, klasik regresyon analizi
yaklaşımının araştırmayı yanlış sonuçlara götürmesi kaçınılmaz olacaktır. Bu
noktadan yola çıkılarak, yani her iki metot ile elde edilen ölçümlerin de hata
içerebileceği düşünülerek kurulan regresyon modelleri, literatürde “Tip II regresyon
modelleri” olarak ifade edilmektedir ve bu tez çalışmasında Tip II regresyon
modellerinden olan Deming Regresyon ve Passing-Bablok yöntemleri
incelenecektir.
1.2.1.3.1. Deming Regresyon
Adını Alman araştırmacı Edwards Deming’dan alan bu yöntemin temelleri,
Deming’in 1943 yılında yazdığı “Statistical Adjustment of Data” isimli kitabında,
En Küçük kareler (Ordinary Least-Squares) regresyon yönteminin eksik yanlarını
ele alması ile atılmıştır. Bu yöntem, X ve Y değişkenlerinden hangisinin bağımlı
değişken olarak alınacağının bilinmediği durumlarda, her iki değişkendeki hataların
da dikkate alınması gerektiğinin vurgulanması üzerine geliştirilmiştir.
58
Klinik çalışmalarda son yıllarda oldukça önerilen bir yöntem de Tip II regresyon
yöntemlerinden biri olan Deming regresyondur. Deming (1943) çalışmasında her iki
değişkenin de hatalı ölçümlere sahip olması durumunda gözlem değerlerine en iyi
uyacak doğru denklemini verecek fonksiyonun minimize edilmesini önermiştir.
EKK analizinde Şekil 1.10’te de görüleceği gibi sadece bağımlı y değişkenine ilişkin
hata
n
i
ii
n
i
yyD1
2^
1
2 minimize edilmeye çalışılıp en uygun regresyon
doğrusunu bulmak için 0b (eğim) ve 1b (kesim) noktası bulunur (Cornbleet ve
Gochman, 1979).
xbby 10 (1.35)
Deming regresyon tekniğinde her iki değişkenin içerdiği hatalar eş zamanlı olarak
minimize edilmeye çalışılır. Deming regresyon ve EKK regresyon arasındaki fark
Şekil 1.10’teki grafikte de açıkça görülebilir. Deming regresyon tekniğinde
minimize edilmek istenen HKT değeri Eşitlik 1.35’teki gibi hesaplanır.
2^
2^
)()( iiii YYXXHKT (1.36)
Deming regresyona ait regresyon doğrusunu kestirmek için Eşitlik 1.36’da görülen
değerinin bilinmesi gerekir. değeri, karşılaştırılacak olan iki metodun
varyansları oranıdır. Bu değer Eşitlik 1.37’de görüldüğü gibi hesaplanır.
2
2
ey
ex
S
S (1.37)
Bu formülde 2
exS ve 2
eyS sırası ile X ve Y metotları ile elde edilen ölçüm değerlerine
ilişkin hataların varyanslarıdır.
59
Deming regresyon yönteminde, X ve Y metotlarının hataların Gaussian (normal)
dağıldığı varsayılır.
Deming regresyon yöntemi kullanılarak metotlar karşılaştırılmak isteniyorsa ilk
olarak değeri bilinmelidir. , sapmanın karesinin toplamlarını doğru üzerinde
minimize ederek açının belirlenmesine olanak sağlar. Deming regresyon
yönteminde, her iki metot ile elde edilen ölçümlerin standart sapması önemli ölçüde
birbirinden farklı olabilse de, simgesi ile gösterilen iki varyansın oranı sabit
(nonconstant) kabul edilmiştir. Varyans oranlarının sabit olduğu varsayıldığında, bu
tekniğe Standartlaştırılmış Temel Bileşenler Analizi denir (Linnet, 1993).
Ancak metot karşılaştırma çalışmalarında bazı durumlarda araştırmacı
karşılaştırılacak X ve Y metotlarının her ikisi hakkında da bilgi sahibi olmayabilir
ve bu metotlar ile elde edilen ölçüm değerlerinin varyansının hangisinin payda
hangisinin paydada olacağını bilemeyebilir. Bu durumda, araştırmacı değerini 1
olarak alır. Buna ek olarak her bir metot ile tek bir ölçüm elde edilmesi durumunda
da genellikle değeri 1 alınır. değerinin 1 olarak ele alınması durumunda
Optimal Deming Regresyon yöntemi söz konusu olmaktadır. =1 olduğunda Şekil
1.10’teki gibi bahsedilen açı 090 olur (Linnet, 1998; Saraçlı, 2008).
60
Şekil 1.10. Deming Regresyon ve EKK regresyon yöntemlerinde hata değerlerinin
minimize edilmesi
Lamda değeri 1’e eşit olduğunda, yani her bir metot ile elde edilen ölçüm
değerlerinin varyansı sabit olduğunda, gözlem noktasının doğruya olan dik uzaklığı
söz konusu olmakta ve bu durumda gözlem değerlerinden regresyon doğrusuna
çizilen dikey ve yatay uzaklıklar sonucunda oluşan üçgen ikizkenar dik üçgen
olmakta, bu da Deming regresyon sonuçlarının ortogonal regresyon yöntemi ile aynı
olduğu anlamına gelmektedir (Saraçlı, 2008; Saraçlı,ve ark., 2009).
Deming regresyonda, x ve y değişkeni için ayrı ayrı hata değeri
2^
ii xxA ve
2^
ii yyB şeklinde bulunur. Bu durumda, 22 BAC olur (Cornbleet ve
Gochman, 1979).
Deming regresyon yönteminde, tahmin edilmek istenen regresyon denklemine ait
eğim katsayısı olan 1 , Eşitlik 1.27 yardımı ile elde edilmektedir.
61
p
pquuq
2
4 22
1
(1.38)
Bu formülde,
2
xxu i
2
yyq i
))(( yyxxp ii
olarak elde edilir.
Kesim noktası olan 0 katsayısı ise EKK regresyon yöntemine benzer bir şekilde
Eşitlik 1.39’daki gibi elde edilir.
xy 10 (1.39)
Deming regresyonda, sabit terim ve eğim katsayısı için sunulan genel
formülasyonlar pratikte oldukça karışıktır. Eğim ve kesim noktasına ait standart
hatanın tahmini için ise birçok prosedür önerilmektedir. Eğim ve kesim noktaları ile
bu değerlerin standart hatalarının hesabı için normal dağılım varsayımının
sağlanmasına gerek duyulmayan, yani parametrik olmayan bir yöntem olan Jacknife
gibi bilgisayar tabanlı bir yöntem kullanılabilir (Linnet, 1993).
Tez çalışmasının bu bölümünde, literatürde en sık rastlanan EKK regresyon
yönteminin metot karşılaştırma çalışmalarında kullanılması durumunda hatalı
sonuçlar verebileceği üzerinde durulmuş; yerine Deming regresyon yönteminin
kullanılmasının avantajları sunulmuştur.
62
1.2.1.3.2. Passing - Bablok Yöntemi
Passing-Bablok regresyon yöntemi parametrik olmayan Tip II regresyon
yöntemlerinden biridir ve diğer Tip II regresyon yöntemleri gibi her iki metot ile
elde edilen ölçümlerin bir miktar hata ile elde edilebileceği ihtimalini göz önünde
bulundurur. Parametrik olmayan bu yöntem ile ilgili hesaplamalar ölçüm
değerlerinin sıra numaralarına bağlı olarak yapılır ve test metodu ile referans metot
(X ve Y metotları) ile elde edilen verilerin bağımsız olduğu varsayılır (Magari,
2002).
Passing ve Bablok (1983), eğim ve kesim noktasının tahminini aşağıdaki eşitlikler
yardımıyla yapmıştır. n tane ),( ii yx ölçüm çifti olduğunda ve ),( ii YX ise bu
değerlerin beklenen değerleri olduğunda,
ji
ji
ijxx
yyb
nji 1 (1.40)
ve sırasıyla X ve Y metotlarıyla elde edilen ölçüm değerlerinin aynı dağılımdan
gelen rastsal hata değerleri olmak üzere, elde edilmek istenen Passing-Bablok
regresyon denklemine ilişkin eğim katsayısı ve kesim katsayısı Eşitlik 1.41 -
1.43’ten yararlanılarak hesaplanır (Passing ve Bablok, 1983):
jiji
jiji
ijXX
YYb
ii XY 10 ve jiij XXd
olduğundan,
63
bd
bd
bd
bdb
ji
ij
ji
ij
jiij
jiij
ij )(
)(
)(
)(
(1.41)
ijz ve ijz , bağımsız ve aynı dağılımdan gelen hata değerlerini göstermektedir.
KN
KN
KN
bb
b
122
2
1
1
.2
1
ise sayıçift N ,
ise sayı tek , N
(1.42)
Bu formülde N örneklem genişliği, K ise 1ijb olan ijb değer sayısıdır.
Bu yöntem ile elde edilecek regresyon denklemine ait sabit terim )( 0 aşağıdaki
eşitlik yardımıyla bulunur (Saraçlı ve Çelik, 2011).
ii xymed 10 (1.43)
n tane ),( ii yx ölçüm çifti olduğunda ve ),( ii YX ise bu değerlerin beklenen
değerleri olduğunda,
ii XY 10 veya ii BYAX (1.44)
Yukarıda 0 ve 1 ’in tahmin edicisi olan değerler aşağıdaki özellikleri gösterir
(Passing ve Bablok, 1983):
ijij
ijij
zd
zdb
64
1
1
B ve
1
0
A
Bu yöntemin uygulamada verdiği sonuçlar incelendiğinde, Deming regresyon
yöntemi kadar etkili olduğu söylenemez (Saraçlı, 2008).
Bu tez çalışmasının amacı, klinik araştırmalarda referans metot yerine önerilen test
metodunun ölçüm değerlerinin, referans metot ile elde edilen ölçüm değerleri ile
uyumunun uygun istatistiksel yöntemler kullanılarak değerlendirilmesidir. Bu
istatistiksel analizler sonucunda, karşılaştırılan metotların değişimli olarak birbirleri
yerine kullanılabileceği ya da test edilen metodun kullanılabilir olduğu sonucuna
varılır.
65
2. GEREÇ VE YÖNTEM
2.1. Uygulama Verisi
Çalışmamızda iki ayrı veri seti üzerinde uygulama yapılmıştır. Bu verilerin elde
edildiği metotların birbirleriyle ne derece uyumlu sonuçlar verdiğini bulmak için
Bland-Altman yöntemi, Sınıf-İçi Korelasyon Katsayısı, Concordance Korelasyon
Katsayısı, Deming Regresyon ve Passing-Bablok Regresyon Yöntemleri
kullanılmıştır.
Veri 1. Her bir metot ile her bir denek üzerinden tek ölçümün alındığı veri seti
Veri 1, Alanay ve arkadaşlarının 2009 yılında yaptıkları çalışmaya ait verilerdir. Bu
çalışmada, kemikteki proximal thoracic (PT), main thoracic (MT) ve thoracolumbar
(TL) eğriliklerinin esneklik oranları, ameliyat öncesinde referans metot olduğu
bilinen Bending X Rays (BXR) metodu ve ameliyat sırasında Truga metodu ile
ölçülmüştür. Bunların yanında, PT, MT ve TL değerleri ameliyat sonrasında da
ölçülerek gerçek değerler elde edilmiştir. Burada amaç, Bending ve Truga
metotlarının gerçek değerler ile ne kadar uyumlu olduğunu tespit etmektir.
Bland-Altman yöntemi kullanılarak, Bending ve Truga metotları ile elde edilen TL
değerleri ayrı ayrı gerçek TL değerleri olan Post-op değerler ile karşılaştırılarak
hangi metodun gerçek değerlerle daha uyumlu sonuçlar verdiğine bakılmıştır.
Bending ve Truga metotları kullanılarak elde edilen MT değerleri ise Sınıf-İçi
Korelasyon Katsayısı, Concordance Korelasyon Katsayısı, Deming ve Passing-
Bablok regresyon yöntemleri kullanılarak karşılaştırılmıştır.
66
Bending ve Truga metotları kullanılarak elde edilen PT değerleri ise Deming
regresyon yöntemi ile incelenmiş ve daha sonra neden bu değerleri Bland-Altman
yöntemi ile değerlendirmenin daha iyi olacağı anlatılmıştır.
Veri 2. Tekrarlı ölçümlere ilişkin yöntemlerin incelendiği veri seti
Tekrarlı ölçümlere ilişkin bu veriler Alanay ve arkadaşlarının 2007 yılında Original
Article dergisinde yayınlanan “Radiographic measurement of sagittal plane
deformity in patients with osteoporoticspinalş fractures evaluation of intrinsic
error” adlı makalesinden alınmıştır.
Hacettepe Üniversitesi Tıp Fakültesi’nde yapılan bu çalışmada, yaşlı bireylerde
Osteoporotic Vertebral Compression Fracture (OVCF) hastalığından kaynaklanan,
lokal sagital alan deformasyonunu değerlendirmede kullanılan 4 farklı metodun
uyum düzeyinin incelenmesi amaçlanmıştır.
Tekrarlı ölçümlerle çalışıldığı için uygulamada yalnızca Bland-Altman,
Tekrarlanabilirlik ve Sınıf-İçi korelasyon katsayısı yöntemleri ile metotların uyumu
incelenmiştir.
Bu metotlar ile ilgili açıklamalar Şekil 2.1 ve Çizelge 2.1’de gösterilmiştir.
67
Şekil 2.1. Kifotik deformasyonu ölçmek için kullanılan metotlar
Çizelge 2.1. Kifotik deformasyonu ölçmede kullanılan metotların tanımları
Metotlar Tanım
a. Metot 1 Çatlak omurganın alt ve üst plağı arasındaki açıyı ölçer.
b. Metot 2 Çatlak omurganın yalnızca alt plağı ve çatlağın hemen üstündeki
omurganın alt plağı arasındaki açıyı ölçer.
c. Metot 3 Çatlak omurganın aşağısındaki omurun üst plağı ile çatlak
omurganın yukarısındaki omurun alt plağı arasındaki açıyı ölçer.
d. Metot 4 Çatlak omurganın aşağısındaki omurun alt plağı ile çatlak
omurganın yukarısındaki omurun üst plağındaki açıyı ölçer.
2.2. Veri analizinde Kullanılan Programlar
Çalışmamızda veri analizi için ağırlıklı olarak “MedCalc” paket programı
kullanılmıştır. Bu program biyomedikal araştırmalar için geliştirilmiş bir program
olup diğerlerine göre metot karşılaştırma yöntemlerine daha fazla yer verilmiştir.
68
MedCalc programının yanı sıra “Analyse-it” ve “SPSS” paket programlarından da
yararlanılmıştır.
MedCalc Programının Ana Ekranı
MedCalc paket programının ana menüsü Şekil 2.2’de görüldüğü gibidir. Dosya
açmak için menüden File Open seçilip veri dosyası sisteme aktarılabilir veya
File New seçilerek veriler elle girilebilir. Veriler açıldıktan ya da oluşturulduktan
sonra Şekil 2.3’te görüldüğü gibi Statistics menüsünden yapılmak istenen analiz
seçilebilir.
Şekil 2.2. MedCalc programının ana menüsü
70
3. BULGULAR
Veri 1. Her bir metot ile her bir denek üzerinden tek ölçümün alındığı veri seti
Kemikteki PT, MT ve TL eğriliklerinin esneklik oranlarına ilişkin tanımlayıcı
istatistikler Çizelge 3.1’de verilmiştir. Veriler 61 denek üzerinden elde edilmiş,
ancak eksik veri nedeniyle iki tanesi çalışma dışı bırakılmıştır.
Çizelge 3.1. Veri setindeki değişkenlerin tanımlayıcı istatistikleri
Metotlar
N
Ortalama
Standart
Sapma
Min-Maks
Bending
PT 59 11,34 8,14 0 - 38
MT 59 25,10 19,63 1 – 90
TL 59 11,39 11,64 0 - 56
Truga
PT 59 11,64 7,15 0 – 41
MT 59 20,00 12,21 1 - 65
TL 59 12,72 9,25 1 - 42
Post-op
PT 59 9,16 5,84 0 - 29
MT 59 13,05 10,07 0 - 53
TL 59 11,73 10,12 0 - 41
Min: En küçük değer; Maks: En büyük değer
Bland-Altman Yöntemi
Bu çalışmada, ameliyat sonrası gerçek değerlerin olması özel bir durum
oluşturmaktadır. Bu nedenle, Bending ile Post-op değerleri arasındaki uyum ve
71
Truga ile Post-op değerleri arasındaki uyum düzeyleri elde edilmiş ve bu iki
metottan hangisinin gerçek değerler ile daha uyumlu olduğu bulunmuştur.
Bland-Altman yöntemini uygulamak için farkların yaklaşık olarak normal dağılıma
uyup uymadığı ve istatistiksel olarak farklar ve ortalamalar arasında anlamlı bir
ilişki olup olmadığı incelenmiştir. Farklar, yaklaşık olarak normal dağılıma
uyuyorsa ve istatistiksel olarak farklar ve ortalamalar arasında ilişki yoksa iki metot
arasındaki uyum farkların ortalaması ve standart sapması kullanılarak Bland-Altman
yöntemi ile incelenebilir.
1. Post-op TL değerleri ile Bending metodu ile elde edilen TL değerleri
arasındaki uyumun incelenmesi
Çizelge 3.2’de de görüldüğü gibi, Post-op TL değerleri ile Bending metodu ile elde
edilen TL değerleri arasındaki farklar normal dağılım göstermektedir. Bu değerlere
ait farklar ve ortalamalar arasında ise istatistiksel olarak anlamlı bir ilişki
bulunmamıştır.
Çizelge 3.2. Bland-Altman yönteminin uygulanabilmesi için Bending TL ve Post-op
TL ölçümlerine ilişkin varsayımların testi
Bland-Altman yönteminin gerektirdiği her iki varsayım da sağlandığı için Post-op
değerleri ile Bending metodu ile elde edilen ölçümlerin uyumu bu yöntem ile
incelenebilir.
Varsayım Sınaması Normallik Testi
(Shapiro-Wilk)
Korelasyon
(Pearson korelasyon)
TL
FARK
(Post-op – Bending)
p = 0,160
ORTALAMA-FARK
(Post-op – Bending)
-0, 157
(p=0,236)
72
0 10 20 30 40 50
-40
-30
-20
-10
0
10
20
30
40
Ortalama (tl_post - tl_bend)
Far
k (t
l_po
st -
tl_b
end)
Mean
0,3
-1.96 SD
-21,9
+1.96 SD
22,5
Şekil 3.1. TL değerlerinin Post-op ve Bending metodu ile elde edilen ölçümlerinin
farklarına karşı ortalamalarının grafiği
Şekil 3.1’de görüldüğü gibi Bland-Altman grafiğindeki TL ölçüm değerlerinin
farkları ve ortalamalarına ait noktaların önemli miktarı uyum sınırları içinde
olduğundan, bu değerlere ait farklar ve ortalamalar arasında ilişki olmadığı
sonucuna varılır.
Çizelge 3.3. Bland-Altman yöntemi uygulanan Bending TL ve Post-op TL
ölçümlerine ilişkin sonuçlar
TL Farklar (Post-op - Bending) %95 Güven Aralığı
Ortalama ± SS 0,34 ± 11,33 -2,6 - 3,3
Alt Limit -21,9 -26,9 - -16,8
Üst Limit 22,5 17,5 - 27,6
Elli dokuz denek üzerinden iki metot ile elde edilen TL değerlerinin farklarına ait
ortalama 0,34, standart sapma ise 11,33’tür. Farkların ortalamasına ait % 95 güven
aralığı ise -2,6 ile 3,3 olarak elde edilmiştir. Farkların ortalaması ve standart sapması
kullanılarak elde edilen uyum sınırları %95 güven düzeyinde, -21,9 ve 22,5 olarak
73
bulunmuştur. Bu sonuca göre, Bending metodu ile ölçülen TL değerleri, Post-op
değerlerinden 21,9 o büyük, 22,5 o küçük bulunabilir.
Uyum sınırlarının alt limiti olan -21,9 değeri için %95 Güven Aralığı -26,9 ile –
16,8 olarak bulunmuşken; üst limiti olan 22,5 değeri için 17,5 ile 27,6 olarak elde
edilmiştir.
2. Post-op TL değerleri ile Truga metodu ile elde edilen TL değerleri arasındaki
uyumun incelenmesi
Çizelge 3.4’de de görüldüğü gibi, Post-op TL değerleri ile Truga metodu ile elde
edilen TL değerleri arasındaki farklar normal dağılım göstermektedir. Bu değerlere
ait farklar ve ortalamalar arasında ise istatistiksel olarak anlamlı bir ilişki
bulunmamıştır.
Çizelge 3.4. Bland-Altman yönteminin uygulanabilmesi için Truga TL ve Post-op
TL ölçümlerine ilişkin varsayımların testi
Bland-Altman yönteminin gerektirdiği her iki varsayım da sağlandığı için Post-op
değerleri ile Truga metodu ile elde edilen ölçümlerin uyumu bu yöntem ile
incelenebilecektir.
Varsayım Sınaması Normallik Testi
(Shapiro-Wilk)
Korelasyon
(Pearson korelasyon)
TL
FARK
(Post-op – Truga)
p = 0,570
ORTALAMA-FARK
(Post-op – Truga)
0,123
(p=0,352)
74
0 10 20 30 40 50
-25
-20
-15
-10
-5
0
5
10
15
20
Ortalama (tl_post - tl_truga)
Fark
(tl_
post
- tl_
truga
)
Mean
-1,0
-1.96 SD
-16,2
+1.96 SD
14,2
Şekil 3.2. TL değerlerinin Post-op ve Truga metodu ile elde edilen ölçümlerinin
farklarına karşı ortalamalarının grafiği
Şekil 3.2’de görüldüğü gibi Bland-Altman grafiğindeki TL ölçüm değerlerinin
farkları ve ortalamalarına ait noktaların önemli miktarı uyum sınırları dışında
olmadığından bu değerlere ait farklar ve ortalamalar arasında ilişki olmadığı
sonucuna varılır.
Çizelge 3.5. Bland-Altman yöntemi uygulanan Truga TL ve Post-op TL ölçümlerine
ilişkin sonuçlar
TL Farklar (Post-op - Truga) %95 Güven Aralığı
Ortalama ± SS -1,0 ± 7,8 -3,0 - 1,0
Alt Limit -16,2 -19,7 - -12,7
Üst Limit 14,2 10,7 - 17,7
SS; Standart Sapma
Elli dokuz denek üzerinden iki metot ile elde edilen TL değerlerinin farklarına ait
ortalama -1,0±7,8’dir. Farkların ortalamasına ait % 95 güven aralığı ise -3,0 ile 1,0
olarak bulunmuştur. Farkların ortalaması ve standart sapması kullanılarak elde
edilen %95 güven düzeyinde uyum sınırları, -16,2 ve 14,2 olarak elde edilmiştir. Bu
75
sonuca göre Truga metodu ile ölçülen TL değerleri, Post-op değerlerinden 16,2 o
büyük, 14,2 o küçük bulunabilir.
Uyum sınırlanın alt limiti olan -16,2 değeri için %95 güven aralığı -19,7 ile -12,7
iken; üst limiti olan 14,2 değeri için 10,7 ile 17,7 olarak elde edilmiştir.
Sınıf-İçi Korelasyon Katsayısı (SKK)
Çalışmamızın bu bölümünde, SPSS paket programı kullanılarak Bending metodu ile
ölçülen MT değerleri ile Post-op MT değerleri arasındaki SKK ve Truga metodu ile
ölçülen MT değerleri ile Post-op MT değerleri arasındaki SKK değerleri tahmin
edilmiş ve bu iki metottan hangisinin gerçek değerler ile daha uyumlu sonuçlar
verdiği bulunmuştur.
Analizlerde, metot x denek etkileşimi göz ardı edilmiştir. Aynı denek üzerinden
Bending ve Truga metotları ile elde edilen MT değerlerine ilişkin mutlak uyumu ve
tutarlılığı ölçen SKK değerinin her ikisi de hesaplanmıştır. Her bir metot ile tek bir
ölçüm değeri elde edildiğinden tek ölçüm SKK değerleri ile ilgilenilmiştir.
1. Post-op MT değerleri ile Bending metodu ile elde edilen MT değerleri
arasındaki SKK’nın incelenmesi
Çizelge 3.6. Bending metodu ile elde edilen MT değerleri ile Post-op MT değerleri
arasındaki SKK tahmini
Bending / Post op
%95 Güven Aralığı F Değeri p
Alt Sınır Üst Sınır
SKK (Mutlak Uyum) 0,50 0,034 0,74 4,59 <0,001
SKK (Tutarlılık) 0.64 0.47 0.77 4,59 <0,001
76
2. Post-op MT değerleri ile Truga metodu ile elde edilen MT değerleri
arasındaki SKK’nın incelenmesi
Çizelge 3.7. Truga metodu ile elde edilen MT değerleri ile Post-op MT değerleri
arasındaki SKK tahmini
Bu durumda, MT değerlerini ölçmede Truga metodunun, Bending metoduna göre
Post-op MT değerleri ile biraz daha uyumlu sonuçlar verdiği gözlenmektedir.
Concordance Korelasyon Katsayısı (CKK)
Çalışmamızın bu bölümünde, Bending ve Truga metotları ile elde edilen MT
değerlerinin Post-op MT değerleri ile uyumu CKK tahmin edilerek bulunmuştur.
Böylece metotlar arasındaki uyum doğruluk ve kesinlik kavramları da
değerlendirilerek incelenmiş; daha sonra da sonuçlar mutlak uyumu değerlendiren
SKK değeri ile karşılaştırılmıştır.
1. Post-op MT değerleri ile Bending metodu ile elde edilen MT değerleri
arasındaki CKK’nın incelenmesi
Çizelge 3.8. Bending metodu ile elde edilen MT değerleri ile Post-op MT değerleri
arasındaki CKK tahmini
Bending/
Post-op
CKK
( bc C )
%95 Güven Aralığı *
(kesinlik)
C b **
(doğruluk) Alt sınır Üst sınır
MT 0,49 0,37 0,60 0,79 0,62
*Pearson korelasyon katsayısı,
** yanlılık düzeltme faktörü
Truga / Post op
%95 Güven Aralığı F Değeri p
Alt Sınır Üst Sınır
SKK (Mutlak Uyum) 0,71 0,06 0,90 12,24 <0,001
SKK (Tutarlılık) 0.85 0.76 0.91 12,24 <0,001
77
2. Post-op MT değerleri ile Truga metodu ile elde edilen MT değerleri
arasındaki CKK’nın incelenmesi
Çizelge 3.9. Truga metodu ile elde edilen MT değerleri ile Post-op MT değerleri
arasındaki CKK tahmini
Truga/
Post-op
CKK
( bc C )
%95 Güven Aralığı *
(kesinlik)
C b
**
(doğruluk) Alt sınır Üst sınır
MT 0,71 0,59 0,80 0,86 0,82
*Pearson korelasyon katsayısı,
** yanlılık düzeltme faktörü
Bir önceki bölümde, Bending ve Truga metotları ile elde edilen MT değerlerinin
Post-op MT değerleri ile uyumu SKK (mutlak uyum) değeri ile incelendiğinde,
Truga metodunun Bending metoduna göre gerçek değerler ile daha uyumlu sonuçlar
verdiği gözlenmişti. Bu bölümde, CKK ile SKK (mutlak uyum) değerinin benzer
sonuçlar verdiği gözlenmiş ve Truga metodunun Bending metoduna göre gerçek MT
değerleri ile daha uyumlu sonuçlar verdiği doğrulanmıştır.
Deming Regresyon Yöntemi
Çalışmamızın bu bölümünde, öncelikle Bending ve Truga metotları ile elde edilen
PT değerleri arasındaki uyum; daha sonra ise Bending ve Truga metotları ile elde
edilen MT değerleri arasındaki uyum Deming regresyon yöntemi ile incelenmiş ve
bu iki durum karşılaştırılmıştır.
Bu yöntem kullanılırken Bending ve Truga metotlarına ait hata değerlerinin normal
dağıldığı varsayılmıştır (Saraçlı, 2008).
78
1. Bending ve Truga metotları ile elde edilen PT değerleri arasındaki uyumun
incelenmesi
Çizelge 3.10. PT değerleri için Deming regresyon analizi sonuçları
(Referans) / (Test)
Bending / Truga
Yanlılık
(Bias)
%95 Güven
Aralığı
Standart
Hata
p
Kesim - Sabit(Constant) 2,01 -0,40 4,42 1,204 0,10
Eğim - Orantısal(Proportional) 0,85 0,63 1,07 0,110 0,18
Bulunan sonuçlara göre, kesim noktası 2,01’dir ve bu değere ait güven aralığı sıfır
değerini içermektedir. Eğim değeri ise 0,85’tir ve bu değere ait güven aralığı bir
değerini içermektedir. Bu durumda, Bending ve Truga metotları ile elde edilen PT
değerleri arasında sistematik ve orantısal yanlılık gözlenmediği sonucuna varılır.
Deming regresyon doğrusuna ait denklem ise, y=2,01+0,85x olarak bulunur. Şekil
3.3’te eşitlik doğrusu ile Deming regresyon doğrusu bir arada gösterilmiştir ve bu
grafikten Bending ve Truga metotları ile elde edilen PT değerlerinin birbirleri ile
uyumlu sonuçlar verdiği gözlenmektedir.
Şekil 3.3. PT değerleri için Deming regresyon grafiği
79
Ölçümler arasında herhangi bir sistematik veya orantısal hata bulunmadığından
Deming regresyon yöntemi yerine Bland-Altman yönteminin kullanılması tercih
edilir.
Bending ve Truga metotları ile elde edilen PT değerleri arasındaki uyum Bland-
Altman yöntemi ile incelendiğinde, Truga metodu ile elde edilen PT değerlerinin,
Bending metodu ile elde edilen PT değerlerinden 9,94 o büyük veya 9,33 o küçük
çıkabileceği sonucu bulunmuştur.
2. Bending ve Truga metotları ile elde edilen MT değerleri arasındaki uyumun
incelenmesi
Çizelge 3.11. MT değerleri için Deming regresyon sonuçları
(Referans) / (Test)
Bending / Truga
Yanlılık
(Bias)
%95 Güven
Aralığı
Standart
Hata
p
Kesim - Sabit(Constant) 5,06 2,49 7,63 1,285 <0,001
Eğim - Orantısal(Proportional) 0,60 0,49 0,70 0,051 <0,001
Bulunan sonuçlara göre, kesim noktası 5,06’dir ve bu değere ait güven aralığı sıfır
değerini içermemektedir. Eğim değeri ise 0,60’tır ve bu değere ait güven aralığı da
bir değerini içermemektedir. Bu durumda, Bending ve Truga metotları ile elde
edilen MT değerleri arasında hem sistematik hem de orantısal yanlılık gözlendiği
sonucuna varılır. Deming regresyon doğrusuna ait denklem ise, y referans metot
olan Bending metodu, x ise test metodu olan Truga metodu olmak üzere
y=5,06+0,60x olarak bulunur. Şekil 3.4’te eşitlik doğrusu ile Deming regresyon
doğrusu bir arada gösterilmiştir.
80
Şekil 3.4. MT değerleri için Deming regresyon grafiği
Görüldüğü üzere, Deming regresyon doğrusu ile eşitlik doğrusu birbirinden oldukça
farklıdır. Bu, metotlar arasında mutlak uyumun iyi bir düzeyde olmadığını gösterir;
ancak bulunan regresyon denklemi yardımıyla Truga metodu ile elde edilen değerler
kullanılarak Bending metodu ile bulunacak MT değerleri tahmin edilebilir.
Passing-Bablok Regresyon Yöntemi
Çalışmamızın bu bölümünde, daha önce Deming regresyon yöntemi ile incelenen
Bending ve Truga metotları ile elde edilen MT değerleri arasındaki uyum,
parametrik olmayan Passing-Bablok regresyon yöntemi ile incelenmiştir.
Çizelge 3.12. MT değerleri için Passing-Bablok regresyon analizi sonuçları
(Referans) / (Test)
Bending / Truga Yanlılık
(Bias)
%95 Güven Aralığı
Kesim - Sabit(Constant) 5,89 3,36 7,65
Eğim - Orantısal(Proportional) 0,54 0,43 0,64
81
Bulunan sonuçlara göre, kesim noktası 5,89’dur ve bu değere ait güven aralığı sıfır
değerini içermemektedir. Eğim değeri ise 0,88’dir ve bu değere ait güven aralığı bir
değerini içermemektedir. Bu durumda, Bending ve Truga metotları ile elde edilen
MT değerleri arasında hem sistematik hem de orantısal yanlılık gözlendiği sonucuna
varılır. Passing-Bablok regresyon doğrusuna ait denklem ise, y referans metot olan
Bending metodu, x ise test metodu olan Truga metodu olmak üzere y=5,89+0,54x
olarak bulunur. Şekil 3.5’te eşitlik doğrusu ile Passing-Bablok regresyon doğrusu bir
arada gösterilmiştir.
Şekil 3.5. . MT değerleri için Passing-Bablok regresyon grafiği
Görüldüğü üzere, Passing-Bablok regresyon doğrusu ile eşitlik doğrusu birbirinden
oldukça farklıdır. Bu, metotlar arasında iyi düzeyde bir mutlak uyumun olmadığını
gösterir; ancak bulunan regresyon denklemi yardımıyla Truga metodu ile elde edilen
değerler kullanılarak Bending metodu ile bulunacak MT değerleri tahmin edilebilir.
Veri 2. Tekrarlı ölçümlere ilişkin yöntemlerin incelendiği veri seti
Bu veriler 35 denek üzerinden her bir metot ile her bir denek üzerinden tekrarlı
ölçümler alınarak elde edilmiştir. Kifoz deformasyonunu ölçmek için geliştirilen bu
82
metotlar aracılığıyla Emre Acaroğlu, Akın Çil, Bas Pijnenburg, Muharrem Yazıcı
tarafından 34 denek üzerinde uygulanmıştır. Ancak bu çalışmada, yalnızca Emre
Acaroğlu tarafından elde edilen tekrarlı ölçümler ile analiz yapılacaktır ve eksik veri
nedeniyle bir denek çalışma dışı bırakılmıştır. Ayrıca, çalışmada hangi metodun
referans metot olduğu hakkında bilgi verilmediği için Metot 1 referans metot kabul
edilecek ve diğer metotların Metot 1 ile uyumu incelenecektir.
Yapılan ölçümler OVCF hastalığına sahip yaşları 55 – 75 arasında değişen 34 kişiye
aittir. Bu verilere ait tanımlayıcı istatistikler Çizelge 3.13’de verilmiştir.
Çizelge 3.13. Veri setindeki değişkenlerin tanımlayıcı istatistikleri
N Metot 1 Metot 2 Metot 3 Metot 4
Ortalama SS Ortalama SS Ortalama SS Ortalama SS
1 2 13,5 3,5 15,0 0,0 13,5 0,7 29,0 0,0
2 2 13,5 0,7 12,5 3,5 17,0 4,2 43,0 5,6
3 2 9,0 0,0 8,0 0,0 2,5 0,7 19,5 7,7
4 2 20,0 0,0 13,5 0,7 5,0 7,0 32,5 2,1
5 2 14,0 2,8 15,5 2,1 10,5 0,7 12,0 1,4
6 2 10,5 0,7 8,00 2,8 7,0 5,6 11,5 2,1
7 2 15,0 0,0 12,5 2,1 2,0 0,0 1,5 0,7
8 2 8,5 2,1 12,5 3,5 10,0 0,0 21,0 1,4
9 2 20,5 0,7 20,0 1,4 13,5 0,7 31,0 0,0
10 2 17,5 2,1 19,0 1,4 15,0 0,0 22,0 5,6
11 2 13,0 1,4 12,5 3,5 11,5 2,1 9,0 0,0
12 2 12,0 2,8 13,5 4,9 15,0 2,8 22,0 2,8
13 2 12,0 0,0 9,5 0,7 2,0 0,0 9,5 0,7
14 2 20,0 1,4 22,0 0,0 20,0 1,4 43,5 6,3
15 2 15,0 2,8 12,0 0,0 4,5 4,9 20,5 0,7
16 2 19,5 0,7 20,5 2,1 17,5 0,7 46,5 2,1
17 2 16,5 0,7 10,5 0,7 6,5 3,5 33,0 7,7
18 2 11,5 2,1 11,5 0,7 11,0 8,4 21,0 1,4
19 2 20,0 1,4 15,0 1,4 1,5 2,1 8,5 0,7
20 2 14,0 2,8 5,0 0,0 14,0 2,8 21,0 5,6
83
21 2 14,5 3,5 14,0 2,8 11,0 1,4 21,0 1,4
23 2 8,5 2,1 6,0 1,4 7,0 4,2 12,0 0,0
24 2 13,5 2,1 11,5 0,7 5,5 3,5 14,0 0,0
25 2 14,5 2,1 16,5 2,1 13,0 0,0 18,5 2,1
26 2 15,0 0,0 14,5 2,1 13,5 2,1 29,0 1,4
27 2 7,5 3,5 3,0 2,8 10,0 0,0 19,0 1,4
28 2 7,5 0,7 3,5 0,7 2,5 0,7 0,0 0,0
29 2 15,0 0,0 19,0 1,4 20,0 0,0 32,0 2,8
30 2 16,5 0,7 16,0 0,0 14,0 0,0 26,5 2,1
31 2 7,5 2,1 2,0 2,8 10,5 3,5 7,5 0,7
32 2 3,0 1,4 5,0 1,4 9,0 0,0 3,5 3,5
33 2 5,5 3,5 7,0 1,4 14,5 0,7 27,5 0,7
34 2 12,0 1,4 12,0 2,8 11,0 1,4 14,5 2,1
SS; Standart Sapma
Bland-Altman Yöntemi ve Tekrarlanabilirlik
Çalışmamızın bu bölümünde kifoz deformasyonu ölçmek için geliştirilmiş dört
metodun uyumu incelenmiştir. Kifoz deformasyon değerinin gerçek değeri sürekli
değişim gösterebilecek bir değer olamayacağından grafikler ve Bland-Altman
analizi sonucunda bulunan değerler gerçek değerlerin sabit olması durumuna göre
yapılmıştır. Bu nedenle grafiklerde, denek sayısı kadar nokta vardır ve bu noktaların
boyutu denek üzerinden alınan tekrarlı ölçüm sayısı ile orantılı olarak değişir. Bu
çalışmada, her bir denekten eşit sayıda tekrarlı ölçüm alındığından bütün noktaların
boyutları aynıdır.
84
0 5 10 15 20 25
-8
-6
-4
-2
0
2
4
6
8
10
Ortalama (Metot-1 - Metot-2)
Fark
(Met
ot-1
- M
etot
-2)
Mean
1,0
-1.96 SD
-6,2
+1.96 SD
8,3
Şekil 3.6. Kifoz deformasyonu ölçmede Metot 1 ve Metot 2 Karşılaştırması
5 10 15 20 25
-15
-10
-5
0
5
10
15
20
Ortalama (Metot-1 - Metot-3)
Fa
rk (
Me
tot-
1 -
Me
tot-
3)
Mean
2,5
-1.96 SD
-10,9
+1.96 SD
15,9
Şekil 3.7. Kifoz deformasyonu ölçmede Metot 1 ve Metot 3 Karşılaştırması
85
0 5 10 15 20 25 30 35 40
-30
-25
-20
-15
-10
-5
0
5
10
15
20
Ortalama (Metot-1 - Metot-4)
Far
k (M
etot
-1 -
Met
ot-4
)
Mean
-7,6
-1.96 SD
-28,0
+1.96 SD
12,7
Şekil 3.8. Kifoz deformasyonu ölçmede Metot 1 ve Metot 4 Karşılaştırması
Çizelge 3.14. Kifoz deformasyonu ölçmede kullanılan metotların Bland-Altman
yöntemi ile uyumunun değerlendirilmesi
Farklara ait %95 Güven Aralığı
Ortalama Standart Sapma Alt Sınır Üst Sınır
Metot 1 - Metot 2 1,04 3,67 -6,17 8,25
Metot 1 – Metot 3 2,51 6,85 -10,92 15,94
Metot 1 – Metot 4 -7,6 10,38 -27,95 12,75
Metot 1; referans metot olduğunda, Metot 2 ile elde edilen ölçümler Metot 1 ile elde
edilen ölçümlerden 6,17 o büyük, 8,25 o küçük; Metot 3 ile elde edilen ölçümler
Metot 1 ile elde edilen ölçümlerden 10,92 o büyük, 15,94 o küçük; Metot 4 ile elde
edilen ölçümler Metot 1 ile elde edilen ölçümlerden 27,95 o büyük, 12,75 o küçük
çıkabilir. Bu durumda, kifoz deformasyonu ölçmede Metot 1 ile elde edilen
ölçümlerin en çok Metot 2 ile elde ölçüm değerleri ile uyumlu olduğu; en az da
Metot 4 ile elde edilen ölçümler ile uyumlu olduğu gözlenmiştir.
86
Ölçümler tekrarlı olarak elde edildiğinde, her bir metoda ait grup-içi standart
sapmalar karşılaştırılarak hangi metodun tekrarlanabilirliğinin daha fazla olduğu
tahmin edilebilir. Grup-içi standart sapması küçük olan metodun tekrarlanabilirliği
daha fazladır. Yapılan inceleme sonucunda referans metot olan Metot-1 ile elde
edilen ölçümlerin grup-içi standart sapması (5,09) diğer metotlarınkine göre daha
küçüktür. Metot-2 ile elde edilen ölçümlerin grup-içi standart sapması, 5,49; Metot-
3 ile elde edilen ölçümlerin grup-içi standart sapması 6,65; Metot-4 ile elde edilen
ölçümlerin grup-içi standart sapması ise 11,78 olarak bulunmuştur. Bu durumda
kifoz deformasyonu ölçmede, tekrarlanabilirliği en fazla olan ve güvenilir sonuçlar
veren metotların Metot-1 ve Metot-2 olduğu sonucuna varılabilir.
Sınıf-İçi Korelasyon Katsayısı (SKK)
SKK, her bir metot ile tek bir ölçüm elde edilmesi durumunda iki yönlü karma etki
modeli kullanılarak tahmin edilebileceği gibi, ölçümler tekrarlı olduğunda da tahmin
edilebilir. Burada, SPSS paket programı kullanılarak Metot-1, Metot-2, Metot-3,
Metot-4 ile tekrarlı ölçümler alınarak elde edilen kifoz deformasyon değerlerinin
uyumu SKK ile değerlendirilmiştir.
Çizelge 3.15. Kifoz deformasyonu ölçmede kullanılan metotların SKK ile
uyumunun değerlendirilmesi
Metotlar
SKK
%95 Güven Aralığı F
Değeri
p
Alt Sınır Üst Sınır
SKK (Mutlak Uyum) 0,65 0,38 0,80 3,95 <0,001
SKK (Tutarlılık) 0.77 0.73 0.81 3,95 <0,001
Kifoz deformasyonu ölçmek için geliştirilen metotların ölçümlerine ilişkin SKK
(mutlak uyum) değeri 0,65 olarak bulunmuşken; SKK (tutarlılık) değeri 0.77 olarak
bulunmuştur.
87
4. TARTIŞMA
Bu tez çalışmasında, metot karşılaştırma çalışmalarında kullanılan yöntemler, tek
ölçüm (single measurement) ve tekrarlı ölçüm olarak elde edilmiş olan iki ayrı veri
seti üzerinde uygulanmıştır. Kullanılan veriler, ilgili metotlar ile elde edilmiş ölçüm
değerleridir ve metotlar ile elde edilen bu ölçüm değerleri karşılaştırılarak metotların
uyumu hakkında sonuca varılmıştır.
Metotları karşılaştırmak için Bland-Altman yöntemi, Sınıf-içi korelasyon katsayısı
(SKK), Concordance korelasyon katsayısı (CKK), Deming regresyon ve Passing-
Bablok regresyon yöntemleri kullanılmıştır.
Metotlar arasındaki uyumu incelemek amacıyla, metotlar ile yalnızca bir ölçüm elde
edilmesi durumu için veriler üzerinde Bland-Altman yöntemi, SKK, CKK, Deming
regresyon ve Passing-Bablok yöntemlerinin her biri kullanılmışken; metotlar ile
tekrarlı ölçümler elde edilmesi durumunda yalnızca Bland-Altman,
Tekrarlanabilirlik ve SKK yöntemleri kullanılmıştır.
Her bir metot ile her bir denek üzerinden tek ölçümün alındığı veri seti
Elli dokuz denek üzerinden Bending ve Truga metotları ile PT, MT ve TL kemik
ölçüm değerleri elde edilmiş ve referans metot olduğu bilinen Bending ve Truga
metotları ile elde edilen ölçüm değerlerinin uyumu incelenmiştir.
Gerçek TL değerleri olan Post-op TL ile Bending ve Truga metotlarının her ikisi ile
elde edilen TL değerlerinin farklarının normal dağıldığı test edilmiş; farklar ve
ortalamalar arasında istatistiksel olarak anlamlı bir ilişki bulunmamıştır. Ancak
Bland-Altman uyum grafiği incelendiğinde hem Post-op TL ile Bending metodu ile
88
elde edilen TL değerlerine hem de Post-op TL değerleri ile Truga metodu ile elde
edilen TL değerlerine ait grafiklerde megafonik bir görüntü tespit edilmiştir. Uyum
sınırlarına ait %95 güvenle elde edilen aralıkların geniş olmasının bundan
kaynaklandığı tahmin edilmektedir. Megafonik görüntü logaritmik dönüşüm ile bir
miktar azaltılabilmişse de, tamamen ortadan kaldırılamamıştır.
Varsayımlar sağlandığından TL değerlerine ait ölçümlerin uyumunu değerlendirmek
için Bland-Altman yöntemi uygulanmıştır. Truga metodu ile elde edilen ölçümlere
ait uyum sınırlarının alt ve üst limitleri arasındaki fark, Bending metodu ile elde
edilen ölçümlere ait uyum sınırlarının alt ve üst limitleri arasındaki farka göre daha
dar olduğundan Truga metodu ile elde edilen ölçümlerin Bending metodu ile elde
edilen ölçümlere göre gerçek TL değerleri ile daha uyumlu sonuçlar verdiği
görülmüştür.
Sınıf-içi korelasyon katsayısı ve Concordance korelsyon katsayısı ile Bending ve
Truga metotları ile elde edilen MT değerleri ile gerçek Post-op MT değerleri
arasındaki uyum incelenmiştir. Bu iki metot arasındaki uyum, SKK (mutlak uyum)
ve CKK kullanılarak karşılaştırıldığında, bu iki değerin benzer sonuçlar verdiği
gözlenmiş ve MT değerlerini ölçmede Truga metodunun Bending metoduna göre
gerçek değerler ile daha uyumlu sonuçlar verdiği tespit edilmiştir. Ancak SKK
(mutlak uyum) değerine ait %95 güven aralıkları çok geniş bulunduğundan ölçümler
arasında matematiksel bir ilişkinin olabileceğinden şüphe duyularak, SKK
(tutarlılık) değerleri de incelenmiştir. Sonuç olarak, SKK (tutarlılık) değerlerine ait
%95 güven aralıklarının daraldığı gözlenmiştir. Bu durumda, Deming regresyon
yöntemi ile bulunacak denklemden yararlanılarak tahminler yapılabilir.
Deming regresyon ve Passing-Bablok regresyon yöntemleri ile de Bending ve Truga
metotları ile elde edilen ölçümlerden öncelikle PT daha sonra da MT değerleri
arasındaki uyum incelenmiştir. Ancak iki metot ile elde edilen PT ölçümleri
arasında sistematik veya orantısal bir yanlılık gözlenmediğinden metotlar arasındaki
uyumu karşılaştırmada Bland-Altman yönteminin kullanılması daha uygun
89
bulunmuştur. Bland-Altman analizi sonucunda, bu iki metotla elde edilen PT
değerlerinin birbirleri ile uyumlu sonuçlar verdiği gözlenmiştir. Bending ve Truga
metotları ile elde edilen MT değerleri Deming regresyon ve Passing-Bablok
regresyon yöntemleri ile incelendiğinde, iki metoda ait ölçümler arasında hem
sistematik hem de orantısal yanlılık gözlenmiştir. Bulunan regresyon doğruları
yardımıyla, Truga metodu ile elde edilen ölçüm değerleri kullanılarak referans
metot olan Bending metodu ile bulunacak MT değerleri tahmin edilebilir.
Tekrarlı ölçümlere ilişkin yöntemlerin incelendiği veri seti
Otuz dört denek üzerinden, kifoz deformasyonu ölçmek için kullanılan Metot-1,
Metot-2, Metot-3 ve Metot-4 ile elde edilen ölçümler arasındaki uyum incelenmiştir.
Çalışmada hangi metodun referans metot olduğu bilinmediğinden Metot-1 referans
metot olarak kabul edilmiştir.
Bland-Altman yöntemi sonucunda, Kifoz deformasyonu ölçmede Metot 1 ile elde
edilen ölçümlerin en çok Metot 2 ile elde ölçüm değerleri ile uyumlu olduğu; en az
da Metot 4 ile elde edilen ölçümler ile uyumlu olduğu gözlenmiştir.
Metotların tekrarlanabilirlikleri karşılaştırıldığında ise, Metot-1 ve Metot-2’nin
tekrarlanabilirliklerinin daha fazla olduğu bulunmuştur. Bu nedenle, bu iki metodun
diğerlerine göre daha güvenilir sonuçlar verdiği anlaşılmıştır.
Sınıf-içi korelasyon katsayısı kullanılarak metotlar arsındaki uyum incelendiğinde,
bu dört metot ile elde edilen ölçümler için elde edilen SKK (mutlak uyum) değeri
için bulunan %95 güven aralığı, SKK (tutarlılık) değerine ait %95 güven aralığına
göre daha dar bulunmuştur.
90
5. SONUÇ VE ÖNERİLER
Son yıllara kadar ölçüm metotları arasındaki uyumu değerlendirmek amacıyla
Pearson korelasyon katsayısı, regresyon analizi gibi klasik istatistik yöntemleri
kullanılmaktaydı. Ancak yapılan çalışmalar bu yöntemlerin uyumu ölçmede
kullanılmasının uygun olmadığını göstermiş ve bunlara alternatif yöntemler
önerilmiştir. Metot karşılaştırma çalışmalarında son yıllarda sıkça kullanılan bu
alternatif yöntemler, Bland-Altman yöntemi, Sınıf-içi korelasyon katsayısı (SKK),
Concordance korelasyon katsayısı (CKK), Deming regresyon ve Passing-Bablok
regresyon yöntemleridir.
Metot karşılaştırma çalışmaları için geliştirilen bu yöntemler, metotlar arasındaki
mutlak uyumun yanında ilişkisel uyumun da incelenmesine olanak sağlar. Bland-
Altman yöntemi ve CKK metotlar arasındaki mutlak uyumu; Deming ve Passing-
Bablok regresyon yöntemleri ise metotlar arasındaki ilişkisel uyumu değerlendirir.
SKK ise, hem mutlak hem de ilişkisel uyumu değerlendirmeye olanak tanır.
Bu tez çalışmasında, metot karşılaştırma çalışmalarında kullanılan bu yöntemler ve
bu yöntemler ile ilgili olan kavramlar ayrıntılarıyla anlatılmıştır. Daha sonra ise,
biri, her bir metot ile her bir denek üzerinden tek ölçüm değeri alınarak; diğeri ise,
her bir metot ile her bir denek üzerinden tekrarlı ölçüm değerleri alınarak elde
edilmiş iki ayrı veri seti üzerinde bu yöntemler uygulanmış ve metotların birbirleri
ile uyumu incelenmiştir.
91
ÖZET
Klinik Araştırmalarda Sürekli Sonuçlu Ölçüm Tekniklerinin Uyumunun
İncelenmesinde Kullanılan İstatistiksel Yöntemler
Metot karşılaştırma çalışmalarda, yeni bir ölçüm metodunun ile referans olarak kullanılan
ölçüm metodunun uyum düzeyi çeşitli istatistiksel yöntemler kullanılarak incelenir.
Genellikle ölçüm metotları arasındaki uyumu belirlemek için korelasyon ve regresyon
analizi kullanılır. Fakat korelasyon ve regresyon analizi uyumu ölçmede doğru yöntemler
değildir.
Bu çalışmada, bu yöntemlere alternatif olan grafiksel teknik ve basit hesaplamaları temel
alan Bland-Altman yöntemi; ölçümler sürekli olduğunda, metot-içi ve metotlar-arası
uyumun değerlendirilmesinde kullanılan Sınıf-İçi Korelasyon Katsayısı; doğruluk ve
kesinlik kavramlarını da değerlendiren Concordance Korelasyon Katsayısı; hataların normal
dağıldığı varsayımı altında her iki değişkendeki ölçüm hatasını dikkate alan Deming
Regresyon ve parametrik olmayan Passing-Bablok yöntemleri tanıtılmıştır.
Anahtar Kelimeler: Bland-Altman Yöntemi, Concordance Korelasyon Katsayısı, Deming
ve Passing-Bablok Regresyon Yöntemleri, Metot Karşılaştırma, Sınıf-İçi Korelasyon
Katsayısı
92
SUMMARY
Statistical Methods Used for Measuring Agreement Between Continuous Outcome
Measurement Methods In Clinical Researches
In some clinical researches, degree of agreement between a new measurement method and
an established one is assessed by using a variety of statistical analysis. In general,
correlation and regression analysis are commonly used for this purpose. However use of
these analyses lead to misleading.
In this study, some alternative approaches, “Bland-Altman method”, based on graphical
techniques; Intraclass Correlation Coefficient, used when the measurements are continuous
for evaluating inter-method and intra-method agreement; Concordance Correlation
Coefficient, used for evaluating both precision and accuracy as well; Deming Regression,
assuming errors distribute with normally, taken into account both method measurements’
errors and non-parametric Passing-Bablok Regression techniques are explained.
Key Words: Bland-Altman Technique, Concordance Correlation Coefficient, Deming and
Passing-Bablok Regression Techniques, Intraclass Correlation Coefficient, Method
Comparison
93
KAYNAKLAR
ALPAR, R. (2010). Spor Bilimlerinde Uygulamalı İstatistik. Nobel Yayın Dağıtım.
ALANAY, A., PEKMEZCİ, M., KARAEMİNOĞULLARI, O., ACAROĞLU, E., YAZICI,
M., ÇİL, A., BAS, P., GENÇ, Y., ÖNER, F. (2007). Radiographic measurement of
the sagittal plane deformity in patients with osteoporotic spinal fractures evaluation
of intrinsic error. Eur Spine J., 16: 2126-2132.
ATKINSON, G., NEVILL, A. (1997). Comment on the use of concordance correlation to
assess the agreement between two variables. Biometrics., 53(2): 775-777.
ATEŞ, C., ÖZTUNA, D., GENÇ, Y. (2009). Sağlık araştırmalarında sınıf içi korelasyon
katsayısının kullanımı. Türkiye Klinikleri J. Biostat., 1(2): 59-64.
BARNHART, H., HABER, B., LIN, L. (2007). An overview on assessing agreement with
continuous measurement. J. Biopharm. Stat., 17: 529-569.
BLAND, J., ALTMAN, D. (1999). Measuring agreement in method comparison studies.
Stat. Methods. Med. Res., 8: 135-160.
BLAND, J., ALTMAN, D. (1990). A note o n the use of the intraclass correlation
coefficient in the evaluation of agreement between two methods of measurement.
Comput. Biol.Med., 20(5): 337-340.
BLAND, M., ALTMAN, D. (2007). Agreement between methods of measurement with
multiple observations per individual. J. Biopharm. Stat., 17: 571-582.
BLAND, M., ALTMAN, D. (2010). Statistical methods for assessing agreement between
two methods of clinical measurement. NS., 6: 1-6.
BRUTON, A., CONWAY, J., HOLGATE, S. (2000). Reliability: What is it and how is it
measured. Physicotheraphy., 86(2): 94-99.
CARSTENSEN, B. (2010). Comparing Clinical Measurement Methods. John Wiley and
Sons. 1st Ed.
CHINCHILLI, V., MARTEL, J., KUMANYIKA, S., LLOYD, L. (1996). A weighted
concordance correlation coefficient for repeated measurement designs. Biometrics.
52: 341-353.
CHINN, S. (1990). The assessment of methods of measurement. Stat. Med., 9: 351-362.
94
CORNBLEET, J., GOCHMAN, N. (1979). Incorrect least-squares regression coefficients in
method-comparison analysis. Clin. Chem., 25: 432-438.
CORRASCO, J., Jover, J. (2003). The concordance correlation coefficient estimated
through variance components. Conferencia Espanola de Biometria. 9: 28-30.
ERCAN, İ., KAN, İ. (2004). Ölçeklerde güvenilirlik ve geçerlilik. Uludağ Üniversitesi Tıp
Fakültesi Dergisi. 30(3): 211-216.
GENÇ, Y., SERTKAYA, D., DEMİRTAŞ, S. (2003). Klinik araştırmalarda iki ölçüm
tekniğinin uyumunu incelemede kullanılan istatistiksel yöntemler. Ankara
Üniversitesi Tıp Fakültesi Mecmuası., 29(1): 1-6.
HABER, M., BARNHART, H. (2006). Coefficient of agreement for fixed observers. Stat.
Methods. Med. Res., 15: 255-271.
HOLLIS, S. (1997). Analysis of method comparison studies. JIFCC., 9(1): 8-12.
LIN, L. (1989). A concordance correlation coefficient to evaluate reproducibility.
Biometrics. 45: 255-268.
LINNET, K. (1993). Evaluation of regression procedures for methods comparison studies.
Clin. Chem., 39(3): 424-432.
MAGARİ, R. (2002). Statistics for laboratory method comparison studies. Biopharm., 38:
28-32.
MANTHA, S., ROIZEN, M., FLEISHER, L. (2000). Comparing methods of clinical
measurement: Reporting standards for Bland and Altman analysis. Anesth. Analg., 90:
593-602.
MCGRAW, K., WONG, S. (1996). Forming inferences about some intraclass correlation
coefficients. Psychol. Methods., 1(1): 30-46.
ÖZDAMAR, K. (2003). SPSS ile Biyoistatistik. Kaan Kitabevi. 5. Baskı.
POLLOCK, M., JEFFERSON, S., KANE, J., LORNAX, K., MACKINNON, G.,
WINNARD, C. (1992). Ann. Clin. Biochem., 29: 556-560.
SARAÇLI, S. (2008). Ölçüm Hatalı Modellerde Doğrusal Regresyon Tekniklerinin
Karşılaştırılması. Yayınlanmış doktora tezi.
SARAÇLI, S. (2009). Medikal metot karşılaştırma çalışmalarında deming regresyon
tekniği. Türkiye Klinikleri J. Biostat., 1(1): 9-15.
95
SARAÇLI, S. ve ÇELİK, E. (2011). Performance of ols-bisector regression in method
comparison studies. World Appl. Sci. J., 12(10): 1860-1865.
SHROUT, P., FLEISS, J. (1979). Intraclass correlations: Uses in assessing rater reliability.
Psychol. Bull., 86(2): 420-428.
WESTGRAD, J., HUNT, M. (1973). Use and interpretation of common statistical tests in
method-comparison studies. Clin. Chem., 19(1): 49-57.
96
ÖZGEÇMİŞ
I - Bireysel Bilgiler
Adı ve Soyadı : Gamze AKKOCA
Doğum Yeri ve Tarihi : Ankara, 13.05.1985
Uyruğu : T.C.
Medeni Durumu : Bekar
Adres : Fakülteler Mahallesi Yeni Acun Sokak 17/8 Cebeci - ANKARA
E-posta : [email protected]
Telefon : 0312-363-26-19
II - Eğitimi
Ankara Üniversitesi / Biyoistatistik Yüksek Lisans (2012)
Başkent Üniversitesi / İstatistik ve Bilgisayar Bilimleri (2008)
Cumhuriyet Lisesi (Yabancı Dil Ağırlıklı Lise) (2003)
Yabancı Dil: İngilizce
III – Bilimsel İlgi Alanları
İstatistik, Biyoistatistik, Bilgisayar
IV – Bilimsel Etkinlikleri
EMR–IBS Eastern Mediterranean Region of the Inernational Biometric Society
- Veri Madenciliği Katılım Belgesi
EMR–IBS Eastern Mediterranean Region of the Inernational Biometric Society
- Katılım Belgesi
V – Üye Olduğu Kuruluşlar
Başkent Üniversitesi Mezunlar Derneği
EMR–IBS Eastern Mediterranean Region of the Inernational Biometric Society