Akademik araştırmalarda yapılan istatistiksel analizlerin doğruluğu, veri setinin ne kadar düzgün hazırlandığıyla doğrudan ilişkilidir. Eksik veri, aykırı değerler, hatalı kodlamalar ve normallik problemleri, SPSS analiz sonuçlarını ciddi şekilde bozabilir. Bu nedenle veri temizleme, her bilimsel çalışmanın ilk ve en kritik aşamasıdır.
Bu yazıda SPSS veri temizleme sürecinin temel adımlarını; eksik veri analizi, aykırı değer tespiti, normallik kontrolleri ve değişken düzenleme aşamalarını akademik standartlara göre açıklıyoruz.
Veri temizleme; analiz öncesi veri setindeki hatalı, eksik, tutarsız veya analiz sonuçlarını bozabilecek değerlerin belirlenip düzeltilmesi işlemidir. Akademik araştırmalarda kullanılan istatistiksel testlerin varsayımlara uygun şekilde çalışabilmesi için veri temizliği mutlaka yapılmalıdır.
Veri temizleme yapılmadığında:
t testi ve ANOVA sonuçları hatalı çıkar
Regresyon modelleri yanlış yönlendirme yapar
Korelasyon analizleri gerçeği yansıtmaz
Cronbach Alpha güvenilirliği düşer
SPSS’te eksik veriler genellikle “.” şeklinde görünür. Eksik verinin türü, yöntemin seçilmesi açısından önemlidir.
Eksik veri türleri:
MCAR: Tamamen rastgele eksik
MAR: Rastgele eksik
MNAR: Rastgele olmayan eksik
Eksik veri oranı düşükse silme yöntemleri kullanılabilir. Oran yükseldikçe ortalama ile tamamlama veya regresyonla tahmin gibi yöntemler tercih edilir.
Aykırı değerler analiz sonuçlarını çarpıtır. SPSS’te aykırı değer tespiti için kullanılan yöntemler:
Boxplot (1.5 IQR dışındaki değerler)
Z skoru (|z| > 3)
Mahalanobis Distance (çok değişkenli aykırılık)
Aykırı değerlerin kaynağı tespit edilmeli, veri giriş hatasıysa düzeltilmeli; gerçek bir değer ise raporlanmalıdır.
Parametrik testlerin çoğu normal dağılım varsayımına dayanır. SPSS’te normallik:
Shapiro-Wilk
Kolmogorov-Smirnov
Histogram
Q-Q Plot
Skewness & Kurtosis
ile değerlendirilir.
Normallik sağlanmadığında non-parametrik testler tercih edilir.
SPSS veri temizleme sürecinde değişkenler analiz için uygun hale getirilir:
Kategorik değişkenlerin etiketlenmesi
Ters maddelerin yeniden kodlanması
Alt boyut ortalamalarının oluşturulması
Ölçek toplam puanlarının hesaplanması
Bu adımlar tamamlanmadan hipotez testlerine geçilmesi doğru değildir.
Regresyon modelleri gerçek ilişkileri yansıtmaz
ANOVA sonuçları hatalı görünür
Cronbach Alpha değerleri düşer
Korelasyon analizleri yanıltıcı sonuçlar verir
Bu nedenle veri temizliği, her istatistiksel analiz için temel bir gerekliliktir.
Eksik veri, aykırı değer ve normallik problemleri; akademik araştırmalarda istatistiksel hatalara yol açabilir. SPSS veri temizleme sürecinin doğru yapılması, hem hipotez testlerinin güvenilirliğini hem de raporlanan bulguların bilimsel geçerliliğini artırır.