Beyin Göçü ve Göç Tutumları Üzerine Türk İnternet Medyası Söylemlerinde Açıklanabilir Türkçe Metin Sınıflandırması

dc.contributor.advisor Arsan, Taner
dc.contributor.author Yıldırım, Batuhan
dc.date.accessioned 2025-12-15T15:39:49Z
dc.date.available 2025-12-15T15:39:49Z
dc.date.issued 2025
dc.description.abstract Bu çalışmada, beyin göçü ve göç tutumlarına dair sosyal medya duygu içerikleri ile internet haberlerinde kullanılan Türkçe metinlerin açıklanabilir sınıflandırılmasına yönelik bütüncül bir çerçeve sunulmaktadır. Bunun için, sosyologlar tarafında toplanıp etiketlenmiş 2,343 haber makalesinden oluşan bir göç söylemi veri kümesi derlenmiş ve ana haber metinleri, Unicode normalleştirme, Türkçeye özgü lemmatizasyon ve özetleme yöntemleri ile 978 alt-kelime uzunluğunda vektörlere dönüştürülmüş ve bu veride metnin okuyucuya olan etkisi'ni temsil eden tonlama sütunu, pozitif ve negatif olacak şekilde sınıflandırma etiketleri olarak belirlenmiştir. Eğitimde Sadece Kodlayıcı (BERT), Sadece Kod Çözücü (GPT), Sadece Maskelenmiş Kod Çözücü (MaskedOnly) ve Kodlayıcı–Kod Çözücü (T5) olmak üzere çeşitli Transformer mimarileri test edilmiş, çapraz-dikkat mekanizmasına odaklanılması sebebiyle GPT ve T5 mimarileri ile devam edilmiştir. Etiketlerin doğruluğunu, gizli katman çıktılarının hizalanması ve potansiyel anahtar kelime gruplarını belirlemek için, yeni bir küme tutarlılık kaybı fonksiyonu aracılığı ile veriler uygun gruplara ayrılmış, YAKE, RAKE, KeyBERT1, KeyBERT2, BERTopic ve LDA ile elde edilen kümelere özgü anahtar kelimeler elde edilmiştir.Katman ve baş düzeyinde hesaplanan seyreklik, Kullback–Leibler sapması ve SHAP tabanlı katkı analizleri; alt katmanın genel bilgi topladığını, üst katmanın ise sınıf ayırıcı belirteçlere odaklandığını ortaya koymuş, belirli başların merkez anahtar kelimelere odaklandığı çapraz dikkat haritaları ile gözlemlenmesi sayesinde çapraz-dikkat mekanizmasının açıklanabilirlik için uygunluğunu gözler önüne sermiştir. Önerilen sistem, göç haberlerinde % 79.52 doğruluk oranına ve % 79.32 ağırlıklı F1 skoruna ulaşmıştır. Bu çalışma, düşük kaynaklı ve yüksek riskli metinsel uygulamalar için güvenilir Türkçe açıklanabilir Transformer modellerine dair ilk bütüncül altyapıyı sunmaktadır.
dc.description.abstract This thesis presents an integrated framework for explainable Turkish text classification applied to social media sentiment and Internet news on brain drain and migration attitudes. We construct two corpora: a 27,481-tweet sentiment dataset and a 2,343-article migration discourse collection, each preprocessed via Unicode normalization, Turkish‐specific lemmatization, and sequence length pruning to 978 subword tokens. Three Transformer paradigms, encoder‐only (BERT), decoder‐only (GPT), and encoder–decoder (T5), are re-fined-tuned with low‐rank adapters under an architecture‐preserving optimization schedule. A novel cluster consistency loss aligns Transformer hidden representations with class‐specific keyword clusters extracted by YAKE, RAKE, KeyBERT1, KeyBERT2, BERTopic, and LDA. Quantitative interpretability metrics, including head‐wise sparsity, layer‐wise Kullback–Leibler divergence, and SHAP‐based regional importance, reveal that lower layers gather broad evidence while upper layers concentrate on class‐defining tokens. Qualitative cross‐attention visualizations confirm a sharp semantic boundary at a specific token, with selected heads faithfully surfacing centroid keywords. The proposed system achieves 79.52 % accuracy and 79.32 % weighted F1 scores on migration news classification, while delivering human‐intuitive explanations that satisfy both fidelity and transparency. This work offers the first end‐to‐end pipeline for explainable Transformer classification in Turkish, laying a foundation for trustworthy AI in low‐resource and high‐stakes textual domains. en_US
dc.identifier.uri https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=V-oEQd0LkkqRGCXNzJWCTbE7CL5yILJalsKbnDbNKhtBHIKy6f1U6YyC_lqRhSe6
dc.identifier.uri https://hdl.handle.net/20.500.12469/7677
dc.language.iso en
dc.subject Bilim ve Teknoloji
dc.subject Dilbilim
dc.subject Science and Technology en_US
dc.subject linguistics en_US
dc.title Beyin Göçü ve Göç Tutumları Üzerine Türk İnternet Medyası Söylemlerinde Açıklanabilir Türkçe Metin Sınıflandırması
dc.title Explainable Turkish Text Classification for Internet Media Discourses on Brain Drain and Migration Attitudes en_US
dc.type Master Thesis en_US
dspace.entity.type Publication
gdc.author.institutional Arsan, Taner
gdc.description.department Lisansüstü Eğitim Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
gdc.description.endpage 173
gdc.identifier.yoktezid 970658
relation.isAuthorOfPublication 7959ea6c-1b30-4fa0-9c40-6311259c0914
relation.isAuthorOfPublication.latestForDiscovery 7959ea6c-1b30-4fa0-9c40-6311259c0914
relation.isOrgUnitOfPublication 2457b9b3-3a3f-4c17-8674-7f874f030d96
relation.isOrgUnitOfPublication b20623fc-1264-4244-9847-a4729ca7508c
relation.isOrgUnitOfPublication fd8e65fe-c3b3-4435-9682-6cccb638779c
relation.isOrgUnitOfPublication.latestForDiscovery 2457b9b3-3a3f-4c17-8674-7f874f030d96

Files

Collections