Safra kesesi kanseri (GBC), safra yolu neoplazmaları arasında hastalığın en sık görülen nedenidir. GBC ilerlemesiyle bağlantılı moleküler mekanizmaları ve biyobelirteçleri belirlemek bilimsel araştırmalarda önemli bir zorluk olmuştur. Son zamanlarda yapılan birkaç çalışma GBC’deki biyobelirteçlerin rollerini araştırmıştır. Çalışmamız, makine öğrenimi (ML) ve biyoenformatik tekniklerini kullanarak GBC’deki biyobelirteçleri belirlemeyi amaçlamıştır. GBC tümör örneklerini normal örneklerle karşılaştırarak NCBI GEO veritabanından elde edilen iki mikrodizi veri setinden (GSE100363, GSE139682) farklı şekilde ifade edilen genleri (DEG’ler) belirledik. 39 yukarı düzenlenmiş ve 107 aşağı düzenlenmiş gen olmak üzere toplam 146 DEG bulundu. Bu DEG’lerin işlevsel zenginleştirme analizi DAVID aracılığıyla Gen Ontolojisi (GO) terimleri ve REACTOME yolları kullanılarak gerçekleştirildi. Protein-protein etkileşim ağı, STRING veritabanı kullanılarak oluşturuldu. Hub genleri tanımlamak için üç sıralama algoritması uyguladık: Derece, Çok Uluslu ve Yakınlık Merkeziyeti. Bu algoritmalardan hub genlerinin kesişimi 11 hub geni üretti. Eş zamanlı olarak, önemli gen alt kümelerini tanımlamak için iki özellik seçimi yöntemi (Pearson korelasyonu ve yinelemeli özellik eleme) kullanıldı. Daha sonra, GBC örneklerini en iyi şekilde ayırt eden gen alt kümesini belirlemek için GSE100363 veri kümesinde SVM ve RF kullanarak ve GSE139682 üzerinde doğrulama yaparak ML modelleri geliştirdik. Hub genleri diğer gen alt kümelerinden daha iyi performans gösterdi. Son olarak, NTRK2, COL14A1, SCN4B, ATP1A2, SLC17A7, SLIT3, COL7A1, CLDN4, CLEC3B, ADCYAP1R1 ve MFAP4 kritik genler olarak tanımlanırken, SLIT3, COL7A1 ve CLDN4’ün GBC gelişimi ve tahmini ile güçlü bir şekilde bağlantılı olduğu görüldü.
Kaynak: Makalenin ana kaynağı ve türkçe çevirisi için tıklayın