Ham nanopore sinyal analizi, sinyalleri bazlara çevirmeden (yani baz çağrısı yapmadan) hızlı ve kaynak açısından verimli analiz sağlamak için genomikte yaygın bir yaklaşımdır. Ancak, çiftler halinde ham sinyal karşılaştırmasında artan gürültüyü ele almak için doğru mekanizmaların eksikliği nedeniyle referans genom bilinmiyorsa mevcut çözümler ham sinyalleri doğrudan yorumlayamaz. Amacımız, referans genom olmadan ham sinyallerin doğrudan analizini sağlamaktır. Bu amaçla, 1) karma tabanlı bir arama mekanizması kullanarak tüm ham sinyal çiftleri arasındaki benzerlik bölgelerini belirleyebilen, tümüne karşı tümü örtüşen olarak bilinen ve 2) bunları sıfırdan genomlar oluşturmak için kullanabilen ilk mekanizma olan Rawsamble’ı öneriyoruz, buna de novo birleştirme denir.
Çeşitli boyutlardaki birden fazla genomda yaptığımız kapsamlı değerlendirmeler, Rawsamble’ın temel çağrı (Dorado’nun en hızlı modu) ve bir CPU’da örtüşme (minimap2) için en son teknoloji araçlarını kullanan geleneksel bir genom birleştirme hattına kıyasla önemli bir hızlanma (ortalama 16,36 kat ve 41,59 kata kadar) sağladığını ve en yüksek bellek kullanımını (ortalama 11,73 kat ve 41,99 kata kadar) azalttığını göstermektedir. Rawsamble tarafından üretilen örtüşen çiftlerin %36,57’sinin minimap2 tarafından üretilenlerle aynı olduğunu buluyoruz. Rawsamble’dan gelen örtüşmeleri kullanarak, temel çağrı yapmadan doğrudan ham sinyallerden ilk de novo birleştirmeleri oluşturuyoruz. 2,7 milyon baz uzunluğa kadar (E. coli’nin genom uzunluğunun yarısı) bitişik birleştirme segmentleri (unitig’ler) oluşturabileceğimizi gösteriyoruz. Örtüşmeleri bularak ve de novo birleştirmeleri oluşturarak etkinleştirilebilecek daha önce keşfedilmemiş yönleri belirliyoruz . Ayrıca sonuçlarımızı GitHub sayfamızda tam olarak yeniden üretmek için betikler de sağlıyoruz.
Kaynak: Makalenin ana kaynağı ve türkçe çevirisi için tıklayın
