FlyBase Veri Tabanı

FlyBase, Drosophila melanogaster (meyve sineği) genomu üzerine odaklanan kapsamlı bir biyolojik veri tabanıdır. Bu model organizma, genetik ve gelişim biyolojisi araştırmalarında sıkça kullanıldığı için FlyBase, bu alandaki bilim insanları için vazgeçilmez bir kaynaktır.

FlyBase’in Sunduğu Özellikler

  • Genom Anotasyonu: Meyve sineğinin tüm genleri, proteinleri ve bunların işlevleri hakkında detaylı bilgiler sunar.
  • Genetik Haritalar: Kromozom üzerindeki genlerin konumlarını gösteren interaktif haritalar sağlar.
  • Mutasyon Veritabanı: Bilinen tüm mutasyonlar ve bunların fenotipik etkileri hakkında bilgi verir.
  • Ekspresyon Verileri: Farklı gelişim evrelerinde ve dokulardaki gen ekspresyon seviyelerini gösteren veriler sunar.
  • Protein-Protein Etkileşimleri: Proteinler arasındaki etkileşimleri gösteren ağ yapılarını sunar.
  • Arama ve Görselleştirme Araçları: Gen, protein veya fenotip adı gibi anahtar kelimeler ile arama yapma ve sonuçları görselleştirme imkanı sunar.

FlyBase’i Nasıl Kullanabilirim?

FlyBase, kullanıcı dostu bir arayüze sahiptir. Ancak, biyoinformatik konusunda temel bilgilere sahip olmak, veri tabanından en iyi şekilde yararlanmanıza yardımcı olacaktır.

  1. Arama Yapma:
    • Gen Adı: Arama çubuğuna bildiğiniz bir gen adını yazıp arama yapabilirsiniz.
    • Fenotip: Belirli bir fenotipe neden olan genleri bulmak için fenotip terimlerini kullanabilirsiniz.
    • Kromozom Konumu: Kromozom üzerindeki belirli bir bölgedeki genleri bulmak için koordinatları kullanabilirsiniz.
  2. Veri Görselleştirme:
    • Gen Görselleştirme: Bulduğunuz genin kromozom üzerindeki konumu, ekzon-intron yapısı ve diğer özellikleri interaktif olarak görebilirsiniz.
    • Ekspresyon Profileri: Farklı koşullardaki gen ekspresyon seviyelerini grafik olarak görebilirsiniz.
    • Protein-Protein Etkileşim Ağları: Bir proteinin diğer proteinlerle olan etkileşimlerini ağ yapısı olarak görebilirsiniz.
  3. Veri İndirme:
    • Nükleotid Dizileri: İlgilendiğiniz genlerin nükleotid dizilerini FASTA formatında indirebilirsiniz.
    • Protein Dizileri: İlgilendiğiniz proteinlerin amino asit dizilerini FASTA formatında indirebilirsiniz.
    • Ekspresyon Verileri: Ekspresyon verilerini tablolara veya grafiklere dönüştürebilirsiniz.

FlyBase’in Önemi

  • Model Organizma Araştırmaları: Meyve sineği, genetik ve gelişim biyolojisi araştırmalarında sıkça kullanılan bir model organizmadır. FlyBase, bu alandaki bilim insanlarına önemli bir kaynak sunar.
  • İnsan Hastalıklarının Anlaşılması: Meyve sineği ile insanlar arasında birçok genetik benzerlik vardır. Bu nedenle, FlyBase’deki bilgiler, insan hastalıklarının genetik temellerini anlamaya yardımcı olabilir.
  • Yeni Genlerin ve İşlevlerinin Keşfi: FlyBase, yeni genlerin ve proteinlerin keşfedilmesi ve işlevlerinin anlaşılması için önemli bir araçtır.

Özetle, FlyBase, meyve sineği genomu hakkında kapsamlı bilgi sunan ve biyoinformatik araçları ile bu bilgileri analiz etmenizi sağlayan güçlü bir veri tabanıdır. Genetik, gelişim biyolojisi ve ilgili alanlarda çalışan bilim insanları için vazgeçilmez bir kaynaktır.

Kaynak : Yapay zekadan alınmıştır (gemini.google.com)

Finding related genes in FlyBase: Gene Groups

Kaynak : https://youtu.be/GQ_2X29Gx-E?si=VxhWJ7pXcS24YLOJ

GenBank

Genbank, NCBI’da bulunan ve nükleotid dizilerinin depolandığı bir veri tabanıdır.ABD Ulusal Biyoteknoloji Bilgi Merkezi'nde(NCBI)[ncbi] bulunan Genbank veri tabanı

ABD Ulusal Biyoteknoloji Bilgi Merkezi’nde(NCBI)[ncbi] bulunan Genbank veri tabanı, belki de en iyi bilinen nükleotid dizi veri tabanıdır.

NCBI’daki DNA dizi veri tabanı olan GenBank[genbank] veri tabanında, ücretsiz olarak erişilebilir toplam nükleotid sayısı Ağustos 2016’da 196 milyon DNA dizisinde 218 milyar baz olarak açıklanmıştır.

Dizi verilerinin Genbank’a girişi web sayfasından[bankit] veya büyük veri setleri söz konusu ise e-posta yoluyla[sequin] herkes tarafından yapılabilmektedir. Yeni dizi verilerinin herhangi bir bilimsel dergide yayınlanabilmesi için ilk olarak Genbank’a veya Genbank ile ilişkili veri tabanlarından birine[örn. Avrupa Nükleotid Arşivi(ENA) veya Japoya Veri Tabanı[DDBJ]] veri girişinin yapılması gerekir.

Kaynak : Genbank (biyoinformatik.net)

GenBank kullanımı

Kaynak : https://youtu.be/g5a__okj5Zs?si=hyVfqNSZ4lFieURz

UniProt

EBI’de dünyanın en büyük tekrarsız ver tabanı olan UniProtKB[uniprot] toplam 65 milyon protein dizisi içermektedir. EBI, SIB ve GeorgeTown Üniversitesi’nin ortak veri tabanı olup, Swissprot, TrEMBL ve PIR veri tabanlarına ait bilgilerin tamamını içermektedir ve protein bilgisinin merkezi havuzu olarak hizmet etmektedir.

Verilen bir genin fonksiyonunu ve protein sekansını UniProt üzerinden bulabiliriz.

Gen Fonksiyonu Bulmak

Protein Lipoprotein lipase proteinin fonksiyonlarını bulmak için Uniport veri tabanını ve protein adını kullanacağız. İlgili proteinin fonksiyonunu bulmak için sırasıyla:

  1. https://www.uniprot.org/ adresine gidiniz,
  2. Arama kutucuğuna Protein Lipoprotein lipase yazınız ve arama butonuna tıklayınız.

ncbi gen sekansı arama

İlgili proteini bularak kutucuğun yanındaki (P06858) ismi üzerine tıklayarak detaylarına bakabiliriz.ncbi gen sekansı arama

Gelen sayfadan Function sekmesine bakıyoruz.ncbi gen sekansı arama

Trigliserit metabolizmasında anahtar enzim. Dolaşımdaki şilomikronlardan ve çok düşük yoğunluklu lipoproteinlerden (VLDL) trigliseritlerin hidrolizini katalize eder ve böylece kan akımından lipidlerin temizlenmesinde, lipid kullanımında ve depolanmasında önemli bir rol oynar (PubMed:8675619, PubMed:11342582, PubMed:27578112). Hem fosfolipaz hem de trigliserit lipaz aktivitelerine sahip olmasına rağmen, öncelikle düşük fakat saptanabilir fosfolipaz aktivitesine sahip bir trigliserit lipazdır (PubMed:7592706, PubMed:12032167). Kılcal damarlardaki trigliserit açısından zengin lipoprotein parçacıklarının marjinasyonuna aracılık eder (PubMed:24726386). GPIHBP1 ve hücre yüzeyi heparan sülfat proteoglikanlarına (PubMed:11342582, PubMed:27811232) bağlanarak vasküler endotelin luminal yüzeyindeki etki alanına alınır.

Protein Sekansını Bulmak

Protein sekansını elde etmek için Uniprot ID‘sini ve uniprot veri tabanını kullanacağız. Uniprot ID’si P06858 ‘in protein sekansını elde etmek için sırasıyla:

  1. https://www.uniprot.org/ adresine gidiniz,
  2. Arama kutucuğuna P06858 yazınız ve arama butonuna tıklayınız.

uniprot protein sekansı arama

Protein ID’si ile arama yaptıktan sonra gelen yeni sayfada, protein sekansını FASTA formatında elde etmek için sırasıyla:

  1. Sol tarafta bulunan menüden Sequence‘i seçiniz,
  2. FASTA formatında dosyayı indirmek için Download butonuna tıklayınız.

uniprot protein sekansı arama

Tüm adımları sorunsuz bir şekilde tamamladıktan sonra FASTA formatına erişmiş olmanız gerekir. İsterseniz dosyayı bilgisayarınıza kaydedebilir ya da kopyalayıp kullanabilirsiniz.

https://www.uniprot.org/uniprot/P06858.fasta adresinden P06858’e ait protein sekansı aşağıdaki gibi elde edilmelidir.

Kaynak : UniProt (biyoinformatik.net)

PDB Veri Tabanı

Avrupa tabanlı olan PDBe ( Protein DataBank in Europe) ve Amerikan tabanlı olan PDB (Protein Databank) ortak çalışmakta olup proteinlerin üç boyutlu (3D) yapısını depolar. Her bir yapı için ayrı ayrı detaylı analizler ve şematik sistemler içerir. UniProt  protein  veri tabanında   araştırılan  bir proteinin   yapısı   hakkında   bilgi   edinmek   için,  PDBe veri tabanı UniProt’ dan elde edilen kimlik numarası ile sorgulanabilir.

ınterpro ebı ile ilgili görsel sonucu

      

Yukarıda bahsettiğimiz veri tabanları sayesinde nükleotidler, proteinler ve bu yapıların işlevleri, fonksiyonları ile ilgili verilere rahatlıkla ulaşabiliriz. Fakat istenmeyen verileri filtrelemek, elde edilen veriler arasında bağlantılar kurmak ve daha kapsamlı araştırmalar yapabilmek için biyoinformatikte analiz araçları geliştirilmiştir.

•  Veri Madenciliği: BioMART

•  Dizi hizalama: CLUSTAL

•  Dizi karşılaştırma: BLAST

Bu analiz araçlarından olan BLAST hakkında bir sonraki yazımızda detaylı bilgiler vereceğiz.

Kaynak : Biyoinformatikte Veri Tabanları (biyoinformatikdunyasi.blogspot.com)

PDB Kullanımı

Kaynak : https://youtu.be/FJTCrrs3PKs?si=addefQqF_bD7040F

EBI Veri tabanı nedir?

Biyoinformatik alanı, çalışma alanı itibariyle biyolojik bilgilerin oluşturulması ve bu oluşturulan bilgilerin düzenli bir biçimde saklanması için veri tabanlarına ihtiyaç duyar. Biyolojik veriler, oldukça yoğun olduğundan dolayı haliyle bir veri tabanına -sistematik ve düzenli bir şekilde çalışmak için- gereksinim duyar. Bu yoğun biyolojik verilerin oluşturulması, depolanması ve saklanması için farklı veri tabanları geliştirilmiştir. 

Veri tabanları, genler üzerinde analizler yapılması, hastalıklar arasında ilişkilerin belirlenmesi ve yorumlanması amacıyla büyük önem taşır. Şimdi veri tabanlarını yakından inceleyelim.

En çok kullanılan ve en yaygın olarak bilinen veri tabanları; Amerika tabanlı NCBI (National Center for Biotechnology Information), Avrupa tabanlı EBI (European BioinformaticInstitue) ve Japonya temelli DDBJ (DNA Databank of Japan)’ dir. Bu kuruluşlar, dizilerin oluşturulması ve bu bilgilerin paylaşılmasında birbirleriyle ortak çalışma içerisindedirler ve internet üzerinden kullanılabilen birçok biyoinformatik aracını da biz biyoinformatik araştırmacılarının hizmetine sunarlar.

Kaynak : Biyoinformatikte Veri Tabanları (biyoinformatikdunyasi.blogspot.com)

EMBL – EBI Başlangıç Eğitimi

Kaynak : https://youtu.be/AgMw7yRfr3E?si=cNULknQBza1ZaBFD

Ensembl Veri Tabanı ve Kullanımı :

Ensembl, birçok canlı türünün genom bilgilerini kapsayan kapsamlı bir biyoinformatik veri tabanıdır. Avrupa Biyoinformatik Enstitüsü (EBI) tarafından geliştirilen bu veri tabanı, genetik araştırmalarda sıklıkla kullanılan bir kaynak olarak öne çıkmaktadır.

Ensembl Neden Önemlidir?

  • Genom Bilgileri: İnsan, fare, sıçan, zebrafish ve birçok başka organizmanın genom sekanslarını, gen yapılarını ve genlerin proteinlere çevrilme süreçlerini detaylı bir şekilde sunar.
  • Genetik Çeşitlilik: Farklı popülasyonlar arasındaki genetik çeşitliliği incelemek için önemli veriler sağlar.
  • Evrimsel Analizler: Türler arasındaki evrimsel ilişkileri anlamak için kıyaslamalı genomik çalışmalar yapmaya olanak tanır.
  • Hastalık Araştırmaları: Genetik hastalıkların nedenlerini anlamak ve yeni tedavi yöntemleri geliştirmek için kullanılır.
  • Biyoinformatik Araçlar: Veri analizi için kullanılabilecek birçok biyoinformatik aracı sunar.

Ensembl’de Ne Tür Bilgiler Bulunur?

  • Genom sekansları: DNA dizileri
  • Gen annotasyonları: Genlerin konumu, büyüklüğü, işlevi gibi bilgiler
  • Protein yapıları: Proteinlerin üç boyutlu yapıları
  • Genetik varyantlar: DNA dizilerindeki farklılıklar
  • Regülatör bölgeler: Genlerin ifade edilmesini kontrol eden bölgeler
  • Evrimsel korunmuş bölgeler: Farklı türlerde benzer işlevleri olan bölgeler

Ensembl Nasıl Kullanılır?

Ensembl, kullanıcı dostu bir arayüze sahiptir. Arama çubuğunu kullanarak gen adları, proteinler, kromozom bölgeleri veya diğer anahtar kelimeler ile arama yapabilirsiniz. Arama sonuçları, genlerin detaylı bilgileri, genetik haritalar, protein yapıları gibi çeşitli formatlarda görüntülenir. Ayrıca, Ensembl’in sağladığı biyoinformatik araçları ile daha detaylı analizler yapabilirsiniz.

Ensembl’in Diğer Veri Tabanlarıyla Farkı Nedir?

Ensembl, diğer genom veri tabanlarına göre daha kapsamlı bir şekilde genetik çeşitliliği ve evrimsel ilişkileri incelemeye odaklanır. Ayrıca, sürekli güncellenen ve geliştirilen bir platformdur.

Özetle, Ensembl, biyologlar, genetikçiler ve biyoinformatikçiler için vazgeçilmez bir araçtır. Genomik verileri analiz etmek, genetik hastalıkları anlamak ve yeni biyolojik keşifler yapmak için Ensembl’i kullanabilirsiniz.

Kaynak : Yapay zeka ( gemini.google.com)

Ensembl kullanımına ait detaylı bilgi

Kaynak : Ensembl Genome Browser (youtube.com)

Maize GDB Nedir ve Nasıl Kullanılır?

Maize GDB (Maize Genome DataBase), mısır genomu hakkında kapsamlı bir bilgi deposudur. Bu veritabanı, genetikçiler, bitki bilimciler ve tarım uzmanları için mısırın genetik yapısını incelemek, genlerin işlevlerini anlamak ve yeni çeşitler geliştirmek için değerli bir araçtır.

Maize GDB’nin İçerdiği Bilgiler

  • Genom sekansı: Mısırın tüm genetik bilgisini içeren nükleotit dizileri.
  • Gen annotasyonları: Genlerin konumu, büyüklüğü ve potansiyel işlevleri hakkında bilgiler.
  • Fenotip verileri: Mısır çeşitlerinin farklı özelliklerine (verim, hastalık direnci, vb.) ait veriler.
  • Genetik haritalar: Genlerin kromozomlar üzerindeki yerleşimi hakkında bilgiler.
  • Moleküler belirteçler: Genetik çeşitliliği incelemek için kullanılan belirteçler.
  • Literatür taraması: Mısırla ilgili bilimsel yayınlara erişim imkanı.

Maize GDB’nin Kullanım Alanları

  • Genetik araştırmalar: Yeni genlerin keşfi, gen fonksiyonlarının analizi, genetik çeşitliliğin incelenmesi.
  • Bitki ıslahı: Yeni mısır çeşitlerinin geliştirilmesi, istenen özelliklerin genetik olarak iyileştirilmesi.
  • Biyoinformatik analizler: Genom verilerinin analiz edilmesi, genetik ilişkilerin belirlenmesi.
  • Eğitim: Öğrencilerin ve araştırmacıların mısır genetiği hakkında bilgi edinmesi.

Maize GDB Nasıl Kullanılır?

Maize GDB, kullanıcı dostu bir arayüze sahiptir ve çeşitli arama ve analiz araçları sunar. Veritabanını kullanmak için genellikle aşağıdaki adımlar izlenir:

  1. Veritabanına erişim: Maize GDB’nin resmi web sitesine giderek veritabanına giriş yapılır.
  2. Arama yapma: İlgilendiğiniz gen, fenotip veya başka bir terim ile arama yapılır.
  3. Veri görüntüleme: Arama sonuçları, genlerin detaylı bilgileri, genetik haritalar, fenotip verileri gibi çeşitli formatlarda görüntülenir.
  4. Veri indirme: Gerekli veriler bilgisayarınıza indirilebilir ve daha detaylı analizler için kullanılabilir.
  5. Analiz araçları: Veritabanında bulunan analiz araçları ile genlerin fonksiyonlarını tahmin etmek, genetik ilişkileri incelemek gibi çeşitli analizler yapılabilir.

Not: Maize GDB’nin kullanımı için bazı biyoinformatik bilgisi gerektirebilir. Veritabanının sunduğu tüm özelliklerden yararlanmak için kullanıcı kılavuzunu dikkatlice okumanız önerilir.

Maize GDB’ye erişmek için resmi web sitesini ziyaret edebilirsiniz.

Eğer daha spesifik sorularınız varsa lütfen belirtiniz. Örneğin, belirli bir gen hakkında bilgi almak istiyorsanız gen adını veya işlevini belirtebilirsiniz.

Maize GDB gibi veritabanları, tarımın geleceği için büyük önem taşımaktadır. Bu tür veritabanları sayesinde bilim insanları, daha verimli, hastalıklara dayanıklı ve çevreye duyarlı mısır çeşitleri geliştirerek dünya nüfusunun beslenmesine katkıda bulunabilirler.

Kaynak : yapay zekadan alınmıştır. (gemini.google.com)

MaizeGDB kullanımına ait detaylı eğitim için

Kaynak : https://youtu.be/UYdud1tx4JM?si=BPmvOxyQ5-YcgvLE

SNPedia Veri Tabanı ve kullanımı :

SNPedia Nedir ve Nasıl Kullanılır?
SNPedia, insan genetiğini araştıran ve tek nükleotid polimorfizmleri (SNP’ler) hakkında bilgi sunan wiki tabanlı bir biyoinformatik web sitesidir. SNP’ler, DNA dizisindeki tek bir nükleotidin farklı bireyler arasında değişmesi durumudur ve birçok hastalık, fiziksel özellik ve ilaçlara verilen tepkilerle ilişkilendirilebilir.

SNPedia’nın sunduğu faydalar:

Bilimsel Bilgiye Erişim: Her SNP hakkında kısa açıklamalar, bilimsel makalelere bağlantılar ve mikrodızı bilgileri sunar. Bu sayede genetik verilerinizi daha iyi anlamanıza yardımcı olur.
Kişiselleştirilmiş Genetik Raporlar: SNPedia, Promethease gibi araçlarla birlikte kullanıldığında ham DNA verilerinizden kişiselleştirilmiş genetik raporlar oluşturmanıza olanak tanır.
Topluluk Katılımı: Wiki tabanlı olması sayesinde kullanıcılar yeni bilgiler ekleyebilir, mevcut bilgileri güncelleyebilir ve tartışmalara katılabilir.
SNPedia Nasıl Kullanılır?

Ham DNA Verilerinizin Oluşturulması: Bir genetik test şirketi aracılığıyla ham DNA verilerinizi elde etmeniz gerekir.
SNPedia’ya Veri Yükleme: Elde ettiğiniz ham DNA verilerini Promethease gibi bir araç kullanarak SNPedia’ya yükleyebilirsiniz.
Raporun İncelenmesi: Yüklenen veriler doğrultusunda SNPedia size detaylı bir rapor sunar. Bu raporda her bir SNP hakkında bilgi, olası etkileri ve bilimsel makalelere bağlantılar yer alır.
Sonuçların Yorumlanması: Raporu dikkatlice inceleyerek genetik yapınız hakkında bilgi edinebilirsiniz. Ancak, bu sonuçları kendi başınıza yorumlamak yerine bir genetik danışmana başvurmanız önemlidir.
Önemli Notlar:

Genetik Testlerin Sınırlamaları: Genetik testler tüm hastalıkları öngörebilir veya kesin bir teşhis koyabilir diye bir şey yoktur. Sonuçlar sadece olasılıkları gösterir.
Genetik Bilgilerin Gizliliği: Genetik verilerinizi paylaşırken gizlilik konusunda dikkatli olmanız gerekir.
Bilimsel Gelişmeler: Genetik alanındaki bilgiler sürekli olarak güncellenmektedir. Bu nedenle, SNPedia’daki bilgiler de zamanla değişebilir.

Kaynak : yapay zeka tarafından alınmıştır. (gemini.google.com)

Hızlıca SNPedia ‘ya bir tur at

Kaynak : https://youtu.be/5T7gYSMNTtc?si=FxltSYwf_w7vIoXj

NCBI Veritabanı ve Kullanımı :

Not : Bu bilgilendirme yazısı “Biyoinformatik Dünyası”ndan alınmıştır.

NCBI

Bir önceki yazımızda bahsetmiş olduğumuz veri tabanlarından biri olan NCBI(National Center for Biotechnology Information), hesaplama biyolojisinde araştırma yapan, genom verilerini analiz etmek için yazılım araçları geliştiren ve biyomedikal bilgiyi yayan, NLM(National Library of Medicine)’nin alt birimidir. 1988 yılında ABD’ de kurulmuştur.

NCBI, matematiksel ve bilişimsel yöntemler kullanarak, moleküler seviyede temel biyomedikal alanlardaki problemler üzerine araştırmalar için rehberlik yapar.  Makale, gen, protein, nükleotid gibi farklı veri tabanları içerir. Bu veri tabanları sayesinde, literatür tarama, sekans araştırması yapma, farklı organizmalara ait genetik bilgiyi araştırma vb. bir çok alanda araştırmacılara kaynak sağlar.

Öne çıkan popüler kaynaklar şöyledir;

PubMed: MEDLINE (Medical Literature, Analysis, and Retrieval System Online)’ da 24 milyondan fazla alıntıya erişim sağlayan National Library of Medicine (NLM) ve diğer ilgili veri tabanlarına çevrimiçi dergilerin katılımı ile birlikte bağlantı sağlayan arama servisidir. Ücretsiz bir kaynaktır. Bir makalenin tamamı- yazarlar tarafından sağlanılması durumunda- ücretsiz olarak görüntülenebilir.

Entrez: Bilimsel literatürü, DNA ve protein sekans veri tabanlarını, üç boyutlu protein yapı verilerini, nüfus çalışma veri kümelerini ve tam genomları sisteme entegre eder. PubMed Entrez’in literatür bileşenidir.

BLAST: BLAST (Basic Local Alignment Search Tool), NCBI’ ın nükleotid ve protein veri tabanlarının analizini desteklemek için tasarlanmış, sekans benzerliğini araştırmak için kullanılan araçtır. BLAST, sorgunun protein mi yoksa DNA mı olduğuna bakılmaksızın, kullanılabilir tüm dizi veri tabanlarını incelemek için tasarlanmış bir programdır. (Yazımızın ilerleyen kısımlarında BLAST ile ilgili daha detaylı bilgi vereceğiz.)

OMIM: Online Mendelian Inheritance in Man(OMIM) insan genlerini ve genetik bozukluklarını içeren bir katalogdur. Veri tabanı ayrıntılı referans bilgilerini içermektedir. Ayrıca, PubMed makalelerindeki sekans bilgilerini de içerir. Sürekli güncellenen bir veri tabanına sahiptir.  Bilinen tüm kalıtsal hastalıklarla ve 15,000 den fazla genle ilgili bilgi içerir.

NCBI, yaklaşık 200 kitabı çevrimiçi olarak sunmaktadır. Bu kitaplar aranabilir ve PubMed ile bağlantılıdır.

NCBI taksonomi sitesi, canlı organizmalar için bir taksonomi tarayıcısı içerir. Site, genetik kodlar ve taksonomi kaynakları gibi taksonomi bilgilerini ve soyu tükenmiş organizmalar üzerindeki moleküler veriler ve sınıflandırma şemalarındaki son değişiklikler gibi ek bilgileri içermektedir. Taksonomi Veri Tabanı, sekans veri tabanlarındaki tüm organizmalar için düzenlenmiş bir sınıflandırmadır. Şu anda gezegende açıklanan yaşam türlerinin yaklaşık% 10’unu temsil etmektedir.

NCBI yapı alanı, moleküler modelleme veri tabanı (MMDB), makro moleküler üç boyutlu yapıların veri tabanı ve bunların görselleştirilmesi ve karşılaştırmalı analizi için araçlar içerir. MMDB, Protein Data Bank’tan (PDB) elde edilen deneysel olarak belirlenmiş biyopolimer yapıları içerir. NCBI’ daki yapı kaynakları arasında, PDBeast, Cn3D (üç boyutlu bir yapı görüntüleyici) ve yapıların karşılaştırılmasına izin veren bir vektör hizalama arama aracı (VAST) yer alır.

BLAST ( BASIC LOCAL ALIGNMENT SEARCH TOOL) 

Yazımızın bu bölümünde BLAST ve kullanım alanlarından bahsetmeye çalışacağız.

Öncelikle elinizde bir protein veya DNA dizisi varsa ve bunların diğer dizilerle veya proteinlerle olan benzerliklerini bulmak istiyorsanız BLAST tam da aradığınız araç diyebiliriz. BLAST NCBI’ın veri tabanı dahilinde diziler ve proteinler arasında -ya da sadece bir kelimeyle bile (mouse serine ve protease gibi) arama yaptığınızda-  benzerlikleri saniyeler içerisinde bulmanızı sağlayan programdır.

Peki benzerlik derken neyi kastediyoruz ve bizim için neden önemli? Benzer diziler genellikle aynı atadan kalma dizileri taşırlar dolayısıyla benzer biyolojik fonksiyonu ve yapıyı paylaşırlar. Buna ek olarak benzelikte de nitelendirmeler yapılmış şöyle ki: eğer elinizdeki iki protein veya gen dizisi birbirine ‘çok fazla’ benziyorsa yani aynı atadan benzer yapıya ve fonksiyonlara sahiplerse  bunlara ‘’homolog’’ deniliyor. ‘Çok fazla benzer’ kriterine gelirsek burada bir takım gerekliliklerden bahsedeceğiz. Diyelim ki elinizde 100 aminoasit (bu nükleotit de olabilir) uzunluğunda bir diziniz var. Kurala göre bu proteinin homolog olması için %25’lik benzerlik oranının sağlanmış olması gerekiyor. DNA için ise bu değer en az %70 olmalı. Eğer değeriniz belirtilenlerden düşük çıkarsa yani %25’in altında bir değer elde ettiysek o zaman Twilight Zone dediğimiz durum söz konusu oluyor. Söz konusu durumda gözlemlediğimiz benzerliği yorumlarken yanılabiliriz. Örnek verecek olursak; varsayalım ki %15 benzerlik değerine sahip proteinlerin  3D yapısı tamamen aynı olabildiği gibi, %20 benzerlik oranına sahip proteinlerin yapılarının tamamen farklı olması gibi durumlarla karşı karşıya kalabiliriz.  İkinci bir durum da homolog veya homolog olmadığı hakkında da bir varsayımda bulunamayız. Homolog olma durumu da kendi içerisinde iki ayrı başlıkta inceleniyor bunlardan çok kısa bahsedecek olursak paralog ve ortolog kavramları karşımıza çıkıyor. Eğer homolog olan dizi farklı atadan gelip aynı işlevi görüyorsa ortolog olarak tanımlanıyor. Örnek olarak insanda ve ratta bulunan miyoglobin geninden bahsedelim. Miyoglobin kas dokusunda bulunur, oksijenin kanda taşınmasından sorumludur ve insanda da ratta da bu işlevde çalışır. Paralog da ise ortak atadan gelen genin farklı fonksiyonlarda çalışması durumudur. Örnek olarak (human) alpha-1 globin(NP_000508)  ve (human) alpha-2 globin (NP_000549)  %100  aynı amino asit dizilimine sahiptir fakat insan da ikisi de farklı fonksiyonlarda görev yapmaktadırlar. Peki, elimizde benzer özelliklerini bulmak istediğimiz dizi için aynı fonksiyonları mı kullanıyoruz diye sorarsanız cevabımız ‘hayır’. BLAST burada kendi içinde veri tabanlarını ayırarak bize kolaylık sağlıyor. BLAST içerisinde bulunan veri tabanları şöyledir; 

Devamını incelemek ve kaynak için :

NCBI ve BLAST ‘ a Giriş (biyoinformatikdunyasi.blogspot.com)