İlişkisel veritabanları, karmaşık veri kümelerini depolamak ve almak için verimli bir çözüm sunar; ancak SQL programlama uzmanlığı gereksinimi, birçok yaşam bilimi kullanıcısı için önemli bir zorluk teşkil eder. Son teknoloji ürünü bir büyük dil modelinin, sade İngilizce sorguları SQL betiklerine (Metinden SQL’e) etkili bir şekilde çevirip çeviremeyeceğini, böylece veritabanı etkileşimini basitleştirip tipik kullanım engellerini ortadan kaldırıp kaldıramayacağını araştırıyoruz. Beş Avrupa şehrinden 239 kanalizasyon örneğinden alınan 19 birbirine bağlı metagenomik analiz tablosundan oluşan karmaşık bir veritabanı mevcuttu. Veritabanının yapısı ve içeriği hakkında arka plan bilgileriyle birlikte büyük bir dil modeli sağlandı.
Bu “SewageGPT” aracının işlevlerini ve karmaşık sorulara verdiği yanıtların doğruluğunu ve sonuçların görselleştirilmesini değerlendirdik. Veritabanının ayrıntılı bir açıklamasının sağlanması, SewageGPT’nin karmaşık sorulara doğru bir şekilde yanıt vermesini ve veritabanı sorgulama sürecini hızlandırmasını sağladı. Veritabanı içeriğinin bilinmesi, sorgulardaki belirsizlik riskini en aza indirdiği için faydalı oldu; ancak belirsizlikler yanlış yanıtlara yol açabilir. Bu nedenle, özellikle ayrıntıdan yoksun veya belirsizlik içeren sorular için insan gözetimi hayati önem taşımaktadır. En son teknolojiye sahip büyük dil modellerinin doğrudan veritabanı bağlantısıyla bütünleştirilmesi, sorgu oluşturma, istatistiksel analiz ve sonuçların görselleştirilmesi verimliliğini önemli ölçüde artırır.
