Kimyasalların gen düzenleyici etkilerinin tahmini için transfer öğrenimi / Bahattin Can Maral; thesis advisor Mehmet Tan.

By:

Maral, Bahattin Can [author]

Contributor(s):

Material type: Text

TextLanguage: Türkçe Publisher: Ankara : TOBB ETÜ Fen Bilimleri Enstitüsü, 2022Description: xii, 43 pages : illustrations ; 29 cmContent type:

text

Media type:

unmediated

Carrier type:

volume

Other title:

Transfer learning for predicting gene regulatory effects of chemicals [Other title]

Subject(s):

Dissertation note: Tez (Yüksek Lisans Tezi)--TOBB ETÜ Fen Bilimleri Enstitüsü Nisan 2022 Summary: Kemogenomik, ilaç tasarımına ve taramaya yardımcı olmak amacıyla biyolojik hedeflerin kimyasal bileşiklere genomik ve/veya proteomik reaksiyonunun incelenmesidir. Kemogenomikteki birçok zorluktan biri, gerçek yaşam deney verilerine bağımlılıktan kaynaklanmaktadır; farklı kimyasal bileşiklerin ve ilaç hedeflerinin kombinasyonu, gerçekçi olmayan sayıda olası deney yaratır ve bu da belirli kimyasallara ve hedeflere yönelik önyargılı veri kümeleriyle sonuçlanmaktadır. Yapay öğrenmedeki son gelişmeler, bu veri kümelerinin sınırlarını kolayca zorlayan güçlü modellerin aşırı doygunluğuyla sonuçlanmıştır. Bu yatkınlıkların etkilerini nötrlemek için, benzer problemlerden bilgi edinme yöntemi olan transfer öğrenmeyi kullanmaktayız. Kemogenomik veri setlerindeki en önemli yanlılık, ilaç hedeflerine yönelik olandır. Bazı hücre dizilerinin erişebilirliği ve önemi, bu deneyler için bir ilaç hedefi olarak kullanılma şansını büyük ölçüde artırırken, diğerlerinin yapay öğrenme modellerini eğitmek için ancak yeterli verisi vardır. Derin Bileşik Profil Oluşturucu (DeepCOP) üzerinde yapılan çalışmayı temel olarak kullanırken, transfer öğreniminin, çeşitli ilaç hedeflerinin eğitilebilirliğini büyük ölçüde artırdığını deneysel olarak göstermekteyiz. Deneyler için kullanılan model yapısı değiştirilmemiştir. DeepCOP'da kullanılan veri bölme yöntemine ek olarak iki yöntem daha eklenmiştir. \newpage Deneylerimiz transfer öğrenmenin basit yöntemlerinden biri olan parametre tabanlı transfer öğrenimine odaklanırken, ROC eğrisi altında kalan alan puanlarında \%22,81'e varan ve ortalama \%9,00 iyileşme göstermiştir; bununla birlikte hiperparametre optimizasyonu uygulandığı ve transfer kaynağı olarak doğru hücre hattı seçildiğinde bu iyileşmelerin arttırılabileceğine yönelik potansiyel göstermiştir.Summary: Chemogenomics is the study of the genomic and/or proteomic reaction of biological targets to chemical compounds, with the goal of aiding drug design and screening. One of the many difficulties in chemogenomics comes from the dependency on real-life experiment data; the combination of different chemical compounds and drug targets creates an unrealistic number of possible experiments, which results in datasets that are biased towards certain chemicals and targets. The recent developments in machine learning resulted in an over-saturation of powerful models that easily pushed the limits of these datasets. To undo the effects of these biases, we employ transfer learning, the method of leveraging knowledge from similar problems. The most important bias of chemogenomics datasets is the bias towards drug targets. The availability and significance of certain cell lines greatly increase the chance of it being used as a drug target for these experiments, while others have barely enough data to train machine learning models. We experimentally demonstrate that transfer learning greatly increases the trainability of various drug targets, while using the work done on the Deep Compound Profiler (DeepCOP) as a basis. While focused on one of the simple methods of transfer learning, our experiments showed up to 22.81\% and an average of 9.00\% improvement on the area under ROC curve scores and showed great potential to be improved upon if accompanied by hyperparameter optimization and correct cell line as the transfer source.

Tags from this library: No tags from this library for this title. Log in to add tags.

Average rating: 0.0 (0 votes)

Holdings
Item type	Current library	Home library	Collection	Call number	Copy number	Status	Date due	Barcode
Thesis	Merkez Kütüphane Tez Koleksiyonu / Thesis Collection	Merkez Kütüphane	Tezler	TEZ TOBB FBE BİL YL’22 MAR (Browse shelf(Opens below))	1	Ödünç Verilemez-Tez / Not For Loan-Thesis		TZ01402

Tez (Yüksek Lisans Tezi)--TOBB ETÜ Fen Bilimleri Enstitüsü Nisan 2022

Kemogenomik, ilaç tasarımına ve taramaya yardımcı olmak amacıyla biyolojik hedeflerin kimyasal bileşiklere genomik ve/veya proteomik reaksiyonunun incelenmesidir. Kemogenomikteki birçok zorluktan biri, gerçek yaşam deney verilerine bağımlılıktan kaynaklanmaktadır; farklı kimyasal bileşiklerin ve ilaç hedeflerinin kombinasyonu, gerçekçi olmayan sayıda olası deney yaratır ve bu da belirli kimyasallara ve hedeflere yönelik önyargılı veri kümeleriyle sonuçlanmaktadır. Yapay öğrenmedeki son gelişmeler, bu veri kümelerinin sınırlarını kolayca zorlayan güçlü modellerin aşırı doygunluğuyla sonuçlanmıştır. Bu yatkınlıkların etkilerini nötrlemek için, benzer problemlerden bilgi edinme yöntemi olan transfer öğrenmeyi kullanmaktayız. Kemogenomik veri setlerindeki en önemli yanlılık, ilaç hedeflerine yönelik olandır. Bazı hücre dizilerinin erişebilirliği ve önemi, bu deneyler için bir ilaç hedefi olarak kullanılma şansını büyük ölçüde artırırken, diğerlerinin yapay öğrenme modellerini eğitmek için ancak yeterli verisi vardır. Derin Bileşik Profil Oluşturucu (DeepCOP) üzerinde yapılan çalışmayı temel olarak kullanırken, transfer öğreniminin, çeşitli ilaç hedeflerinin eğitilebilirliğini büyük ölçüde artırdığını deneysel olarak göstermekteyiz. Deneyler için kullanılan model yapısı değiştirilmemiştir. DeepCOP'da kullanılan veri bölme yöntemine ek olarak iki yöntem daha eklenmiştir. \newpage Deneylerimiz transfer öğrenmenin basit yöntemlerinden biri olan parametre tabanlı transfer öğrenimine odaklanırken, ROC eğrisi altında kalan alan puanlarında \%22,81'e varan ve ortalama \%9,00 iyileşme göstermiştir; bununla birlikte hiperparametre optimizasyonu uygulandığı ve transfer kaynağı olarak doğru hücre hattı seçildiğinde bu iyileşmelerin arttırılabileceğine yönelik potansiyel göstermiştir.

Chemogenomics is the study of the genomic and/or proteomic reaction of biological targets to chemical compounds, with the goal of aiding drug design and screening. One of the many difficulties in chemogenomics comes from the dependency on real-life experiment data; the combination of different chemical compounds and drug targets creates an unrealistic number of possible experiments, which results in datasets that are biased towards certain chemicals and targets. The recent developments in machine learning resulted in an over-saturation of powerful models that easily pushed the limits of these datasets. To undo the effects of these biases, we employ transfer learning, the method of leveraging knowledge from similar problems. The most important bias of chemogenomics datasets is the bias towards drug targets. The availability and significance of certain cell lines greatly increase the chance of it being used as a drug target for these experiments, while others have barely enough data to train machine learning models. We experimentally demonstrate that transfer learning greatly increases the trainability of various drug targets, while using the work done on the Deep Compound Profiler (DeepCOP) as a basis. While focused on one of the simple methods of transfer learning, our experiments showed up to 22.81\% and an average of 9.00\% improvement on the area under ROC curve scores and showed great potential to be improved upon if accompanied by hyperparameter optimization and correct cell line as the transfer source.

There are no comments on this title.

to post a comment.