Bilgi erişim değerlendirmesi için inovasyon metrikleri ve madde tepki teorisi / (Record no. 200459531)

MARC details
000 -LEADER
fixed length control field 07912nam a2200409 i 4500
003 - CONTROL NUMBER IDENTIFIER
control field TR-AnTOB
005 - DATE AND TIME OF LATEST TRANSACTION
control field 20240125160803.0
007 - PHYSICAL DESCRIPTION FIXED FIELD--GENERAL INFORMATION
fixed length control field ta
008 - FIXED-LENGTH DATA ELEMENTS--GENERAL INFORMATION
fixed length control field 171111s2024 xxu e mmmm 00| 0 eng d
035 ## - SYSTEM CONTROL NUMBER
System control number (TR-AnTOB)200459531
040 ## - CATALOGING SOURCE
Original cataloging agency TR-AnTOB
Language of cataloging eng
Description conventions rda
Transcribing agency TR-AnTOB
041 0# - LANGUAGE CODE
Language code of text/sound track or separate title Türkçe
099 ## - LOCAL FREE-TEXT CALL NUMBER (OCLC)
Classification number TEZ TOBB FBE BİL YL’24 TÜR
100 1# - MAIN ENTRY--PERSONAL NAME
Personal name Türkmen, Mehmet Deniz
Relator term author
9 (RLIN) 144779
245 10 - TITLE STATEMENT
Title Bilgi erişim değerlendirmesi için inovasyon metrikleri ve madde tepki teorisi /
Statement of responsibility, etc. Mehmet Deniz Türkmen; thesis advisor Mücahid Kutlu.
246 13 - VARYING FORM OF TITLE
Title proper/short title Integrating innovation metrics and item response theory for information retrıeval evaluation
264 #1 - PRODUCTION, PUBLICATION, DISTRIBUTION, MANUFACTURE, AND COPYRIGHT NOTICE
Place of production, publication, distribution, manufacture Ankara :
Name of producer, publisher, distributor, manufacturer TOBB ETÜ Fen Bilimleri Enstitüsü,
Date of production, publication, distribution, manufacture, or copyright notice 2024.
300 ## - PHYSICAL DESCRIPTION
Extent xviii, 47 pages :
Other physical details illustrations ;
Dimensions 29 cm
336 ## - CONTENT TYPE
Content type term text
Content type code txt
Source rdacontent
337 ## - MEDIA TYPE
Media type term unmediated
Media type code n
Source rdamedia
338 ## - CARRIER TYPE
Carrier type term volume
Carrier type code nc
Source rdacarrier
502 ## - DISSERTATION NOTE
Dissertation note Tez (Yüksek Lisans)--TOBB ETÜ Fen Bilimleri Enstitüsü Ocak 2024
520 ## - SUMMARY, ETC.
Summary, etc. Bilgi erişim (BE) sistemleri değerlendirilirken çeşitli metrikler kullanılır ve genelde metriklerin dikkate aldığı birkaç temel kriter bulunmaktadır. Bunlar bulunan dokümanların ilgililik derecesi, sıralaması ve kapsadığı konu çeşitliliğidir. Bu tür bir değerlendirme, kullanıcı deneyimine odaklanarak pragmatik bir değerlendirme sunar. Bu tezde standart bilgi erişim metrikleri tarafından hesaba katılmayan değerlendirme kriterleri keşfedilmektedir. Bu amaçla, inovasyon metrikleri ve Madde Tepki Kuramı (IRT) bazlı değerlendirme olmak üzere iki adet metrik sınıfı üzerinde çalışılmıştır. Önerilen metrikler, BE sistemlerini kollektif olarak değerlendirmesi ve dokümanlara ait yeni kriterleri değerlendirme sürecine dahil etmesiyle ön plana çıkmaktadır. İnovasyon metriklerinde, doküman nadirliği tanımlanmış ve Bilgi Erişim yöntemlerinde çeşitliliğin ödüllendirilmesi hedeflenmiştir. IRT-bazlı değerlendirmede ise dokümanlara ait zorluk, ayrıştırıcılık gibi özelliklerin bilgi erişim değerlendirmesinde kullanılarak performans ölçümündeki hata payının azaltılması ve daha esnek bir değerlendirme ortamı amaçlanmıştır. Metrikler tasarlanırken literatürde sıklıkla kullanılan iki standart metrik (Precision@K ve Average Precision) temel alınmıştır ve bu metrikler değiştirilerek özgün versiyonları oluşturulmuştur. Bilgi erişim (BE) değerlendirme etkinliklerinde (evaluation campaigns) katılımcılar genellikle rekabetçi sonuçlar elde etmek için popüler ve güncel yöntemlerin varyasyonlarını kullanırlar. Bu etkili bir strateji olsa da, daha radikal ve yenilikçi metotların keşfedilmesini engellemektedir. Ayrıca birçok katılımcı benzer yaklaşımları temel olarak kullandığı için, sunulan yaklaşımların genel çeşitliliği sınırlı olabilir. Bu çalışmada, bilgi erişim değerlendirme etkinliklerinde yaklaşımların çeşitlilik kazanmasını teşvik etmek amacıyla tasarlanmış inovasyon metrikleri önerilmektedir. Bunun için var olan geleneksel metriklere eklentiler yapılarak amaç doğrultusunda yeni formlar kazandırılmıştır. Geleneksel BE metrikleri yalnızca kullanıcı deneyimine odaklanırken, önerilen ``inovasyon'' metrikleri, diğer BE sistemleri tarafından bulunamamış ilgili dokümanları bulan, daha farklı ve yüksek riskli stratejilerin keşfedilmesini ödüllendirmektedir. Diğer yandan, Madde Tepki Kuramı (Item Response Theory, IRT), eğitimsel değerlendirmede kullanılan matematiksel modelleri kapsar. IRT'de bir katılımcının verdiği doğru cevap sayısı ile aldığı puan arasındaki ilişki klasik yöntemlere göre daha karmaşıktır. IRT modelleri, katılımcıların performansını ölçerken soruların zorluğu, ayrıştırıcılığı gibi faktörleri de hesaba katar. Bu sayede daha doğru ve esnek bir değerlendirme mümkün olmaktadır. Buradan hareketle, tezde ilk defa IRT modelleri bilgi erişim değerlendirmesine uyarlanmıştır. Dört TREC koleksiyonunda yapılan deneyler, önerilen metriklerin sistem sıralamalarını değiştirdiğini göstermektedir. Metriklerin nasıl davrandığı, varsayımsal BE sistemleri ile yapılan kontrollü bir deneyde analiz edilmektedir. Ayrıca, baz alınan standart Precision@K ve Average Precision metrikleri tezde önerilen doğrultuda güncellendiğinde daha yüksek değerlendirme stabilitesi ve ayrıştırma gücüne sahip olduğu görülmüştür.
Summary, etc. When evaluating Information Retrieval (IR) systems, various metrics are used, and generally, there are a few fundamental criteria that metrics take into account. These include the relevance of retrieved documents, their ranking, and the diversity of topics covered. Such an evaluation provides a pragmatic assessment by focusing on user experience. This thesis explores evaluation criteria not considered by standard information retrieval metrics. For this purpose, two classes of metrics were studied: innovation metrics and Item Response Theory (IRT) based metrics. The proposed metrics diverge by collectively evaluating IR systems and incorporating new criteria for document evaluation. Innovation metrics introduce document rareness and reward diversity among information retrieval methods. Through IRT-based metrics, document properties such as difficulty and discrimination are included in IR evaluation to reduce measurement error and to enable a more flexible evaluation. When designing metrics, two standard metrics commonly used in the literature (Precision@K and Average Precision) were taken as a basis, and these metrics were modified to create authentic versions. In information retrieval evaluation campaigns, participants often explore variations of popular and state-of-the-art methods to achieve competitive results. While this is an effective strategy, it hinders the discovery of more radical and innovative methods. Moreover, since many participants use similar approaches as a basis, the overall diversity of the presented approaches may be limited. In this study, innovation metrics are designed to encourage diversity in approaches in IR campaigns. Existing traditional metrics are extended to form proposed metrics. While traditional IR metrics focus on only user experience, the proposed "innovation" metrics reward the discovery of relevant documents that other IR systems cannot retrieve and encourage outlier and higher-risk strategies. On the other hand, Item Response Theory (IRT) encompasses mathematical models, mostly used in educational assessment. The relationship between the number of correct answers a participant gives and the score they receive is more complex in IRT than in classical assessment methods. IRT models take into account parameters such as difficulty and discrimination of questions when measuring participant performances. In this way, IRT provides a more accurate and flexible assessment. Therefore, in this thesis, for the first time, IRT models have been adapted to information retrieval evaluation. Experiments conducted on four TREC collections show that the proposed metrics change system rankings. The behavior of metrics is analyzed in a controlled experiment with hypothetical IR systems. Additionally, when the baseline Precision@K and Average Precision metrics were modified in the direction proposed in the thesis, higher evaluation stability and discriminative power were observed.
653 ## - INDEX TERM--UNCONTROLLED
Uncontrolled term Değerlendirme
Uncontrolled term Metrikler
Uncontrolled term Bilgi erişim
Uncontrolled term Madde tepki kuramı
Uncontrolled term Evaluation
Uncontrolled term Metrics
Uncontrolled term Information retrieval
Uncontrolled term Item responce theory
700 1# - ADDED ENTRY--PERSONAL NAME
Personal name Kutlu, Mücahid
9 (RLIN) 131600
Relator term advisor
710 ## - ADDED ENTRY--CORPORATE NAME
Corporate name or jurisdiction name as entry element TOBB Ekonomi ve Teknoloji Üniversitesi.
Subordinate unit Fen Bilimleri Enstitüsü
9 (RLIN) 77078
942 ## - ADDED ENTRY ELEMENTS (KOHA)
Koha item type Thesis
Source of classification or shelving scheme Other/Generic Classification Scheme
Holdings
Withdrawn status Lost status Source of classification or shelving scheme Not for loan Collection code Home library Current library Shelving location Date acquired Source of acquisition Total Checkouts Full call number Barcode Date last seen Copy number Date shelved Koha item type
    Other/Generic Classification Scheme Ödünç Verilemez-Tez / Not For Loan-Thesis Tezler Merkez Kütüphane Merkez Kütüphane Tez Koleksiyonu / Thesis Collection 25/01/2024 Bağış / Donation   TEZ TOBB FBE BİL YL’24 TÜR TZ01627 25/01/2024 1 25/01/2024 Thesis
Devinim Yazılım Eğitim Danışmanlık tarafından Koha'nın orjinal sürümü uyarlanarak geliştirilip kurulmuştur.