Derin öğrenme yöntemleri kullanılarak Türkçe doküman sınıflandırma / (Record no. 200435239)

MARC details
000 -LEADER
fixed length control field 03531nam a2200409 i 4500
003 - CONTROL NUMBER IDENTIFIER
control field TR-AnTOB
005 - DATE AND TIME OF LATEST TRANSACTION
control field 20230908000942.0
007 - PHYSICAL DESCRIPTION FIXED FIELD--GENERAL INFORMATION
fixed length control field ta
008 - FIXED-LENGTH DATA ELEMENTS--GENERAL INFORMATION
fixed length control field 171111s2018 xxu e mmmm 00| 0 eng d
040 ## - CATALOGING SOURCE
Original cataloging agency TR-AnTOB
Language of cataloging eng
Description conventions rda
Transcribing agency TR-AnTOB
041 0# - LANGUAGE CODE
Language code of text/sound track or separate title Türkçe
099 ## - LOCAL FREE-TEXT CALL NUMBER (OCLC)
Classification number TEZ TOBB FBE BİL YL’18 SAR
100 1# - MAIN ENTRY--PERSONAL NAME
Personal name Sarı, Mustafa
9 (RLIN) 110755
245 10 - TITLE STATEMENT
Title Derin öğrenme yöntemleri kullanılarak Türkçe doküman sınıflandırma /
Statement of responsibility, etc. Mustafa Sarı.
264 #1 - PRODUCTION, PUBLICATION, DISTRIBUTION, MANUFACTURE, AND COPYRIGHT NOTICE
Place of production, publication, distribution, manufacture Ankara :
Name of producer, publisher, distributor, manufacturer TOBB ETÜ Fen Bilimleri Enstitüsü,
Date of production, publication, distribution, manufacture, or copyright notice 2018.
300 ## - PHYSICAL DESCRIPTION
Extent x, 43 pages :
Other physical details illustrations ;
Dimensions 29 cm
336 ## - CONTENT TYPE
Source rdacontent
Content type code txt
Content type term text
337 ## - MEDIA TYPE
Source rdamedia
Media type code n
Media type term unmediated
338 ## - CARRIER TYPE
Source rdacarrier
Carrier type code nc
Carrier type term volume
502 ## - DISSERTATION NOTE
Dissertation note Tez (Yüksek Lisans)--TOBB ETÜ Fen Bilimleri Enstitüsü Kasım 2018
520 ## - SUMMARY, ETC.
Summary, etc. Çalışmamızda kaleme alınmış yazıların, yazarına ve konusuna göre birbirinden<br/>ayrılması ve sınıflandırılabilmesi amaçlanmıştır. Bir gazetenin köşe yazarlarının<br/>yazılarının vektörleri oluşturulmuştur ve birbirinden ne kadar ayrılabildiğinin analizi<br/>yapılmıştır. Yazarı bilinmeyen herhangi bir yazının hangi yazara ait olduğu<br/>belirlenebilir veya birbirlerine benzer stiller gruplanarak yazar profilleri<br/>oluşturulabilir. Konusu bilinmeyen bir yazının hangi konulara ait olabileceği<br/>belirlenebilir. DeepLearning4J Java kütüphanesi ve burada yer alan Doc2Vec sınıfı<br/>kullanılmıştır. 5,10,15 ve 20 yazar içeren modeller ve yazarların yazdıkları konulara<br/>göre modeller geliştirilmiştir. Bu şekilde elde edilen benzerlik vektörleri belirli bir eşik<br/>değeri ile karşılaştırılmıştır, değişik eşik değerleri seçimine bağlı model başarımları<br/>ölçülmüştür. Elde edilen sonuçlara göre bazı yazarlar belirgin bir şekilde diğer<br/>yazarlardan ayrılmaktadır. Yazılar konularına göre başarılı bir şekilde<br/>etiketlenebilmektedir. Bu yapı özellikle yazar profili çıkarımı, yazı tespiti veya konu<br/>gruplama gibi alanlarda kullanılabilecek niteliktedir.
Summary, etc. In our study, it is aimed to distinguish and classify author profiles and text subjects<br/>with vectors which were created from authors posts. The vectors of the columnists of<br/>a newspaper were formed and analyzed for how much they could be separated from<br/>each other. Hence, author of any post, can be determined by this model. It also can<br/>group similar styles together. The DeepLearning4J Java library and the Doc2Vec class<br/>included are used during development. 5,10,15, 20 author vector models and their<br/>subject models were created according to their posts. The similarity vectors obtained<br/>in this way were compared with a certain threshold value, and the model performances<br/>based on the selection of different threshold values were measured. According to the<br/>results, some authors differed significantly from other authors. Articles can be<br/>successfully labeled according to their topics. This structure can be used especially in<br/>areas such as author profile extraction, article detection or subject grouping.
650 #7 - SUBJECT ADDED ENTRY--TOPICAL TERM
Topical term or geographic name entry element Tezler, Akademik
9 (RLIN) 32546
653 ## - INDEX TERM--UNCONTROLLED
Uncontrolled term PV-DBOW
Uncontrolled term PV-DM
Uncontrolled term DL4J
Uncontrolled term Paragraf vektörleri
Uncontrolled term word2Vec
Uncontrolled term doc2Vec
Uncontrolled term Metin madenciliği
Uncontrolled term Paragraph vectors
Uncontrolled term Text mining
710 ## - ADDED ENTRY--CORPORATE NAME
Corporate name or jurisdiction name as entry element TOBB Ekonomi ve Teknoloji Üniversitesi.
Subordinate unit Fen Bilimleri Enstitüsü
9 (RLIN) 77078
856 40 - ELECTRONIC LOCATION AND ACCESS
Uniform Resource Identifier <a href="https://tez.yok.gov.tr/">https://tez.yok.gov.tr/</a>
Materials specified Ulusal Tez Merkezi
942 ## - ADDED ENTRY ELEMENTS (KOHA)
Koha item type Thesis
Source of classification or shelving scheme Other/Generic Classification Scheme
Holdings
Withdrawn status Lost status Source of classification or shelving scheme Not for loan Collection code Home library Current library Shelving location Date acquired Source of acquisition Total Checkouts Full call number Barcode Date last seen Copy number Date shelved Koha item type
    Other/Generic Classification Scheme Ödünç Verilemez-Tez / Not For Loan-Thesis Tezler Merkez Kütüphane Merkez Kütüphane Tez Koleksiyonu / Thesis Collection 28/02/2019 Bağış / Donation   TEZ TOBB FBE BİL YL’18 SAR TZ00957 28/02/2019 1 28/02/2019 Thesis
Devinim Yazılım Eğitim Danışmanlık tarafından Koha'nın orjinal sürümü uyarlanarak geliştirilip kurulmuştur.