MARC details
000 -LEADER |
fixed length control field |
03531nam a2200409 i 4500 |
003 - CONTROL NUMBER IDENTIFIER |
control field |
TR-AnTOB |
005 - DATE AND TIME OF LATEST TRANSACTION |
control field |
20230908000942.0 |
007 - PHYSICAL DESCRIPTION FIXED FIELD--GENERAL INFORMATION |
fixed length control field |
ta |
008 - FIXED-LENGTH DATA ELEMENTS--GENERAL INFORMATION |
fixed length control field |
171111s2018 xxu e mmmm 00| 0 eng d |
040 ## - CATALOGING SOURCE |
Original cataloging agency |
TR-AnTOB |
Language of cataloging |
eng |
Description conventions |
rda |
Transcribing agency |
TR-AnTOB |
041 0# - LANGUAGE CODE |
Language code of text/sound track or separate title |
Türkçe |
099 ## - LOCAL FREE-TEXT CALL NUMBER (OCLC) |
Classification number |
TEZ TOBB FBE BİL YL’18 SAR |
100 1# - MAIN ENTRY--PERSONAL NAME |
Personal name |
Sarı, Mustafa |
9 (RLIN) |
110755 |
245 10 - TITLE STATEMENT |
Title |
Derin öğrenme yöntemleri kullanılarak Türkçe doküman sınıflandırma / |
Statement of responsibility, etc. |
Mustafa Sarı. |
264 #1 - PRODUCTION, PUBLICATION, DISTRIBUTION, MANUFACTURE, AND COPYRIGHT NOTICE |
Place of production, publication, distribution, manufacture |
Ankara : |
Name of producer, publisher, distributor, manufacturer |
TOBB ETÜ Fen Bilimleri Enstitüsü, |
Date of production, publication, distribution, manufacture, or copyright notice |
2018. |
300 ## - PHYSICAL DESCRIPTION |
Extent |
x, 43 pages : |
Other physical details |
illustrations ; |
Dimensions |
29 cm |
336 ## - CONTENT TYPE |
Source |
rdacontent |
Content type code |
txt |
Content type term |
text |
337 ## - MEDIA TYPE |
Source |
rdamedia |
Media type code |
n |
Media type term |
unmediated |
338 ## - CARRIER TYPE |
Source |
rdacarrier |
Carrier type code |
nc |
Carrier type term |
volume |
502 ## - DISSERTATION NOTE |
Dissertation note |
Tez (Yüksek Lisans)--TOBB ETÜ Fen Bilimleri Enstitüsü Kasım 2018 |
520 ## - SUMMARY, ETC. |
Summary, etc. |
Çalışmamızda kaleme alınmış yazıların, yazarına ve konusuna göre birbirinden<br/>ayrılması ve sınıflandırılabilmesi amaçlanmıştır. Bir gazetenin köşe yazarlarının<br/>yazılarının vektörleri oluşturulmuştur ve birbirinden ne kadar ayrılabildiğinin analizi<br/>yapılmıştır. Yazarı bilinmeyen herhangi bir yazının hangi yazara ait olduğu<br/>belirlenebilir veya birbirlerine benzer stiller gruplanarak yazar profilleri<br/>oluşturulabilir. Konusu bilinmeyen bir yazının hangi konulara ait olabileceği<br/>belirlenebilir. DeepLearning4J Java kütüphanesi ve burada yer alan Doc2Vec sınıfı<br/>kullanılmıştır. 5,10,15 ve 20 yazar içeren modeller ve yazarların yazdıkları konulara<br/>göre modeller geliştirilmiştir. Bu şekilde elde edilen benzerlik vektörleri belirli bir eşik<br/>değeri ile karşılaştırılmıştır, değişik eşik değerleri seçimine bağlı model başarımları<br/>ölçülmüştür. Elde edilen sonuçlara göre bazı yazarlar belirgin bir şekilde diğer<br/>yazarlardan ayrılmaktadır. Yazılar konularına göre başarılı bir şekilde<br/>etiketlenebilmektedir. Bu yapı özellikle yazar profili çıkarımı, yazı tespiti veya konu<br/>gruplama gibi alanlarda kullanılabilecek niteliktedir. |
|
Summary, etc. |
In our study, it is aimed to distinguish and classify author profiles and text subjects<br/>with vectors which were created from authors posts. The vectors of the columnists of<br/>a newspaper were formed and analyzed for how much they could be separated from<br/>each other. Hence, author of any post, can be determined by this model. It also can<br/>group similar styles together. The DeepLearning4J Java library and the Doc2Vec class<br/>included are used during development. 5,10,15, 20 author vector models and their<br/>subject models were created according to their posts. The similarity vectors obtained<br/>in this way were compared with a certain threshold value, and the model performances<br/>based on the selection of different threshold values were measured. According to the<br/>results, some authors differed significantly from other authors. Articles can be<br/>successfully labeled according to their topics. This structure can be used especially in<br/>areas such as author profile extraction, article detection or subject grouping. |
650 #7 - SUBJECT ADDED ENTRY--TOPICAL TERM |
Topical term or geographic name entry element |
Tezler, Akademik |
9 (RLIN) |
32546 |
653 ## - INDEX TERM--UNCONTROLLED |
Uncontrolled term |
PV-DBOW |
|
Uncontrolled term |
PV-DM |
|
Uncontrolled term |
DL4J |
|
Uncontrolled term |
Paragraf vektörleri |
|
Uncontrolled term |
word2Vec |
|
Uncontrolled term |
doc2Vec |
|
Uncontrolled term |
Metin madenciliği |
|
Uncontrolled term |
Paragraph vectors |
|
Uncontrolled term |
Text mining |
710 ## - ADDED ENTRY--CORPORATE NAME |
Corporate name or jurisdiction name as entry element |
TOBB Ekonomi ve Teknoloji Üniversitesi. |
Subordinate unit |
Fen Bilimleri Enstitüsü |
9 (RLIN) |
77078 |
856 40 - ELECTRONIC LOCATION AND ACCESS |
Uniform Resource Identifier |
<a href="https://tez.yok.gov.tr/">https://tez.yok.gov.tr/</a> |
Materials specified |
Ulusal Tez Merkezi |
942 ## - ADDED ENTRY ELEMENTS (KOHA) |
Koha item type |
Thesis |
Source of classification or shelving scheme |
Other/Generic Classification Scheme |