Erdoğan, Ahmet Enis

Sosyal medya profilleri arasında benzerlik tespiti ve gösterimi / Ahmet Enis Erdoğan. - xiii, 48 pages ; 29 cm

Tez (Yüksek Lisans)--TOBB ETÜ Fen Bilimleri Enstitüsü Ekim 2018

Sosyal Medya” kullanıcıların bilgi paylaşımında bulunduğu platformlara verilen genel
addır. Sosyal medya kullanımı son senelerde oldukça yaygınlaşmıştır. Kullanıcılar
birden fazla Sosyal Medya Platformunda kişisel veya gündemdeki olaylar ile alakalı
paylaşımlarda bulunmaktadır. Sosyal medyanın geniş kitleler tarafından kullanılması
sosyal medya kullanıcıları hakkında bilgilerin çıkarılması ve kullanıcılar arasındaki
benzerliklerin tespit edilmesi arayışını ortaya çıkarmıştır. Sosyal medya
platformlarındaki kullanıcıların birbirlerine benzerliği tespit edildiği takdirde
kullanıcıların eğilimleri, ilgi alanları, önem verdiği konular belirlenebilir. Ayrıca,
reklamların hedef kitleye ulaşmasında da bu benzerlik bilgilerinden faydalanılabilir.
Bununla birlikte, farklı amaçlarla gerçek sahibinin kim olduğunun doğrulanmasına
ihtiyaç duyulan hesaplar da bu bilgiler ışığında tespit edilebilir. Bu çalışmada Doğal Dil
İşleme(DDİ) teknikleri kullanarak kullanıcıların paylaşımları arasındaki benzerliklerin
tespit edilmesi için geliştirdiğimiz teknikler sunulmuştur. Konu Modelleme ve Adlandırılmış Varlık Tespiti teknikleri kullanılarak kullanıcıların yazılı paylaşımlarından
nitelik çıkarımı yapılmıştır. Bu nitelikler Word Embedding teknikleri ve Word Mover’s
Distance tekniği kullanılarak kullanıcılar arasındaki benzerlikler çıkarılmıştır. DDİ
tekniklerinin yanında kullanıcıların sosyal medya platformlarını kullandığı saatlerden,
kullanıcı bilgilerinden ve kullanıcının arkadaşlarının isimlerinden yola çıkarak
kullanıcılar arası benzerlik tespiti için teknikler önerilmiştir. Geliştirilen tekniklerden
DDİ teknikleri ile oldukça etkili sonuçlar alınmıştır. Bu teknikler yardımı ile verilen bir
kullanıcı kümesindeki toplulukların ve öbeklerin tespit edilebildiği gösterilmiştir. Ayrıca
farklı sosyal medya platformlarındaki profiller arasında benzerlik tespiti yapılarak aynı
kişiye ait sosyal medya profillerinin tespit edilebildiği gösterilmiştir. Çalışmada
geliştirilen metriklerin farklı kullanıcı kümelerinde daha kolay denenmesi amacıyla bir
web uygulaması geliştirilmiştir. Bu web uygulaması kullanıcılar arası benzerliklerin
detaylı incelenmesini mümkün kılmıştır.
Social Media is a generic name given to the digital platforms where users share
information. The use of social media has become very popular in recent years. Users
share personal information or their ideas about daily events on different social media
platforms. The widespread use of social media has led to an interest to extract
information from social media profiles and detect similarities among users. If similarity
is detected between users, this information can be used to determine the tendencies,
interests of users, the things that he/she cares about. Also such an information would
make advertisements reach to their target audience. In addition, this information can be
used in cases where there is a need to verify the real owner of a social media account. In
this study, we have developed techniques to determine the similarities among the users
using Natural Language Processing (NLP) techniques. Additionally attempts have been
made to identify similarities between users by users’ access hours to the platform and users’ friends list. However, more effective results were obtained with NLP techniques.
Topic Modeling and Named Entity Recognition techniques were used to extract features
from the posts of users. Similarities between users were derived by feeding these
features to Word Mover's Distance algorithm. Effective results have been obtained using
the techniques developed with NLP techniques. It has been shown that communities and
clusters in a user set can be detected with the help of these techniques. It has also been
shown that social media profiles belonging to a person can be detected by identifying
similarities among profiles in different social media platforms. In addition, a web
application is developed to make it easier to experiment with the metrics developed in
this work.


Tezler, Akademik

Sosyal medya analizi Doğal dil işleme Kelime katıştırma Word2Vec Word mover’s distance Adlandırılmış varlık tespiti Konu modelleme Latent dirichlet allocation Conditional random fields Paragraph2Vec Social media analysis Natural language processing Word embeddings Named entity recognition Topic modelling Latent dirichlet allocation Conditional random fields Paragraph2Vec