Yazılım Mühendisliği Bölümü
Permanent URI for this communityhttps://hdl.handle.net/20.500.12416/2146
Browse
Browsing Yazılım Mühendisliği Bölümü by Author "11916"
Now showing 1 - 12 of 12
- Results Per Page
- Sort Options
Article Citation Count: Nasser, Ahmed; Sever, Hayri (2020). "A Concept-based Sentiment Analysis Approach for Arabic", The International Arab Journal of Information Technology, Vol. 17, No. 5, pp. 778-788.A Concept-based Sentiment Analysis Approach for Arabic(2020) Nasser, Ahmed; Sever, Hayri; 11916Concept-Based Sentiment Analysis (CBSA) methods are considered to be more advanced and more accurate when it compared to ordinary Sentiment Analysis methods, because it has the ability of detecting the emotions that conveyed by multi-word expressions concepts in language. This paper presented a CBSA system for Arabic language which utilizes both of machine learning approaches and concept-based sentiment lexicon. For extracting concepts from Arabic, a rule-based concept extraction algorithm called semantic parser is proposed. Different types of feature extraction and representation techniques are experimented among the building prosses of the sentiment analysis model for the presented Arabic CBSA system. A comprehensive and comparative experiments using different types of classification methods and classifier fusion models, together with different combinations of our proposed feature sets, are used to evaluate and test the presented CBSA system. The experiment results showed that the best performance for the sentiment analysis model is achieved by combined Support Vector Machine-Logistic Regression (SVM-LR) model where it obtained a F-score value of 93.23% using the Concept-Based-Features + Lexicon-Based-Features + Word2vec-Features (CBF + LEX+ W2V) features combinations.Article Citation Count: Sever, Hayri; Senol, Ahmet; Elbasi, Ersin, "Block Size Analysis for Discrete Wavelet Watermarking and Embedding a Vector Image as a Watermark", International Arab Journal of Information Technology, Vol. 16, No. 6, pp. 1036-1043, (2019).Block Size Analysis for Discrete Wavelet Watermarking and Embedding a Vector Image as a Watermark(Zarka Private Univ, 2019) Sever, Hayri; Şenol, Ahmet; Elbaşı, Ersin; 11916As telecommunication and computer technologies proliferate, most data are stored and transferred in digital format. Content owners, therefore, are searching for new technologies to protect copyrighted products in digital form. Image watermarking emerged as a technique for protecting image copyrights. Early studies on image watermarking used the pixel domain whereas modern watermarking methods convert a pixel based image to another domain and embed a watermark in the transform domain. This study aims to use, Block Discrete Wavelet Transform (BDWT) as the transform domain for embedding and extracting watermarks. This study consists of 2 parts. The first part investigates the effect of dividing an image into non overlapping blocks and transforming each image block to a DWT domain, independently. Then, effect of block size on watermark success and, how it is related to block size, are analyzed. The second part investigates embedding a vector image logo as a watermark. Vector images consist of geometric objects such as lines, circles and splines. Unlike pixel-based images, vector images do not lose quality due to scaling. Vector watermarks deteriorate very easily if the watermarked image is processed, such as compression or filtering. Special care must be taken when the embedded watermark is a vector image, such as adjusting the watermark strength or distributing the watermark data into the image. The relative importance of watermark data must be taken into account. To the best of our knowledge this study is the first to use a vector image as a watermark embedded in a host image.Article Citation Count: Bugday, Ahmet...et al. (2019). "Creating consensus group using online learning based reputation in blockchain networks", Pervasive and Mobile Computing, Vol. 59.Creating consensus group using online learning based reputation in blockchain networks(Elsevier, 2019) Buğday, Ahmet; Özsoy, Adnan; Öztaner, Serdar Murat; Sever, Hayri; 11916One of the biggest challenges to blockchain technology is the scalability problem. The choice of consensus algorithm is critical to the practical solution of the scalability problem. To increase scalability, Byzantine Fault Tolerance (BFT) based methods have been most widely applied. This study proposes a new model instead of Proof of Work (PoW) for forming the consensus group that allows the use of BFT based methods in the public blockchain network. The proposed model uses the adaptive hedge method, which is a decision-theoretic online learning algorithm (Qi et al., 2016). The reputation value is calculated for the nodes that want to participate in the consensus committee, and nodes with high reputation values are selected for the consensus committee to reduce the chances of the nodes in the consensus committee being harmful. Since the study focuses on the formation of the consensus group, a simulated blockchain network is used to test the proposed model more effectively. Test results indicate that the proposed model, which is a new approach in the literature making use of machine learning for the construction of consensus committee, successfully selects the node with the higher reputation for the consensus group. (C) 2019 Elsevier B.V. All rights reserved.Article Citation Count: Canbay, Pelin; Sezer, Ebru; Sever, Hayri (2020). "Deep Combination of Stylometry Features in Forensic Authorship Analysis", International Journal of Information Security Science, Vol. 9, no. 3, pp. 154-163.Deep Combination of Stylometry Features in Forensic Authorship Analysis(2020) Canbay, Pelin; Sezer, Ebru; Sever, Hayri; 11916Authorship Analysis (AA) in forensic is a process aim to extract information about an author from his/her writings. Forensic AA is needed for detection characteristics of anonymous authors to make better the security of digital media users who are exposed to disturbing entries such as threats or harassment emails. To analyze whether two anonymous short texts were written by the same author, we propose a combination of stylometry features from different categories in different progress. In the majority of the previous AA studies, the stylometric features from different categories are concatenated in a preprocess. In these studies, during the learning process, no category-specific operations are performed; all categories used are evaluated equally. On the other hand, the proposed approach has a separate learning process for each feature category due to their qualitative and quantitative characteristics and combines these processes at the decision phase by using a Combination of Deep Neural Networks (C-DNN). To evaluate the Authorship Verification (AV) performance of the proposed approach, we designed and implemented a problem-specific Deep Neural Network (DNN) for each stylometry category we used. Experiments were conducted on two English public datasets. The results show that the proposed approach significantly improves the generalization ability and robustness of the solutions, and also have better accuracy than the single DNNs.Conference Object Citation Count: Canbay, Pelin; Sezer, Ebru Akçapınar; Sever, Hayri (2020). "Detection of Stylometric Writeprint from the Turkish Texts", 28th Signal Processing and Communications Applications Conference (SIU).Detection of Stylometric Writeprint from the Turkish Texts(2020) Canbay, Pelin; Sezer, Ebru Akçapınar; Sever, Hayri; 11916Authorship attribution studies aim to extract information about the author by analyzing the data in the text form. With the increase of anonymous authors in digital environments, the need for these works is increasing day by day. Although there exists lots of studies focuse on stylometric writeprint detection in different languages using different attributes, there is no standard feature set and detection algorithm to be evaluated in these studies. Giving priority to Turkish texts, in this study, which features are more distinctive for determining stylistic writeprint of text, and which methods will contribute to increase the success to be achieved are shown with experimental studies.Article Citation Count: Cinar, Muhammet Serkan; Genc, Burkay; Sever, Hayri, "Identifying criminal organizations from their social network structures", Identifying criminal organizations from their social network structures, Vol. 27, No. 1, pp. 421-436, (2019).Identifying criminal organizations from their social network structures(Tubitak Scientific & Technical Research Council Turkey, 2019) Çınar, Muhammet Serkan; Genç, Burkay; Sever, Hayri; 11916Identification of criminal structures within very large social networks is an essential security feat. By identifying such structures, it may be possible to track, neutralize, and terminate the corresponding criminal organizations before they act. We evaluate the effectiveness of three different methods for classifying an unknown network as terrorist, cocaine, or noncriminal. We consider three methods for the identification of network types: evaluating common social network analysis metrics, modeling with a decision tree, and network motif frequency analysis. The empirical results show that these three methods can provide significant improvements in distinguishing all three network types. We show that these methods are viable enough to be used as supporting evidence by security forces in their fight against criminal organizations operating on social networks.Article Citation Count: Polat, Hüseyin...et al. (2019). "Otomatik Konuşma Tanıma Sistemlerinde Kullanılan Gerçek Metin Verisinde Biçimbilimsel-Sözdizimsel Hataların Tespiti ve Düzeltmesi", Veri Bilimi, Vol. 2, No. 2, pp. 18-24.Otomatik Konuşma Tanıma Sistemlerinde Kullanılan Gerçek Metin Verisinde Biçimbilimsel-Sözdizimsel Hataların Tespiti ve Düzeltmesi(2019) Polat, Hüseyin; Sever, Hayri; Oyucu, Saadin; Tekbaş, Şükran; 11916Türkçe Otomatik Konuşma Tanıma (ASR: Automatic Speech Recognition) sistemlerinde kullanılan akustik model gürbüz bir dil modeli ile desteklenmediği durumlarda kelime hata oranı yüksek çıkmaktadır. İyi dizayn edilmiş bir dil modeli ile akustik modelin birlikte ASR’de kullanılması kelime hata oranını düşürmektedir. ASR için gerekli dil modelinin eğitiminde düz metin verisi kullanılmaktadır. Kullanılan metin verisinin doğruluğu ASR modellerinin eğitimi için oldukça önemlidir. Bu çalışmada, doğal dil işlemeye dayalı bir yöntem kullanılarak Türkçe ASR sisteminin eğitilmesinde kullanılan metin verisi içerisindeki yazım hatalarının tespiti ve düzeltilmesi gerçekleştirilmiştir. Öncelikle metin verisi içerisinde dil bilgisel olarak yanlış yazılmış olan kelimeler bulunmuştur. Bir kelimedeki karakter eksikliği, karakter fazlalığı, karakterlerin yer değiştirmesi veya karakteri yanlış yazılmış olan kelimeler hatalı olarak kabul edilmiştir. Metin verisi içerisinde hatalı olarak kabul edilen kelimeler morfolojik analiz ile tespit edilmiştir. Yanlış kelimelerin yerine atanacak olan kelimeler belirlenmiştir. Yanlış yazılmış olan kelimeler doğru kelimeler ile değiştirilmiştir. Gerçekleştirilen çalışma hatalı kelimeleri tespit etme ve doğru kelimeler ile yer değiştirme işleminde %93 oranında başarı göstermiştir.Article Citation Count: Oyucu, Saadin; Sever, Hayri; Polat, Hüseyin (2019). "Otomatik Konuşma Tanımaya Genel Bakış, Yaklaşımlar ve Zorluklar: Türkçe Konuşma Tanımanın Gelecekteki Yolu", Gazi Üniversitesi Fen Bilimleri Dergisi Part C: Tasarım ve Teknoloji, Vol. 7, No. 4, pp. 834-854.Otomatik Konuşma Tanımaya Genel Bakış, Yaklaşımlar ve Zorluklar: Türkçe Konuşma Tanımanın Gelecekteki Yolu(2019) Oyucu, Saadin; Sever, Hayri; Polat, Hüseyin; 11916İnsanlar arasındaki en önemli iletişim yöntemi olan konuşmanın, bilgisayarlar tarafından tanınması önemli bir çalışma alanıdır. Bu araştırma alanında farklı diller temel alınarak birçok çalışma gerçekleştirilmiştir. Literatürdeki çalışmalar konuşma tanıma teknolojilerinin başarımının artmasında önemli rol oynamıştır. Bu çalışmada konuşma tanıma ile ilgili bir literatür taraması sunulmuş ve farklı dillerde bu araştırma alanında kaydedilen ilerlemeler tartışılmıştır. Konuşma tanıma sistemlerinde kullanılan veri setleri, özellik çıkarma yaklaşımları, konuşma tanıma yöntemleri ve performans değerlendirme ölçütleri incelenerek konuşma tanımanın gelişimi ve bu alandaki zorluklara odaklanılmıştır. Konuşma tanıma alanında son zamanlarda yapılan çalışmaların olumsuz koşullara (çevre gürültüsü, konuşmacıda ve dilde değişkenlik) karşı çok daha güçlü yöntemler geliştirmeye odaklandığı izlenmiştir. Bu nedenle araştırma alanı olarak genişleyen olumsuz koşullardaki konuşma tanıma ile ilgili yakın geçmişteki gelişmelere yönelik genel bir bakış açısı sunulmuştur. Böylelikle olumsuz koşullar altında gerçekleştirilen konuşma tanımadaki tıkanıklık ve zorlukları aşabilmek için kullanılabilecek yöntemleri seçmede yardımcı olunması amaçlanmıştır. Ayrıca Türkçe konuşma tanımada kullanılan ve iyi bilinen yöntemler karşılaştırılmıştır. Türkçe konuşma tanımanın zorluğu ve bu zorlukların üstesinden gelebilmek için kullanılabilecek uygun yöntemler irdelenmiştir. Buna bağlı olarak da Türkçe konuşma tanımanın gelecekteki rotasına ilişkin bir değerlendirme ortaya konulmuştur.Article Citation Count: Oyucu, Saadin; Polat, Hüseyin; Sever, Hayri (2020). "Sessizliğin Kaldırılması ve Konuşmanın Parçalara Ayrılması İşleminin Türkçe Otomatik Konuşma Tanıma Üzerindeki Etkisi", Düzce Üniversitesi Bilim ve Teknoloji Dergisi, Vol. 8, No. 1, pp. 334-346.Sessizliğin Kaldırılması ve Konuşmanın Parçalara Ayrılması İşleminin Türkçe Otomatik Konuşma Tanıma Üzerindeki Etkisi(2020) Oyucu, Saadin; Polat, Hüseyin; Sever, Hayri; 11916Otomatik Konuşma Tanıma sistemleri temel olarak akustik bilgiden faydalanılarak geliştirilmektedir. Akustik bilgiden fonem bilgisinin elde edilmesi için eşleştirilmiş konuşma ve metin verileri kullanılmaktadır. Bu veriler ile eğitilen akustik modeller gerçek hayattaki bütün akustik bilgiyi modelleyememektedir. Bu nedenle belirli ön işlemlerin yapılması ve otomatik konuşma tanıma sistemlerinin başarımını düşürecek akustik bilgilerin ortadan kaldırılması gerekmektedir. Bu çalışmada konuşma içerisinde geçen sessizliklerin kaldırılması için bir yöntem önerilmiştir. Önerilen yöntemin amacı sessizlik bilgisinin ortadan kaldırılması ve akustik bilgide uzun bağımlılıklar sağlayan konuşmaların parçalara ayrılmasıdır. Geliştirilen yöntemin sonunda elde edilen sessizlik içermeyen ve parçalara ayrılan konuşma bilgisi bir Türkçe Otomatik Konuşma Tanıma sistemine girdi olarak verilmiştir. Otomatik Konuşma Tanıma sisteminin çıkışında sisteme giriş olarak verilen konuşma parçalarına karşılık gelen metinler birleştirilerek sunulmuştur. Gerçekleştirilen deneylerde sessizliğin kaldırılması ve konuşmanın parçalara ayrılması işleminin Otomatik Konuşma Tanıma sistemlerinin başarımını artırdığı görülmüştür.Conference Object Citation Count: Par, Öznur Esra; Akçapınar Sezer, Ebru; Sever, Hayri. "Sınıflandırmada Küçük ve Dengesiz Veri Kümesi Problemi/Small and Unbalanced Data Set Problem in Classification, IEEE 27th Signal Processing and Communications Applications Conference (SIU), 2019.Sınıflandırmada Küçük ve Dengesiz Veri Kümesi Problemi(2019) Par, Öznur Esra; Akçapınar Sezer, Ebru; Sever, Hayri; 11916Verilerinin sınıflandırılması, veri kümesinin küçük ve dengesiz olması durumunda zorlaşmakta ve sınıflama performansını direkt etkilemektedir. Veri setinin küçük olması ve/veya sınıflar arasında dengesizlik olması veri madenciliğinde büyük bir sorun haline gelmiştir. Sınıflama algoritmaları, veri setlerinin yeterli büyüklüğe sahip, dengeli olduğu varsayımı üzerine geliştirilmiştir. Bu algoritmaların çoğu, azınlık sınıfındaki örnekleri göz ardı ederken veya yanlış sınıflandırırken, çoğunluk sınıfa odaklanır. Medikal veri madenciliğinde bazı kısıtlardan dolayı küçük ve dengesiz veri seti problemi ile sıklıkla karşılaşılmaktadır. Çalışma kapsamında erişime açık hepatit veri seti, küçük veri setlerine bölünmüş, oluşturulan her bir veri seti uzaklık tabanlı yöntemlerle çoğaltılmıştır. Çoğaltılan veri setleri dört farklı makine öğrenmesi algoritması (Yapay Sinir Ağları, Destek Vektör Makineleri, Naive Bayes ve Karar Ağacı) kullanılarak sınıflandırılmış, elde edilen sınıflama sonuçları karşılaştırılmıştır.Conference Object Citation Count: Par, Öznur Esra; Sezer, Ebru Akçapınar; Sever, Hayri (2019). "Small and Unbalanced Data Set Problem in Classification", 27th Signal Processing and Communications Applications Conference (SIU), Sivas Cumhuriyet Univ, Sivas, TURKEY, APR 24-26, 2019.Small and Unbalanced Data Set Problem in Classification(2019) Par, Öznur Esra; Sezer, Ebru Akçapınar; Sever, Hayri; 11916Classification of data is difficult in case of small and unbalanced data set and this problem directly affects the classification performance. Small and / or the imbalance dataset has become a major problem in data mining. Classification algorithms are developed based on the assumption that the data sets are balanced and large enough. The most of the algorithms ignore or misclassify examples of the minority class, focus on the majority class. Small and unbalanced data set problem is frequently encountered in medical data mining due to some limitations. Within the scope of the study, the public accessible data set, hepatitis, was divided into small and imblanced data subsets, each of the data subsets were oversampled by distance based data generation methods. The oversampled data sets were classified by using four different machine learning algorithms (Artificial Neural Networks, Support Vector Machines, Naive Bayes and Decision Tree) and the classification scores were compared.Conference Object Citation Count: Oyucu, Saadin; Polat, Hüseyin; Sever, Hayri. "Web Service-Based Turkish Automatic Speech Recognition Platform", IEEE International Congress on Human-Computer Interaction, Optimization and Robotic Applications (HORA), 26-28 June 2020, Ankara, pp. 1-5.Web Service-Based Turkish Automatic Speech Recognition Platform(2020) Oyucu, Saadin; Polat, Hüseyin; Sever, Hayri; 11916In response to the similar challenges in building large-scale distributed applications and platforms on the Web, microservice architecture has emerged and gained a lot of popularity in recent years. Therefore, both for the use of microservices and for the provided of the necessary interface for Automatic Speech Recognition (ASR), a web-based platform has been developed. Within firstly the scope of the study, a Turkish ASR system was developed. A web service structure was created to facilitate access to the ASR system. The access of methods and data in the web service structure was provided through Representational State Transfer (REST) web services and service layer. An interface was developed to enable interaction with the web service. The platform was developed using a combination of different technologies such as ASR, web services, microservices, and interface technologies. The developed platform can be used via a standard web browser or an Application Programming Interface (API). In this study, Docker packages were used to improve system performance instead of using different virtual machines on a single server. In the experiments performed, it was shown that the Turkish ASR system had a word error rate of 24.70%. In web service performance tests, it was shown that the platform responded in an average of 9.6 seconds for a 59-second speech recording. The developed user interface was tested in both mobile and desktop web browsers and was shown to function properly. Applications and other services were given access to the platform without the need to use an interface via API support provided by the platform. As a result, a web service-based Turkish ASR platform working seamlessly on the ever-increasing number of mobile devices, the Internet of Things ecosystem, or other access devices was developed.