Yazar "Toprak, Ahmet" seçeneğine göre listele
Listeleniyor 1 - 7 / 7
Sayfa Başına Sonuç
Sıralama seçenekleri
Öğe Benchmark effect of web search engines on text mining(Murat GÖK, 2021) Toprak, Ahmet; Turan, MetinThere have been many studies about creating a dictionary and these studies have come from past to present with different methods and different analyzes. Especially with the emergence of the World Wide Web, efforts to create dictionary based on instant data have gained importance. Therefore, the performance of the web search engines directly effects the model which is using web documents for automatic dictionary creation. The web search engines were evaluated in terms of their suggested documents relationality to the query in the research. For this purpose, an automatic dictionary creating model using web documents were developed. First of all, the topic seed words are determined by the documents presented to the system initially. Search is executed by these seed words initially. Then TF-IDF metric was used as meaningful word selection method for returned first document. The top n meaningful words were selected from the highest TF-IDF values. The value of n was determined experimentally. When searching the web with these words added to the dictionary, new documents were suggesting by the web search engine. By repeating the process, experimental dictionaries of a certain size were obtained. By the way, the documents suggested by each web engine are generally different, so that the dictionary similarity produced from the top suggested documents can measure web engines performance of selecting relational documents. Hash similarity was used to evaluate dictionary performance. According to the results, dictionary with the 73.9% highest similarity for Google search engine, dictionary with the 68.7% highest similarity for Bing search engine and dictionary with the 60.5% highest similarity for Yandex search engine were produced.Öğe Dağıtık mesajlaşma altyapısı kullanılarak büyük boyutlu verilerin gerçek zamanlı olarak işlenmesi(Murat GÖK, 2021) Toprak, Ahmet; Zaim, Abdül HalimGünümüzde IoT (Internet of Things – Nesnelerin İnterneti) cihazların kullanımındaki artış beraberinde yüksek yoğunluklu ve farklı çeşitte verilerin oluşmasına sebep olmuştur. IoT cihazlarından toplanan bu verilerin formatları, şekilleri ve yoğunlukları birbirinden tamamen farklıdır. Bu verilerin anlık olarak işlenmesi ve ilgili kullanıcıya anlık olarak iletilmesi gerekmektedir. Bu makalede, IoT cihazlarından elde edilen verilerin işlenmesi ve son kullanıcıya anlık olarak iletilmesi amacıyla bir model tasarlanmıştır. Çalışmada öncelikli olarak IoT cihazlarından toplanan yapısal olmayan veriler veri ön işleme adımlarına tabi tutulmuştur. Veri ön işleme adımları sonrası elde edilen verilerden anlamlı kelimeler tespit edilmiştir. Bu amaçla TF-IDF (Term Frequency?-Inverse Document Frequency) metrikleri uygulanmıştır. Anlamlı kelime tespiti sonrası her anlamlı kelime konusuna göre verileri anlık işlemek amacıyla RabbitMQ dağıtık mesaj işleme kuyruğuna yönlendirilmiştir. Böylece mesajların iletilmesi garanti altına alınmıştır. RabbitMQ kuyruğuna iletilen mesajların anlık olarak alınması ve işlenmesi amacıyla Apache Storm topolojisi kullanılmıştır. Garantili mesaj işleme alt yapısı kullanan Apache Storm topolojisi, mesajları RabbitMQ dağıtık kuyruklama teknolojisi üzerinden okuyup, yapması gereken işlem ve hesaplamaları yaptıktan sonra çıktıları Elasticsearch içerisinde saklamıştır. Apache Storm topolojisi içerisinde üretilen sonuçlar daha sonra REST (Representational State Transfer) mimarisi kullanılarak son kullanıcı ile paylaşılmıştır.Öğe Deep Learning Based Chatbot Adapted to the Electronic Funds Transfer Process of Turkish Banking(Ismail Saritas, 2023) Toprak, Ahmet; Turan, Metin; Toprak, Feyzanur SağlamAdvanced applications of Natural Language Processing require understanding the semantic of the language. If traditional machine learning techniques are used, the models built for conversations, called chatbots, are unable to be truly generic. On the other hand, deep learning allows us to extract the complexities within language and makes it easier to model. It can also leverage for building a chatbot which has a real conversation with human. In the study, Electronic Funds Transfer process of Turkish bank operations has been designed. A dictionary of terms used in this process has been created in order to train dialog model. Language descriptor layer first checks the language of command. Named Entity Recognition layer later, classifies the words according to their asset structures, especially the amount and account number information in the Electronic Funds Transfer process. LSTM architecture is used to keep the other stages of the dialog, so that order of dialog is in control. The performance evaluation of the designed model was calculated separately for 3 different EFT processes. According to the results obtained, a success rate of 70% was achieved in EFT with account number, 90% in EFT with IBAN number, and 90% in EFT with credit card number.Öğe Doğal dil işleme ile İngilizce otomatik sözlük oluşturma(İstanbul Ticaret Üniversitesi, 2019) Toprak, Ahmet; Turan, MetinDil sözlüğü alanındaki çalışmalar, otomatik sözlük oluşturma konusuna yoğunlaşmış durumdadır. Bu makalede başlangıç olarak verilen bir İngilizce doküman referans alınarak, makale konusuna ait sözlüğün otomatik oluşturulması sağlanmıştır. Çalışmada öncelikli olarak, referans dokümanı temsil eden anlamlı kelimeler tespit edilmiştir. Bu amaçla hem Helmholtz Prensibi hem de TF-IDF metrikleri uygulanmıştır. İlk sözlük kelimeleri bu tohum dediğimiz referans dokümanına ait anlamlı kelimelerden oluşmaktadır. Daha sonra bir döngü ile, en son işlenen dokümana ait anlamlı kelimeler kullanılarak Azure Web Cognitive Web Search sisteminde Web araması yapılmaktadır. Arama sonucu gelen ilk dokümanın, referans dokümanına da uygulandığı üzere Helmholtz Prensibi ve TF-IDF metrikleri ile anlamlı kelimeleri bulunmaktadır. Döngü esnasında bulunan anlamlı kelimeler bu sefer sözlüğe doğrudan eklenmemekte, sapmaları önlemek üzere WordNet sözlüğü kullanılarak her anlamlı kelimenin oluşmuş sözlük ile benzerliği hesaplanmaktadır. Benzerlik değerleri, belirli bir eşik değerinden yüksek olan anlamlı kelimeler sözlüğe eklenmekte ve bu kelimeler kullanılarak Web'te arama döngüsü tekrarlanmakta, nihai olarak sözlük için istenilen kelime sayısına ulaşıldığında ise sonlanmaktadır. Sözlüğün başarımını ölçmek üzere, Hash Similarity benzerlik hesaplaması yöntemi kullanılmıştır. Farklı konularda verilen referans dokümanlarla yapılan sınamalarda, Helmholtz Prensibi uygulanarak yapılan çalışmalarda ortalama % 52,50, TF-IDF metrikleri uygulanarak yapılan çalışmalarda ise % 75,2 oranında benzerliğe sahip sözlükler oluşturulabilmektedir.Öğe Enhanced Named Entity Recognition algorithm for financial document verification(Springer, 2023) Toprak, Ahmet; Turan, MetinMany enterprise systems are document-intensive and require extensive manual verifcation. The verifcation process has challenge in terms of time and remaining bugs. A general automatic or semi-automatic document verifcation system would be useful. However, as the nature of the natural language, the context is an important factor. In this research, the target context is selected to be the fnancial documents, which have been highly interested recently. An automatic document verifcation model based on only entities (mostly faced within fnancial documents) was experimented. The summary report was verifed with original documents, such that enti ties in the summary were searched for matching in the original documents. Verifca tion process success was evaluated by comparison of the named entity algorithms in the literature. The special Kaggle data set ready for this purpose was used for entity matching from the summary within the original documents. The average document verifcation accuracy of named entity fnding algorithms for only fnancial type documents was 85.36%, where the proposed entity recognition algorithm reached 88.80%. On the other hand, the average document verifcation time of the experi mented algorithms and the developed algorithm is 2.43 and 2.48 s respectively. As a conclusion, when both the BERT-base-cased classifcation model and rule-based approaches are applied specifc to the context, it enhances the entity verifcation process with an insignifcant time cost. Consequently, even we used limited data and rules, it is seen that there exists opportunity to automatize the document verifcation process with the support of both the BERT-base-cased classifcation model and rulebased approaches.Öğe Konuya özel web kaynaklı İngilizce otomatik sözlük oluşturma(İstanbul Ticaret Üniversitesi, 2019) Turan, Metin; Toprak, Ahmet;Dil sözlüğü alanındaki çalışmalar, otomatik sözlük oluşturma konusuna yoğunlaşmış durumdadır. Bu makalede başlangıç olarak verilen bir İngilizce kelime referans alınarak, makale konusuna ait sözlüğün otomatik oluşturulması sağlanmıştır. İlk sözlük kelimesi, sisteme başlangıç olarak verilen bu İngilizce kelimeden elde edilmektedir. Sözlüğe eklenen ilk tohum kelime ile daha sonra Azure Web Cognitive Web Search sisteminde Web araması yapılmaktadır. Arama sonucu gelen ilk dokümanın, referans dokümanına da uygulandığı üzere Helmholtz Prensibi ile anlamlı kelimeleri bulunmaktadır. Bulunan bu anlamlı kelimeler arasından, anlam değeri en yüksek olan kelime sözlüğe eklenmektedir. Böylece Web’ten elde edilen bir dokümanın işlenmesi sonucu, o dokümana ait sadece en anlamlı kelime sözlüğe eklenmektedir. Daha sonra sözlüğe eklenen bu kelime, Web'te arama işlemine tabi tutulmaktadır. Web araması sonucu elde edilen dokümanlar tekrardan sisteme sokularak, bu dokümanlara ait anlamlı kelimelerin hesaplanması sağlanmaktadır. Web’te arama döngüsü bu şekilde tekrarlanmakta, nihai olarak sözlük için istenilen kelime sayısına ulaşıldığında ise sonlanmaktadır. Sözlüğün başarımını ölçmek üzere, Hash benzerlik değeri hesaplanmıştır. Farklı konularda verilen referans kelimelerde yapılan sınamalarda ortalama % 40.46 oranında benzerliğe sahip sözlükler oluşturulabilmektedir.Öğe The Positive Effect of PMI on the Selection of Meaningful Words(IEEE, 2019) Toprak, Ahmet; Turan, MetinThe aim of this study is to enhance the quality of automatic created dictionary. As far as we know, PMI (Pointwise Mutual Information) is the first time applied in order to determine representative words in the literature. A previously developed system is revised to experiment PMI effect on the selection of representative words additionally. Firstly, the meaningful words of the seed document/s arc determined by Helmholtz Principle. Then, PMI value is calculated for each of the meaningful words. Meaningful words are sorted by using the total PMI value in decreasing order. Finally, the top n meaningful words are added to the dictionary, where n is experimentally worked. Hash similarity is used to measure the performance of the dictionary. PMI enhances the dictionary quality for all n value. The dictionary hash similarity increases from 40.46% up to 68.75% for the best n value in the experiments.