Not all languages are the same

Grammar rules vary from one language to another. The rules of verb conjugation, noun-verb agreement and negations vary from one language to another.

Turkish is a unique language and it differs from English in a number of ways. To use the same techniques and language models that work for English sentiment analysis when conducting Turkish sentiment analysis would yield terribly inaccurate results.

That's why Repustate developed Turkish-specific tools to help in Turkish sentiment analysis, including a Turkish part of speech tagger, a Turkish lemmatizer, and of course, Turkish-specific sentiment models.

Turkish part of speech tagging

Turkish part of speech tagging allows Repustate to narrow in on where sentiment may lie within a block of text. Verbs, nouns and adjectives, provide the cues necessary to determine sentiment.

In order to create a fast and accurate Turkish part of speech tagger, you have to have a massive corpus of manually tagged Turkish text. This Turkish text can then be fed into a machine learning algorithm to create a Turkish part of speech tagger.

The larger the corpus, and more importantly, the more varied the corpus, the better the results in creating the Turkish part of speech tagger. Repustate has created a massive corpus of Turkish text grabbing data from a variety of sources to ensure good coverage.

Turkish language sentiment models

Repustate has developed sentiment language models specific to Turkish to capture the various phrases, idioms and expressions that help define sentiment when writing in Turkish. Understanding the various grammatical aspects of the Turkish language that make it unique and very different from English is what allows Repustate's Turkish sentiment analysis to be as fast and as accurate as it is.

Bütün diller aynı değildir

Dil bilgisi kuralları bir dilden diğerine değişir. Fiil çekimi, isim-fiil uygunluğu ve olumsuzluk kuralları dilden dile değişir.

Türkçe benzersiz bir dildir ve bir dizi yolla İngilizce'den farklıdır. Türkçe duygu analizi yaparken İngilizce duygu analizlerindeki aynı teknikleri ve dil modellerini kullanmak korkunç derecede yanlış sonuçlar doğuracaktır.

Bu yüzden Repustate Türkçe geliştirildi - , konuşma etiketleyicisi bir kimsenin bir Türkçe bölümü dahil, bir Türkçe lemmatizer ve tabi ki Türkçe - özel duygu modelleri.

İşte bu yüzden Repustate, Türkçe bir sözdizimsel analiz, Türkçe bir lemmatizer ve tabii ki Türkçeye özel duygusal modeller dahil Türkçedeki duygu analizlerine yardım etmek için Türkçeye özel araçlar geliştirdi.

Türkçe sözdizimsel analiz

Türkçe sözdizimsel analiz, Repustate'in bir metin bloğu içinde duygunun nerede olabileceği üzerine yoğunlaşmasına izin verir. Fiiller, isimler ve sıfatlar, duyguyu belirlemek için gerekli ipuçlarını sağlamaktadır.

Hızlı ve doğru Türkçe sözdizimsel analiz oluşturulması için elle etiketlenmiş büyük bir bütünce Türkçe metne sahip olmanız gerekir. Bu Türkçe metin daha sonra Türkçe sözdizimsel analiz oluşturmak için bir makine öğrenme algoritmasına beslenilir.

Bütünce ne kadar büyük olursa, ve daha da önemlisi ne kadar çeşitli olursa, Türkçe sözdizimsel analiz oluşturmada da o kadar iyi sonuçlar olur. Repustate iyi kapsama alanını garantilemek için çeşitli kaynaklardan gelen verileri kaparak büyük bir Türkçe metin bütüncesi yarattı.

Türkçe dil duygu modelleri

Repustate, Türkçe yazarken duygu tanımlanmasına yardımcı olan çeşitli ifadeler, deyimler ve anlatımlar yakalamak için Türkçeye özgü duygu dil modelleri geliştirmiştir. Türkçe dilini benzersiz ve İngilizceden çok farklı kılan çeşitli dil bilgisel yönlerini anlamak, Repustate'in Türkçe duygu analizini kendisi kadar hızlı ve doğru olmasına olanak sağlayan şeydir.

Have a question about Turkish sentiment analysis? Ask us!