Not all languages are the same

Grammar rules vary from one language to another. The rules of verb conjugation, noun-verb agreement and negations vary from one language to another.

French is a unique language and it differs from English in a number of ways. To use the same techniques and language models that work for English sentiment analysis when conducting French sentiment analysis would yield terribly inaccurate results.

That's why Repustate developed French-specific tools to help in French sentiment analysis, including a French part of speech tagger, a French lemmatizer, and of course, French-specific sentiment models.

French part of speech tagging

French part of speech tagging allows Repustate to narrow in on where sentiment may lie within a block of text. Verbs, nouns and adjectives, provide the cues necessary to determine sentiment.

In order to create a fast and accurate French part of speech tagger, you have to have a massive corpus of manually tagged French text. This French text can then be fed into a machine learning algorithm to create a French part of speech tagger.

The larger the corpus, and more importantly, the more varied the corpus, the better the results in creating the French part of speech tagger. Repustate has created a massive corpus of French text grabbing data from a variety of sources to ensure good coverage.

French language sentiment models

Repustate has developed sentiment language models specific to French to capture the various phrases, idioms and expressions that help define sentiment when writing in French. Understanding the various grammatical aspects of the French language that make it unique and very different from English is what allows Repustate's French sentiment analysis to be as fast and as accurate as it is.

Toutes les langues ne sont pas les mêmes

Les règles de grammaire varient d'une langue à l'autre. Les règles de conjugaison des verbes, l'accord nom-verbe et les négations varient d'une langue à l'autre.

Le français est une langue unique et elle diffère de l'anglais de plusieurs façons. Utiliser les mêmes techniques et les mêmes modèles de langue qui fonctionnent pour l'analyse des sentiments de l'anglais lors qu'on effectue l'analyse des sentiments de français donnerait des résultats horriblement imprécis.

Voilà pourquoi Repustate a conçu des outils propress à français pour aider à l'analyse des sentiments de français, y compris un étiqueteur morpho-syntaxique de français, un lemmatiseur de français et, bien sûr, des modèles de sentiments propres à français.

Étiquetage morpho-syntaxique de français

L'étiquetage morpho-syntaxique de français permet à Repustate de cerner l'endroit où les sentiments peuvent se situer dans un bloc de texte. Verbes, noms et adjectifs fournissent les indices nécessaires pour déterminer les sentiments.

Afin de créer un étiquetage morpho-syntaxique rapide et précis de français, vous devez avoir un corpus massif de texte de français manuellement étiqueté. Ce texte de français peut ensuite être introduit dans un algorithme d'apprentissage automatique pour créer un étiqueteur morpho-syntaxique de français.

Plus le corpus est grand, et plus important encore, plus le corpus est varié, plus les résultats dans la création de l'étiqueteur morpho-syntaxique de français. Repustate a créé un corpus massif de texte de français saisissant des données de diverses sources pour assurer une bonne couverture.

Les modèles de sentiments de langue de français

Repustate a conçu des modèles de sentiments de langue propres à français pour saisir les diverses syntagmes, locutions et expressions qui aident à définir les sentiments en écrivant en français. Comprendre les différents aspects grammaticaux de la langue français qui la rendent unique et très différente de l'anglais est ce qui permet à l'analyse des sentiments de français de Repustate d'être aussi rapide et précise qu'elle est.

Have a question about French sentiment analysis? Ask us!