Nuage de mot khmer

Capture d_écran 2017-12-08 à 22.37.57

Bonjour,

Nous avons rencontré un problème au moment de faire l’index des urls khmères qui permet d’ensuite faire une segmentation des mots avec le logiciel Le Trameur qui nous aurait permis de segmenter les textes, en enlevant les mots communs et nous aurait permis d’obtenir un nuage de mot le plus importants.

Cela nous aurait permis de faire une analyse de mots les plus utilisés sur le web quand il s’agit du thème de la femme.

Mais l’écriture khmère ne possédant pas d’espace entre les mots, le texte ne se segmentait par mot, mais par phrases.

Alors il a fallu trouver une autre solution, j’ai alors repris mes urls une par une et je les ai segmenté à l’aide d’un site qui permet de segmenter les textes khmers, lao, birman et thaï : http://lingwarium.org/motor/Segmentation/Segmentation.php

Après avoir mis tous les textes segmentés dans le même fichier, j’ai utilisé le site https://www.nuagesdemots.fr/ pour faire mon nuage de mot.

Le seul problème que je possède encore c’est qu’il faut que j’enlève moi-même les mots communs car les mots qui étaient les plus utilisés étaient des mots comme « avoir » ou « pouvoir ».

 

Un commentaire sur “Nuage de mot khmer

Ajouter un commentaire

Laisser un commentaire

Créez un site Web ou un blog gratuitement sur WordPress.com.

Retour en haut ↑