séance du 26 septembre 2018

La première partie du cours nous avons commencer par répondre à la question comment sont organisés les informations dans un ordinateurs? En effet cette organisation dépend de l’environnement dans lequel nous travaillons. Dans un environnement windows les informations sont organisés sous forme d’arborescence physique contrairement à environnent Linux ou mac ou ils sont organisés sous... Lire la Suite →

Modifications dans le script

Bonjour! J´ai révisé encore une fois le script et finalement j´ai décidé de faire une petite modification. En fait, j´ai répéré que dans la version précédente, lorsque le programme ne trouvait pas l´encodage du fichier, quand on le cherchait dans la page aspirée avec la commande egrep, on vérifiait juste ensuite s´il se trouvait parmi... Lire la Suite →

Nuage de mot khmer

Bonjour, Nous avons rencontré un problème au moment de faire l'index des urls khmères qui permet d'ensuite faire une segmentation des mots avec le logiciel Le Trameur qui nous aurait permis de segmenter les textes, en enlevant les mots communs et nous aurait permis d'obtenir un nuage de mot le plus importants. Cela nous aurait... Lire la Suite →

Problèmes!!!

Le script semblait être parfait mais...pas du tout! J´ai rencontré plusieurs erreurs!   Pour la création des fichiers INDEX on utilise la suivante commande:  Je vais vous montrer le resultat obtenu... Il faudrait penser à une autre solution pour construire un index de chaque fichier dump...On pourrait essayer par exemple en remplaçant chaque espace par... Lire la Suite →

Dernières progressions

Comme j´avais expliqué lors de mon dernier post, j´avais essayé de faire une concaténation de tous mes fichiers DUMPS (divisés par langue) pour les utiliser plus tard dans l´analyse de corpus. J´avais crée un boucle pour ce but. Cependant, j´arrivais pas à obtenir mes fichiers "dumps-total". En fait, c´était plus facil que ce que j´avais... Lire la Suite →

Homebrew : aide pour commande wget et lynx sur macOS

Homebrew est un gestionnaire de paquet pour macOS. Il permet de ne pas passer par plusieurs lignes de commande pour installer  une nouvelle commande tel que wget ou lynx. Il suffit d'une ligne de commande pour que brew installe la commande manquante. Ensuite il suffit d’exécuter la commande brew install nomdecommande pour installer la commande manquante.... Lire la Suite →

Séance 22 novembre

Ce post est consacré au derniers mises à jour de mon script: J´ai rajouté dans mon dossier URLS les deux fichiers qui contiennent les URLS en français et les URLS en khmer (ces derniers correspondants à la langue de ma collège). Quand j´essayé d´exécuter mon script avec les liens en français je trouvais un erreur... Lire la Suite →

Progrès dans le script

Comme ma collègue vient de commenter, maintenant notre groupe n´est formé que par Margaux et moi. Nous allons donc introduire le français comme troisième langue dans notre projet. En ce qui concerne le script, heuresement, j´ai avancé avec mon script. Je voudrais remarquer que la plupart des problèmes étaient causés par des erreurs de syntaxe... Lire la Suite →

Avancement du projet et difficulté

Nous sommes aujourd'hui le 21 Novembre 2017 et nous sommes plus que deux dans ce projet. Jihen a décidé d'arrêter le master pour cause personnel et il nous manque donc une langue. Notre organisation va donc être modifié car nous devons posséder trois langues et nous possédons actuellement avec Elvira les urls dans la langue... Lire la Suite →

Propulsé par WordPress.com.

Retour en haut ↑