La première partie du cours nous avons commencer par répondre à la question comment sont organisés les informations dans un ordinateurs? En effet cette organisation dépend de l’environnement dans lequel nous travaillons. Dans un environnement windows les informations sont organisés sous forme d’arborescence physique contrairement à environnent Linux ou mac ou ils sont organisés sous... Lire la Suite →
Modifications dans le script
Bonjour! J´ai révisé encore une fois le script et finalement j´ai décidé de faire une petite modification. En fait, j´ai répéré que dans la version précédente, lorsque le programme ne trouvait pas l´encodage du fichier, quand on le cherchait dans la page aspirée avec la commande egrep, on vérifiait juste ensuite s´il se trouvait parmi... Lire la Suite →
Nuage de mot khmer
Bonjour, Nous avons rencontré un problème au moment de faire l'index des urls khmères qui permet d'ensuite faire une segmentation des mots avec le logiciel Le Trameur qui nous aurait permis de segmenter les textes, en enlevant les mots communs et nous aurait permis d'obtenir un nuage de mot le plus importants. Cela nous aurait... Lire la Suite →
Problèmes!!!
Le script semblait être parfait mais...pas du tout! J´ai rencontré plusieurs erreurs! Pour la création des fichiers INDEX on utilise la suivante commande: Je vais vous montrer le resultat obtenu... Il faudrait penser à une autre solution pour construire un index de chaque fichier dump...On pourrait essayer par exemple en remplaçant chaque espace par... Lire la Suite →
Dernières progressions
Comme j´avais expliqué lors de mon dernier post, j´avais essayé de faire une concaténation de tous mes fichiers DUMPS (divisés par langue) pour les utiliser plus tard dans l´analyse de corpus. J´avais crée un boucle pour ce but. Cependant, j´arrivais pas à obtenir mes fichiers "dumps-total". En fait, c´était plus facil que ce que j´avais... Lire la Suite →
Homebrew : aide pour commande wget et lynx sur macOS
Homebrew est un gestionnaire de paquet pour macOS. Il permet de ne pas passer par plusieurs lignes de commande pour installer une nouvelle commande tel que wget ou lynx. Il suffit d'une ligne de commande pour que brew installe la commande manquante. Ensuite il suffit d’exécuter la commande brew install nomdecommande pour installer la commande manquante.... Lire la Suite →
Séance du 22 Novembre : Résumé du cours
Nous avons tout d'abord parlé du rendu final qui est un site web. Une fois que le script est terminé il va falloir faire notre site. Pour cela il faut télécharger un modèle de site web (free tamplate html sur google ou sur icampus). Deuxièmement, nous avons vu comment concaténer les dumps texts et le... Lire la Suite →
Séance 22 novembre
Ce post est consacré au derniers mises à jour de mon script: J´ai rajouté dans mon dossier URLS les deux fichiers qui contiennent les URLS en français et les URLS en khmer (ces derniers correspondants à la langue de ma collège). Quand j´essayé d´exécuter mon script avec les liens en français je trouvais un erreur... Lire la Suite →
Progrès dans le script
Comme ma collègue vient de commenter, maintenant notre groupe n´est formé que par Margaux et moi. Nous allons donc introduire le français comme troisième langue dans notre projet. En ce qui concerne le script, heuresement, j´ai avancé avec mon script. Je voudrais remarquer que la plupart des problèmes étaient causés par des erreurs de syntaxe... Lire la Suite →
Avancement du projet et difficulté
Nous sommes aujourd'hui le 21 Novembre 2017 et nous sommes plus que deux dans ce projet. Jihen a décidé d'arrêter le master pour cause personnel et il nous manque donc une langue. Notre organisation va donc être modifié car nous devons posséder trois langues et nous possédons actuellement avec Elvira les urls dans la langue... Lire la Suite →