Le script semblait être parfait mais…pas du tout! J´ai rencontré plusieurs erreurs!
- Pour la création des fichiers INDEX on utilise la suivante commande:
Je vais vous montrer le resultat obtenu…
Il faudrait penser à une autre solution pour construire un index de chaque fichier dump…On pourrait essayer par exemple en remplaçant chaque espace par un saute de ligne et après nettoyer le fichier de signes de ponctuation…mais le problème est que cela dépendera de chaque fichier et chaque langue.
2. On voulais faire apparaître notre motif en gras dans les fichiers CONTEXTE. J´ai essayé avec la commande » egrep –colour » mais cela affiche seulement le motif en couleur dans le terminal, pas dans le fichier où on dirige le résultat.
À bientôt…
Elvira
mmmm…
la bonne commande commence par :
egrep -o « \w+ » …
extraction des occurrences (-o) de séquences de caractères de mots (\w+)
J’aimeJ’aime
Vous faites le Khmer a l’INALCO?
J’aimeJ’aime
oui
J’aimeJ’aime
Moi, je suis étudiant khmer a l’INALCO.
J’aimeJ’aime