Compte-rendu 1ère séance

Lors de la première séance, nous avons découvert l’intitulé du projet: “La vie multilingue des mots”. Les objectifs sont de constituer un corpus multilingue et d’analyser le corpus construit. Nous avons donc constituer des groupes, réfléchit à une thématique. Les grandes lignes du projet ont été fixées.

Nous avons également eu une introduction sur les expressions régulières, notamment comment elle est construite.

egrep -o “\w+” amants-utf8.txt | sort | uniq -c | sort -r

i

 

| (pipe) fait passer le résultat d’une commande à une autre. Redirection de flux: le résultat de la commande est envoyé à la commande suivante
egrep attrape dans le fichier texte l’expression entre “”-o est une option de commande de egrep qui permet de reconnaître les expression régulières
sort permet de trier par ordre alphabétique les résultats
uniq rassemble les lignes qui sont les mêmes en une et l’option -c permet de compter combien d’occurrences ont été écrasées
sort retrie les résultats et l’option -r permet de trier les résultats dans l’ordre inverse, c’est à dire du plus grand nombre d’occurrences au plus petit nombre d’occurrences

Nous avons aussi vu la commande wc (word count) qui permet de compter les blancs. Plusieurs options sont disponibles:

i

  • wc -w qui compte les mots (en comptant les blancs)
  • wc -l qui compte les lignes
  • wc -c qui compte les caractères
  • wc seul affiche dans l’ordre le nombre de mots, le nombre de lignes et le nombre de caractères

Leave a comment