Nous citerons en premier lieu les travaux du laboratoire de didactique expérimentale de l'université de Louvain sous la direction du Professeur BUYSE, et dont l'objet était la détermination et la répartition de la matière à enseigner dans le domaine du vocabulaire écrit actif. A partir du dépouillement de 5525 textes (4100 rédactions spontanées d'élèves des deux sexes, 25 historiettes d'enfants bien doués et 1400 lettres d'adultes), ARISTIZABAL déterminait une liste de 4329 mots couvrant avec leurs fréquences cumulées plus des 95% de l'ensemble du lexique. Après l'élimination de plus ou moins 650 mots pour en arriver à un vocabulaire vraiment usuel de 3680 mots (liste couvrant encore les 92% de tous les termes relevés), DUBOIS faisait orthographier chacun des mots par plus de 500 élèves et les répartissait ensuite d'après leur pourcentage de réussite en 43 groupes ou échelons. (Ces normes permettent toujours (des contrôles expérimentaux de F. TERS ont permis de le vérifier) une mesure précise de la capacité orthographique des élèves, principalement aux âges de 7 à 12 ans.) En 1946, LAMBERT présentait à son tour un travail portant sur une étude qualitative des fautes d'orthographe d'usage. Il calculait notamment un indice de difficulté obtenu à partir du rapport "nombre de formes/nombre de fautes" et tentait même un essai de classification des fautes. Enfin PIRENNE allait reprendre et préciser les recherches précédentes pour, en se référant à deux facteurs (fréquence d'emploi par les enfants et degré de difficulté du mot), élaborer un "Programme d'orthographe d'usage" pour les 6 années de l'enseignement primaire. Cependant, pour que ces recherches obtiennent enfin l'audience qu'elles méritaient, il faudra attendre l'édition de deux ouvrages fondamentaux parus entre 1964 et 1968. Cette oeuvre d'une équipe franco-suisse (TEKS, MAYER et REICHENBACH) comporte : Une version nouvelle de l'"Echelle DUBOIS-BUYSE" développant en plus un modèle mathématique pour la description des progrès des enfants et de leurs performances. Un "Vocabulaire orthographique de base" réunissant toutes les enquêtes débouchant sur ce sujet (environ 6 millions de mots) pour ne conserver finalement qu'environ 8 000 mots différents, répartis en 59 centres d'étude pour les cycles primaire et secondaire (de 6 à 15 ans). Enfin, une dernière recherche est venue compléter magistralement l'ensemble. II s'agit d'un travail monumental réalisé par ordinateur au laboratoire du C.N.R.S. de Nancy (sous la direction du Professeur IMBS) à partir de la langue littéraire des XIXè et XXè siècles. Les résultats de ces calculs ont été regroupés dans "Le trésor de la langue française" (T.L.F.). Par l'ampleur des dépouillements (1 000 titres d'ouvrages donnant un total de 70 137 234 termes pour 71 415 mots différents et dont 1/10 000 des fréquences nous fournit une sérieuse base de référence pour 7000 mots) et la nature des informations traitées, cette publication devrait constituer un appui précieux pour toute nouvelle recherche sur la langue française écrite. En ce qui concerne le français parlé, des enquêtes ont été effectuées par l'équipe du "Centre du français élémentaire" sous la direction du Professeur GOUGENHEIM entre les années 1951 et 1955. Bien que moins importantes (elles n'ont porté que sur un total de 312 000 mots), elles ont cependant permis de dégager, après adjonction de mots de disponibilité, deux référentiels pour le langage oral un "Français fondamental" 1er et 2è degrés, soit environ 3 000 mots. A ce sujet, bien que cela n'entre pas dans le cadre de cette étude, il est intéressant de constater que la base orale ou écrite est essentiellement la même puisque 96 % des mots du "Français fondamental" (1er degré) se retrouvent dans l'"Echelle PIRENNE" (1 250 sur 1 300). Par la suite, il importe de distinguer les listes selon qu'elles sont basées sur la langue parlée ou sur la langue écrite. Deux remarques à propos de toutes ces recherches : 1) II est certain que pour une langue aussi intellectualisée que le français, c'est au-delà de 3 000 mots que tout se différencie. Gardons par conséquent la tête froide en assignant à nos objectifs des limites raisonnables. 2) L'indice de fréquence n'est pas le seul critère qui permette la détermination d'un vocabulaire de base. SAVARD, dans son ouvrage "La valence lexicale", en signale d'autres (répartition, disponibilité, dispersion), mais leur utilisation s'avère, pour le moment, délicate. Notons néanmoins une tentative intéressante : un coefficient d'usage obtenu par la formule : Fréquence x Dispersion 100 (A. JUILLAND - Frequency Dictionary of French Words). Pour conclure, on admettra sans peine que le corpus le plus étendu et le plus varié a ses limites, d'où l'utilité de combiner fréquence et répartition pour tenter de neutraliser les différences thématiques. Deux contributions récentes en matière de vocabulaire de base Depuis la parution de notre "Vocabulaire de base de la langue écrite", deux recherches sont venues compléter les principales listes de fréquence sur lesquelles nous nous appuyons. Ces travaux statistiques prolongent et améliorent les outils dont nous disposions jusqu'à présent. Citons en premier lieu "Les listes orthographiques de base du français (LOB), de Nina CATACH. Trois listes totalisent 1 600 mots de très forte fréquence, essentiellement tirés du "Frequency Dictionary of French Words" de JUILLAND. Ceux-ci sont présentés sous trois formes : par ordre de fréquence décroissante, par ordre alphabétique normal ou inverse. L'originalité de ce travail est d'égaiement fournir des renseignements d'ordre pratique aux fins d'exploitations pédagogiques et/ou informatiques : formes fléchies les plus fréquentes, possibilités de liaison, types de marques graphiques finales. L'ensemble des mots recensés couvre plus de 90 % des potentialités d'occurrences dans n'importe quel texte de français courant. François TERS s'est également inspiré des travaux d'Alphonse JUILLAND pour déterminer 4 listes de mots en fonction de la fréquence d'apparition et de la répartition dans des textes différents. Sur 1 180 mots recensés 840 d'entre eux se regroupent sur 341 mots-source. Ce corpus de mots est d'une telle efficacité que l'auteur en fait "le guide de la conquête ou de la reconquête de l'ensemble de ce qui devrait être acquis et compris au cours des cinq années de l'école primaire". Cette étude statistique paraîtra bientôt à la "Maison des Instituteurs" à ORGEVAL.
Etudier l'essentiel avant l'accessoire est le seul parti raisonnable et efficace. Or, ce vocabulaire fournit au maître les mots sur lesquels il doit porter ses efforts en priorité. Se soucier des possibilités réelles des enfants, c'est savoir quand il est raisonnable d'aborder l'étude de tel ou tel mot. Ces renseignements figurent dans les référentiels proposés. Bien sûr, il appartiendra toujours au maître de "sentir" la méthode. Mais une échelle de fréquences constitue un guide sûr et pratique qui délimite la matière pour un apprentissage rationnel de la langue écrite et bien que celle-ci ne puisse être réduite à une somme de mots, même hétérogènes à souhait.
Drag & Drop Website Builder