Menu Arbre

Les arbres de décision flous sont une extension des arbres de décision classiques [1,13]. Ils sont composés d'une racine, qui est le sommet ou point de départ de l'arbre, et de n\oeuds. Les n\oeuds terminaux sont appelés feuilles de l'arbre. Chaque n\oeud correspond à un sous-ensemble de valeurs d'une variable d'entrée (variable explicative) du problème traité. Ces éléments sont déterminés de façon à avoir une homogénéité maximale des exemples appartenant au n\oeud, par rapport à la variable à expliquer (variable de sortie). Cette homogénéité se traduit par une maximisation de l'entropie. Les chemins allant de la racine aux feuilles peuvent être interprétés de façon naturelle comme des règles de décision, strictes ou floues selon la nature de l'arbre.


Un élagage de l'arbre peut être effectué, en transformant un n\oeud en feuille, si la perte de performance qui en découle est faible. Cette procédure facilite l'interprétation. L'élagage est basé sur la performance, à l'inférence, du SIF équivalent à l'arbre.


Remarque : il est possible que l'arbre élagué ait une meilleure performance que l'arbre complet. En effet, la construction de l'arbre complet est basée sur la réduction de l'entropie, et non pas directement sur la performance.


Les arbres de décision flous proposés dans FisPro sont basés sur une implémentation floue de l'algorithme ID3 [15].


Génération

Pour générer un arbre de décision flou avec FisPro, un SIF et un fichier de données doivent être ouverts. La construction de l'arbre se fait par apprentissage sur une seule sortie, même si le SIF en compte plusieurs. Cette sortie est choisie par l'utilisateur.


Pour construire automatiquement le SIF, on peut utiliser l'option Générer un SIF sans règles du menu Arbre (voir 1.6).


Type de la sortie

Quatre cas sont possibles :

Les 3 premiers cas utilisent le critère d'entropie floue pour construire l'arbre, le dernier utilise le critère de déviance, basé sur la dispersion des valeurs de sortie dans chaque n\oeud, mieux adapté à un problème de régression.

Quand la sortie est nette, avec l'option classification, les classes sont construites à partir des données, et des SEF discrets correspondant aux classes sont affectés automatiquement à la sortie. Le nombre maximal de classes ou de SEF en sortie est de 100.

Avec l'option classification, la classe majoritaire est associée à chaque n\oeud, sinon, la moyenne des observations arrivant au n\oeud lui est affectée.

Dans le cas d'une sortie floue, le résumé de l'arbre indique les proportions floues des observations arrivant au n\oeud pour chaque SEF.


Règles

Si le SIF possède des règles, elles sont ignorées.


Options

La fenêtre Génère arbre permet de choisir :


Résultats

L'application de la procédure déclenche la création d'un arbre, ou de deux arbres, si l'option élagage a été choisie, ainsi que :

Figure 3: Fichier result.fistree
Image resultfistree

Chacune des lignes décrit un arbre flou (complet ou élagué) : la première colonne indique le nom du fichier de configuration correspondant à l'arbre. On a ensuite les indices décrits dans la section 2 :

2ème colonne : indice de performance
3ème colonne : indice de couverture
4ème colonne : erreur max
5ème colonne : seuil d'appartenance utilisé pour le calcul de l'indice de couverture

Suivent les indices spécifiques a l'arbre flou :

6ème colonne : nombre moyen d'exemples attirés par une feuille
7ème colonne : nombre maximum d'exemples attirés par une feuille
8ème colonne : cardinalité floue moyenne des feuilles
9ème colonne : cardinalité floue maximum des feuilles
10ème colonne : entropie ou déviance moyenne des feuilles, pondérée par leur cardinalité floue
groupes de 3 colonnes (en nombre égal au nombre de variables d'entrée actives du SIF)

colonnes suivantes : les caractéristiques de la base de règles (voir la section 3).


Visualisation 2 options sont possibles pour visualiser un arbre créé par Fispro.

Graphe : comme décrit plus haut
Table : visualisation non graphique de l'arbre, avec les mêmes informations sous forme de tableau.