Réduction du vocabulaire de sortie

Cette option permet de réduire le nombre de conclusions distinctes des règles dans un SIF.

Elle peut être lancée à la suite d'une procédure d'apprentissage, telle que l'OLS ou FPA, qui génère a priori autant de conclusions différentes que de règles.

Il faut indiquer à partir de quelles valeurs la réduction doit s'opérer. Deux choix sont possibles : soit les conclusions des règles existantes, soit les valeurs de la variable de sortie dans le fichier de données. La réduction consiste en une opération de clustering des conclusions ou des valeurs de sortie pour obtenir les valeurs finales des conclusions.

L'utilisateur peut fixer le nombre de valeurs désiré ou bien spécifier une perte de performance tolérée. En effet, la réduction de vocabulaire s'accompagne en général d'une perte de précision.

Interface Java :

Menu SIF, option Réduire le vocabulaire de sortie.

En ligne de commande, programme vocreduc :

Argument :

Options :

 -oNumOutput
utilisé pour préciser le numéro de la sortie à traiter (par défaut 0=la première sortie)
 -dType
  • -d1 : les conclusions sont choisies parmi les conclusions des règles existantes (valeur par défaut)
  • -d0 : les conclusions sont choisies parmi les valeurs de sortie dans le fichier de données
 -lPerfLoss : PerfLoss est la perte relative de performance autorisée lors de la réduction de vocabulaire. Dans ce cas Conc est déterminé par le programme.
 -cConc : Conc est le nombre de conclusions différentes utilisées. Dans ce cas PerfLoss est déterminé par le programme.

Remarque : la valeur par défaut de ces 2 arguments est 0.1 pour PerfLoss, et détermination automatique de Conc.

 -sVal Val est le seuil d'activité pour considérer un exemple comme non blanc (par défaut : 0.2)
 -a : affichage détaillé

Exemple de ligne de commande

vocreduc rice.fis rice

Le nombre de conclusions passe de 25 à 6.