Page 23 - base

Version HTML de base

23
Système de communication des perroquets gris du Gabon
Ce générateur de fonctions mathématiques repose sur un
algorithme de programmation génétique. La pertinence
(fitness) utilisée pour évaluer la performance des fonctions
est basée sur une approche «wrapper» de sélection de
paramètres : la fitness d’une fonction est la performance
du classificateur associée à cette fonction seulement. Le
processus de recherche tourne jusqu’à l’identification de
fonctions puissantes. Au final, les meilleures fonctions
sont sélectionnées par un algorithme de sélection de fonc-
tions[3]. Cet outil nous a ainsi permis d’identifier 20 fonc-
tions mathématiques permettant de distinguer précisément
les cinq types de cris dans la base de données SBA. Puis,
afin de vérifier la puissance réelle de ces fonctions mathé-
matiques, nous les avons appliqué à la deuxième subdivi-
sion de SBD, appelée SBE. Nous avons utilisé soit 4, soit
5, soit 10, soit 20 fonctions mathématiques sélectionnées
par EDS afin de comparer l’efficacité de ces dernières. Ces
fonctions sont à l’origine de la construction du classifica-
teur lui-même, qui s’appuie dans notre travail sur un algo-
rithme en arbre de décision (tableau 1). Les performances
du classificateur étaient déjà puissantes avec l’utilisation de
quatre fonctions mathématiques seulement identifiées par
EDS. L’opération de vérification de la puissance du classifi-
cateur s’est réalisée en deux temps.
Abs(Norm(PitchPraat(Blackman(Integration(VMeanNormalization(Arcsin(x)))))))
Sqrt(Abs(Iqr(Centroid(FilterBank(Abs(x)_27.0)))))
Variance(PitchPraat(Abs(Bartlett(x))))
Zcr(Skewness(SplitOverlap(x_32.0_0.5)))
Sqrt(Centroid(Blackman(SpectralKurtosis(MelFilterBank(x_10.0)))))
Tabl. 1 : Exemples de fonctions mathématiques
sélectionnées par EDS
Table 1 : Samples of acoustic features selected by EDS
Dans un premier temps (entraînement du classificateur), un
algorithme en arbre de décision a été entraîné sur les valeurs
des fonctions calculées sur 10% des exemplaires choisi
aléatoirement dans SBE. Dans un deuxième temps (perfor-
mance du classificateur), la performance du classificateur
a été évaluée sur les 90% restant de SBE. Cette procé-
dure peut être répétée plusieurs fois. Concrètement, nous
avons d’abord extrait pour chaque vocalisation de SBE, les
valeurs des fonctions mathématiques extraites grâce à EDS.
Puis, nous avons utilisé l’algorithme en arbre de décision.
Ce dernier sélectionne dans la première étape un échan-
tillon aléatoirement dans SBE, c’est-à-dire 10% des vocali-
sations (soit environ 247). Cet algorithme s’entraîne, c’est-
à-dire qu’il se construit à partir des valeurs des fonctions
mathématiques propres à chaque vocalisation. Une fois
établi, cet arbre est appliqué sur le reste de SBE (les 90%
restants). A l’issue, nous obtenons un tableau sous forme
d’une matrice représentant d’un côté le type de cri d’origine
(i.e. défini par l’expérimentateur) et de l’autre le type de cri
issu de l’algorithme de classification ce qui permet d’iden-
tifier les cris d’un type donné classé de façon identique ou
non entre l’analyse experte et l’analyse par l’algorithme.
Supposons deux cris, le cri 1 et le cri 2. L’expérimentateur
a classé le cri 1 dans le type C 1 et le cri 2 dans le type
C 2. La matrice obtenue après calcul par l’algorithme en
arbre de décision nous donne une matrice à deux lignes
et deux colonnes : l’index des colonnes sera «type de cri
d’origine», l’index des lignes sera «classé en». Ainsi, soit
l’algorithme a classé les cris de façon identique à l’ex-
pert, et dans ce cas, nous obtiendrons des valeurs dans
la diagonale uniquement (un cri classé dans le type C 1
et un autre classé dans le type C 2 par l’expert ont été
effectivement classés dans les types C 1 et C 2, respec-
tivement, par l’algorithme) ; soit l’algorithme a classé de
façon différente à l’expert et dans ce cas, nous pouvons
par exemple obtenir que le cri 1 classé dans le type C 1
par l’expert a été classé en C 2.
De cette matrice, nous pouvons par la suite extraire
différents indices de performances : soit le nombre de
cri «correctement classés» c’est-à-dire classés de façon
identique entre l’expert et l’algorithme, soit un indice de
performance prenant en compte les erreurs : la F-mesure,
calculée avec la formule suivante :
F = 2 x precision x recall ; sachant que : 
precision + recall
Precision = Ntp ; et que : 
Ntp + Nƒp
Recall = Ntp  
Ntp + Nƒn
Type de cri défini par l’expert
C 1 C 57 C 77 C 106 C 113 Type de cri défini par l’algorithme
523 4
2
0
62
C 1
26 1043 27
0
81
C 57
3
6 382
1
0
C 77
4
5
0
182
0
C 106
18 2
1
0
99
C 113
Tabl. 2 : Matrice de résultats obtenue en utilisant 20 fonctions mathématiques et 50 répétitions pour constituer l’arbre de
décision. On peut noter que plus de cris sont « correctement classés » (diagonale de la matrice) qu’incorrectement.
Table 2: Result matrix obtained with 20 EDS acoustic features and 50 repetitions to establish the decision tree.
Note that more calls were “correctly classified” (diagonal of the matrix) than incorrectly.