Page 23 - base

23

Système de communication des perroquets gris du Gabon

Ce générateur de fonctions mathématiques repose sur un

algorithme de programmation génétique. La pertinence

(fitness) utilisée pour évaluer la performance des fonctions

est basée sur une approche «wrapper» de sélection de

paramètres : la fitness d’une fonction est la performance

du classificateur associée à cette fonction seulement. Le

processus de recherche tourne jusqu’à l’identification de

fonctions puissantes. Au final, les meilleures fonctions

sont sélectionnées par un algorithme de sélection de fonc-

tions[3]. Cet outil nous a ainsi permis d’identifier 20 fonc-

tions mathématiques permettant de distinguer précisément

les cinq types de cris dans la base de données SBA. Puis,

afin de vérifier la puissance réelle de ces fonctions mathé-

matiques, nous les avons appliqué à la deuxième subdivi-

sion de SBD, appelée SBE. Nous avons utilisé soit 4, soit

5, soit 10, soit 20 fonctions mathématiques sélectionnées

par EDS afin de comparer l’efficacité de ces dernières. Ces

fonctions sont à l’origine de la construction du classifica-

teur lui-même, qui s’appuie dans notre travail sur un algo-

rithme en arbre de décision (tableau 1). Les performances

du classificateur étaient déjà puissantes avec l’utilisation de

quatre fonctions mathématiques seulement identifiées par

EDS. L’opération de vérification de la puissance du classifi-

cateur s’est réalisée en deux temps.

Abs(Norm(PitchPraat(Blackman(Integration(VMeanNormalization(Arcsin(x)))))))

Sqrt(Abs(Iqr(Centroid(FilterBank(Abs(x)_27.0)))))

Variance(PitchPraat(Abs(Bartlett(x))))

Zcr(Skewness(SplitOverlap(x_32.0_0.5)))

Sqrt(Centroid(Blackman(SpectralKurtosis(MelFilterBank(x_10.0)))))

Tabl. 1 : Exemples de fonctions mathématiques

sélectionnées par EDS

Table 1 : Samples of acoustic features selected by EDS

Dans un premier temps (entraînement du classificateur), un

algorithme en arbre de décision a été entraîné sur les valeurs

des fonctions calculées sur 10% des exemplaires choisi

aléatoirement dans SBE. Dans un deuxième temps (perfor-

mance du classificateur), la performance du classificateur

a été évaluée sur les 90% restant de SBE. Cette procé-

dure peut être répétée plusieurs fois. Concrètement, nous

avons d’abord extrait pour chaque vocalisation de SBE, les

valeurs des fonctions mathématiques extraites grâce à EDS.

Puis, nous avons utilisé l’algorithme en arbre de décision.

Ce dernier sélectionne dans la première étape un échan-

tillon aléatoirement dans SBE, c’est-à-dire 10% des vocali-

sations (soit environ 247). Cet algorithme s’entraîne, c’est-

à-dire qu’il se construit à partir des valeurs des fonctions

mathématiques propres à chaque vocalisation. Une fois

établi, cet arbre est appliqué sur le reste de SBE (les 90%

restants). A l’issue, nous obtenons un tableau sous forme

d’une matrice représentant d’un côté le type de cri d’origine

(i.e. défini par l’expérimentateur) et de l’autre le type de cri

issu de l’algorithme de classification ce qui permet d’iden-

tifier les cris d’un type donné classé de façon identique ou

non entre l’analyse experte et l’analyse par l’algorithme.

Supposons deux cris, le cri 1 et le cri 2. L’expérimentateur

a classé le cri 1 dans le type C 1 et le cri 2 dans le type

C 2. La matrice obtenue après calcul par l’algorithme en

arbre de décision nous donne une matrice à deux lignes

et deux colonnes : l’index des colonnes sera «type de cri

d’origine», l’index des lignes sera «classé en». Ainsi, soit

l’algorithme a classé les cris de façon identique à l’ex-

pert, et dans ce cas, nous obtiendrons des valeurs dans

la diagonale uniquement (un cri classé dans le type C 1

et un autre classé dans le type C 2 par l’expert ont été

effectivement classés dans les types C 1 et C 2, respec-

tivement, par l’algorithme) ; soit l’algorithme a classé de

façon différente à l’expert et dans ce cas, nous pouvons

par exemple obtenir que le cri 1 classé dans le type C 1

par l’expert a été classé en C 2.

De cette matrice, nous pouvons par la suite extraire

différents indices de performances : soit le nombre de

cri «correctement classés» c’est-à-dire classés de façon

identique entre l’expert et l’algorithme, soit un indice de

performance prenant en compte les erreurs : la F-mesure,

calculée avec la formule suivante :

F = 2 x precision x recall ; sachant que :

precision + recall

Precision = Ntp ; et que :

Ntp + Nƒp

Recall = Ntp

Ntp + Nƒn

Type de cri défini par l’expert

C 1 C 57 C 77 C 106 C 113 Type de cri défini par l’algorithme

523 4

2

0

62

C 1

26 1043 27

0

81

C 57

3

6 382

1

0

C 77

4

5

0

182

0

C 106

18 2

1

0

99

C 113

Tabl. 2 : Matrice de résultats obtenue en utilisant 20 fonctions mathématiques et 50 répétitions pour constituer l’arbre de

décision. On peut noter que plus de cris sont « correctement classés » (diagonale de la matrice) qu’incorrectement.

Table 2: Result matrix obtained with 20 EDS acoustic features and 50 repetitions to establish the decision tree.

Note that more calls were “correctly classified” (diagonal of the matrix) than incorrectly.