Le compromis qualité-quantité : 500 bonnes paires battent 50 000 mauvaises
Il y a une pression pour construire de grands datasets. 100k paires. 500k paires. « Plus de données c’est toujours mieux », la pensée va. C’est faux. La recherche de Laeka montre un motif…