Les traductions de Facebook sont maintenant complètement alimentées par AI

Chaque jour, Facebook effectue environ 4,5 milliards de traductions automatiques – et à partir d’hier, elles sont toutes traitées à l’aide de réseaux neuronaux. Auparavant, le site de réseautage social utilisait des modèles de traduction automatique plus simples basés sur des phrases, mais il est maintenant passé à la méthode la plus avancée. « Créer des expériences de traduction parfaites et très précises pour les 2 milliards de personnes qui utilisent Facebook est difficile », a expliqué la société dans une publication sur le blog. « Nous devons tenir compte du contexte, de l’argot, des fautes de frappe, des abréviations et de l’intention simultanément ».

La grande différence entre l’ancien système et le nouveau est la portée de l’attention. Alors que le système basé sur des phrases traduit des phrases par mot, ou en regardant des phrases courtes, les réseaux neuronaux considèrent des phrases entières à la fois. Ils le font en utilisant un type particulier de composant d’apprentissage machine connu sous le nom de LSTM ou un réseau de mémoire à long terme à long terme.

Les bénéfices sont assez clairs. Comparez ces deux exemples de Facebook d’une traduction turque-anglaise. Le top vient du vieux système basé sur les phrases, et le plus bas du nouveau système. Vous pouvez voir comment prendre en compte le contexte complet de la phrase produit un résultat plus précis.

« Avec le nouveau système, nous avons vu une augmentation relative moyenne de 11 pour cent dans BLEU – une mesure largement utilisée pour juger de la précision de la traduction automatique – dans toutes les langues par rapport aux systèmes basés sur des phrases », a déclaré la société.

Lorsqu’un mot dans une phrase n’a pas de traduction correspondante directe dans une langue cible, le système neuronal générera un espace réservé pour le mot inconnu. Une traduction de ce mot est recherchée dans une sorte de dictionnaire interne construit à partir des données de formation de Facebook et le mot inconnu est remplacé. Cela permet aux abréviations comme « tmrw » d’être traduites dans leur sens intentionnel – « demain ».

« Les réseaux de neurones ouvrent de nombreux chemins de développement futurs liés à l’ajout d’un contexte supplémentaire, comme une photo accompagnant le texte d’une publication, pour créer de meilleures traductions », a déclaré la société. « Nous commençons également à explorer des modèles multilingues qui peuvent traduire de nombreuses directions linguistiques différentes ».