Joueb.com
Envie de créer un weblog ?
ViaBloga
Le nec plus ultra pour créer un site web.
Débarrassez vous de cette publicité : participez ! :O)

Google traduit tout....lui-même

Depuis la fin du mois d'octobre, Google utilise son propre système de traduction automatique pour 25 paires de langues.
Jusqu'ici, Google avait développé ses propres process de traduction uniquement pour certaines langues non latines : arabe, chinois, coréen, japonais, russe. Pour le reste, il faisait appel à la société française leader de la traduction automatique,  Systran (équipe notamment  Altavista/Yahoo! Babel Fish)  

En juin 2006, j'écrivais dans un billet Quand Google sera traducteur automatique. La force de frappe de la R&D de Google a permis un développement rapide de technologies de traduction.
Google n'utilise pas une technologie morpho-syntaxique comme celles des concurrents  mais une approche linguistique de corpus et des techniques d'apprentissage statistiques. Google construit ainsi des modèles de traduction. Cela permet notamment de dire :  à chaque fois que le mot A est utilisé avec le mot B, cela signifie l'expression X plutôt que l'expression Y.
 La force de Google est de pouvoir (accès + puissance machines) manipuler des millions de données. C'est un avantage indéniable pour les modèles statistiques qui lui permet aussi de proposer des termes lors d'erreurs de frappe ou d'orthographe dans vos requêtes.
Par aileurs, Google propose son service de "Recherche traduite" (traduction de vos requêtes et des résulats. Yahoo! a abandonné récemment (?) ce type de service, Yahoo! Recherche Multilingue), et son dictionnnaire.

Comparons la traduction d'un texte anglais vers le français par Systran et Google. Un léger avantage à Google (mais ce test n'est qu'un échantillon non représentatif)

1. Texte original (du blog GOS) Google Switches to Its Own Translation System 
Google switched the translation system from Systran to its own
machine translation system for all the 25 language pairs available on the site. Until now, Google used its own system only for Arabic, Chinese, and Russian.

"Most state-of-the-art commercial machine translation systems in use today have been developed using a rules-based approach and require a lot of work by linguists to define vocabularies and grammars. Several research systems, including ours, take a different approach: we feed the computer with billions of words of text, both monolingual text in the target language, and aligned text consisting of examples of human translations between the languages. We then apply statistical learning techniques to build a translation model,"
explains Franz Och.
You can compare the new
Google Translate with Babel Fish, a site that uses Systran to provide translations. The switch is a sign that Google's system has improved a lot and could soon be ready for expanding its coverage.

2. Version Systran
Google a commuté le système de traduction de Systran à son propre système de traduction automatique pour tous les 25 couples de langues disponibles sur l'emplacement. Jusqu'ici, Google a employé son propre système seulement pour l'arabe, chinois, et le Russe. "la plupart des systèmes de traduction automatique commerciaux du dernier cri en service aujourd'hui ont été développés en utilisant une approche règle-basée et exigent beaucoup de travail par des linguistes de définir des vocabulaires et des grammaires. Plusieurs recherchent des systèmes, y compris le nôtre, adoptent une approche différente : nous alimentons l'ordinateur avec des milliards de mots de texte, les deux texte monolingue dans la langue cible, et exemples se composants alignés des textes des traductions humaines entre les langues. Nous appliquons alors des techniques d'étude statistiques pour établir un modèle de traduction, "explique Franz Och.
Vous pouvez comparer le nouveau Google traduisez avec des poissons de Babel, un emplacement qui emploie Systran pour fournir des traductions. Le commutateur est un signe que le système de Google s'est amélioré beaucoup et pourrait bientôt être prêt pour augmenter son assurance.

3. Version Google
Google fait passer le système de traduction Systran à partir de son propre système de traduction automatique pour l'ensemble des 25 paires de langues disponibles sur le site. Jusqu'à présent, Google a utilisé son propre système uniquement pour l'arabe, en chinois et en russe.
"La plupart état de la technique commerciale des systèmes de traduction automatique en usage aujourd'hui ont été développés en utilisant une approche fondée sur les règles et nécessitent beaucoup de travail par des linguistes de définir des vocabulaires et des grammaires. Plusieurs systèmes de recherche, y compris la nôtre, adopter une approche différente : Nous nourrir l'ordinateur avec des milliards de mots de texte, les deux textes monolingues dans la langue cible, et l'alignement de texte comprenant des exemples de traductions entre les langues. Nous appliquons des techniques d'apprentissage statistique pour construire un modèle de la traduction ", explique Franz Och.
Vous pouvez comparer la nouvelle version de Google Traduire avec Babel Fish, un site qui utilise Systran d'assurer la traduction. Le commutateur est un signe que le système de Google s'est beaucoup améliorée et pourrait bientôt être prêt à élargir sa couverture.

Jean-Marie a réalisé des tests poussés entre Babelfish (Systran) et Google Translate


> Voir aussi :
Le Google Groups dédié à Google Translate

Les outils de traduction automatique sur le net
Google Multilingue : bien pour le chinois et l'arabe notamment
Google News russe et traduction anglais russe
Toujours plus de langues sur Google
Quand Google sera traducteur automatique
Yahoo! intégre le traducteur Babelfish
Yahoo! recherche multilingue au Japon et à Taïwan
Recherche multilingue sur Yahoo! France

Google Translate
Christophe ASSELIN Intelligence-center.com / Digimind 

Ecrit par slide68, le Mercredi 7 Novembre 2007, 09:53 dans la rubrique "Traduction".

Commentaires :

klint
07-11-07 à 23:47

bombing

... il y a même un petit bouton à droite "Proposer une meilleure traduction" qui a semble t'il permi un bombing (un peu comme bush => miserable failure ) , on en parle ici:
http://www.koreus.com/modules/news/article6054.html

... bon évidement ça marche plus, domage

 
christophe
21-04-08 à 00:48

Lien croisé

Google traduit tout....lui-même, veille sur inFLUX [Secrets 2 Moteurs] : "ntaxique comme celles des concurrents mais une approche linguistique de corpus et des techniques d'apprentissage statistiques. Google construit ainsi des modèles de traduction. Cela permet notamment de dire : à chaque fois que le mot A est utilisé avec le mot B, cela signifie l'expression...Source et suite de l'article : http://influx.joueb.com/news/google-traduit-tout-lui-memeAutres articles:Yahoo! traduit à la voléeAffaire étrange sur le blog de GoogleTout le monde veut A"