Je viens de mettre en place une recherche multilingue (russe et anglais) à l’aide de lucene (excellent). J’ai donc eu l’occasion de me frotter de prêt à la problématique du multilinguisme et à une partie de la solution: l’Unicode.
Vous connaissez sans doute déjà ce lien: The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)
Comment vous ne l’avez pas encore lu? C’est marqué il n’y a pas d’excuse. Je vous recommande aussi cette présentation sur Unicode trouvé sur la page de Thomas Lebarbé. Vous trouverez aussi sur cette page des supports de cours: Internet et société qui ferons certainement l’objet d’un billet sur mon autre blog qui traite justement ces sujets.