Namibie
La science c’est bien, mais les vacances aussi. Les deux n’étant pas incompatibles, voici quelques découvertes de la famille Goulu lors de notre récent voyage dans un pays encore plus surprenant que nous ne l’imaginions.
Météorite
Ayant renoncé à visiter Manicouagan l’an passé, nous avons fait un petit détour pour voir la météorite d’Hoba cette fois-ci. Un bloc de métal de 60 tonnes n’a rien de très excitant de nos jours, mais si l’on pense qu’il est tombé du ciel il y a moins de 80’000 ans, qu’il ne s’est planté que de quelques mètres dans le sol sans y faire le moindre cratère et que c’est à la fois la plus grande météorite connue et le plus gros bloc de fer métallique présent à la surface de la terre avant l’invention du haut fourneau, ça devient un objet exceptionnel.

Enfin une photo ou on voir le Dr. Goulu, mais c'est juste pour donner l'échelle. La météorite de Hoba est 600x plus massive. Photo de Julia.
Plus exactement, cette météorite est une ataxite composée de 84% de fer et 16% de nickel et produite dans une ancienne étoile. Elle est très compacte, et sa forme de soucoupe volante du paléolithique lui a probablement permis de ricocher sur l’atmosphère en perdant de la vitesse avant d’y entrer sans fondre et de se poser délicatement sur un terrain meuble qui a absorbé le choc.
Botanique
Welwitschia mirabilis est une plante poussant uniquement en Angola et en certains endroits du désert du Namib, notamment dans deux plaines que la Namibie se prépare à soumettre au patrimoine de l’Unesco. Laura a bien fait de nous encourager à parcourir 50 km de piste depuis Swakopmund pour les visiter : sur quelques hectares, seules des Welwitchia poussent, espacées de quelques dizaines de mètres, soit une densité énorme pour ces plantes rares, panchroniques et fort étranges. D’abord, même si elles « ressemblent à un tas d’ordures » en trainant lamentablement leur deux uniques et grandes feuilles au sol et ne dépassent pas quelques centimètres de haut, ce sont des arbres comme en témoigne le bout de bois qui leur sert de tronc. Ce sont des gnetophytes, voisins des conifères comme l’indiquent leurs organes reproducteurs qui ressemblent furieusement à de petites pommes de pin.

Un beau plant de Welwitschia, avec une fille qui n'est pas la mienne.
Welwitchia n’a absolument pas besoin de précipitations, ses racines peuvent aller chercher eau et nourriture jusqu’à 30m de profondeur dans le sable. D’après la croissance très lente de la plante, on estime qu’elles vivent 1000, voire 2000 ans, donc nous nous sommes promenés dans une forêt millénaire au beau milieu d’un des endroits les plus arides du monde… Apparemment il est possible d’en cultiver à condition de ne jamais penser à les arroser. La plante idéale pour moi…
Hoodia*
Il y a quelques années, on entendait beaucoup parler de Hoodia gordonii, un cactus poussant dans les déserts d’Afrique australe, et dont nous avons vu un seul exemplaire en Namibie. En mangeant un peu de sa chair, les bochimans San coupaient toute sensation de faim pendant plusieurs heures, voire un jour. L’industrie médicale occidentale, alléchée par le juteux marché de la lute contre l’obésité, s’est empressée d’étudier la plante, d’identifier la molécule coupe-faim P57, de tenter de la synthétiser puis de se rabattre sur la culture du Hoodia, espère care et protégée, après avoir été obligée de payer un redevance aux San.
Ce que nous avons appris en Namibie, c’est que les plantes cultivées ne couperaient pas la faim, ce qui correspond à l’info de la Wikipedia en français, selon laquelle seule la plante fraiche aurait un effet alors que les préparations de plante en poudre n’en auraient pas. La wikipedia anglophone est plus sceptique encore, arguant qu’aucune preuve scientifique de l’efficacité de Hoodia n’a été publiée jusqu’ici.
Voilà pourquoi après un buzz planétaire, on ne trouve des préparations de Hoodia que sur des sites spécialisés en médicaments miraculeux, dont le prix est inversement proportionnel à l’efficacité.
Sossusvlei
Une image valant mille mots, voici Sossusvlei vu de l’espace:
Ca a l’air d’une petite vallée creusée par une rivière partant du centre et s’écoulant vers la droite, mais c’est l’inverse. Sossusvlei, c’est l’endroit improbable ou la rivière Tsauchab renonce à rejoindre la mer après 40 km de vallée creusée dans les dunes du Namib, et s’évapore dans de multiples petits lacs. Du moins quand l’eau arrive jusque là, ce qui est arrivé la dernière fois en 2006. Sinon, les sels minéraux qui se déposent au fond des lacs forment des plaques d’un blanc éblouissant. Mais la vallée subsiste et les vents forment sur ses flancs des dunes parmi les plus hautes du monde (375 m), magnifiques de surcroit.
Note* : paragraphe ajouté le 29.8, quand j’y ai repensé.
Molécules d’été et divers
Il fait chaud et vous appréciez le goût rafraichissant de la menthe ? Dites merci au menthol, la molécule contenue dans ces plantes, et désormais également synthétisée par l’industrie chimico-alimentaire. Le menthol a la propriété d’agir chimiquement sur les récepteurs de notre bouche normalement sensibles à la température des aliments, en particulier via un canal ionique TRP [1], le TRPM8 qui nous signale qu’un aliment est agréablement frais.
Il y a quelque temps on nous annonçait l’arrivée d’un « super menthol » 200 fois plus rafraichissant : l’iciline. En attendant l’apparition de crèmes glacées chaudes un de ces jours, l’iciline est utilisée dans la recherche sur les canaux TRP [2].
A l’inverse, la capsaïcine contenue dans les piments excite TRPV1, un canal sensible au chaud, voire nociceptif : il provoque la douleur et des réactions physiologiques associées à la brûlure comme la transpiration. Evidemment, tout dépend de la concentration de capsaïcine dans les piments consommés, mesurée par l’échelle de Scoville qui s’applique aussi au poivre et au gingembre. Par contre, la cannelle, l’ail et le raifort de la moutarde japonaise agissent sur TRPA1, le canal du « trop froid ». Etonnant non ? Pourtant on apprécie ces condiments l’été et les picotements qu’ils provoquent ne nous font pas transpirer.
En passant, la capsaïcine est une molécule vraiment étonnante: elle provoque de l’euphorie en stimulant la production d’endorphines, en réaction à la sensation de brûlure j’imagine. Elle est utilisée dans les armes non létales comme les sprays d’autodéfense « au poivre », mais est pourtant assez toxique pour vous tuer si vous avez la mauvaise idée de vous en injecter quelques dizaines de milligrammes. A part ça, certains utilisent la capsaïcine pour le dopage des chevaux !
Vous pouvez admirer la capsaïcine en 3D ici et en profiter pour découvrir JMOL et Qutemol, ce qui ouvre le chapitre « divers ».
Aimez-vous les asperges ? Si oui, vous avez peut-être remarqué que vous en « profitiez » une deuxième fois en urinant après en avoir consommé. L’odeur caractéristique est du méthyl-mercaptan produit par la digestion de l’asparagine, un acide aminé soufré abondant dans les asperges. Ce qui est surprenant, c’est le « peut-être« , car il est très possible que vous n’ayez jamais remarqué cette odeur particulière, alors que d’autres personnes y sont extrêmement sensibles [3] car c’est un gène qui confère cette faculté particulière de l’odorat.
Enfin, si vous avez une processeur à plus de 2 coeurs, vous n’avez plus aucune excuse pour ne pas participer à BOINC, et au projet Rosetta@home en particulier, qui étudie la structure en 3D de protéines. Avec un peu de chance, vous aussi vous deviendrez célèbre pendant 24 heures :
Bon, et maintenant : vacances !
Références
- Daniel Abegg, « les thermo TRP – des canaux ioniques sensibles à la température« , 2009, Université de Genève
- David D McKemy, « How cold is it? TRPM8 and TRPA1 in the molecular logic of cold sensation« , Molecular Pain 2005, 1:16
- M Lison, S H Blondheim, and R N Melmed « A polymorphism of the ability to smell urinary metabolites of asparagus.« ,Br Med J. 1980 December 20; 281(6256): 1676–1678
Al-Khawarizmismes
Dans les années 800, le mathématicien perse Abou Jafar Muhammad Ibn Mūsa al-Khuwārizmī introduit le zéro (indien) dans les chiffres arabes, décrit comment résoudre les équations du second degré, et propose de résoudre certains problèmes mathématiques en répétant une séquence d’opérations jusqu’à ce qu’un « critère d’arrêt » soit satisfait. Au XIIème siècle, les moines latins nomment « algorismus » cette méthode d’Al Khuwarizmi, qui devient « algorithme » en français en 1554.
Pour cette idée fondamentale des mathématiques et indispensable en informatique, Al Khuwarizmi a reçu à titre posthume un cratère lunaire à son nom, et environ 165’000 fautes d’orthographe commises par des ignares qui mettent un y grec à la place d’un ī persan…
Après que des fous aient passé leur vie à calculer à la main des tables de logarithmes ou des décimales de pi, c’est évidemment l’arrivée des ordinateurs qui a donné à l’algorithmique son importance actuelle. Aujourd’hui, vous utilisez des algorithmes tous les jours, sans le savoir. Par exemple lorsque vous cliquez sur le titre d’une colonne sur votre ordinateur, et que les lignes sont triées en un clin d’oeil. Ou lorsque vous demandez votre route à un GPS. A chaque fois que vous téléphonez ou utilisez votre carte de crédit, vous utilisez des algorithmes de cryptographie qui étaient de la science-fiction il y a 50 ans.
Bon, ça c’était l’introduction. En fait cet article est motivé par la coïncidence de trois événements survenus la semaine passée :
- Mes collègues ont (enfin) réussi à faire fonctionner un algo que j’avais pondu pour optimiser les mouvements d’une machine. Un algo assez simple (optimisation gloutonne, évidemment…), bien testé, mais pas suffisamment documenté, donc pas bien utilisé, donc inspirant une certaine méfiance… Mais là ça marche! Vidéo bientôt.
- La découverte de l’existence du Prix J.H. Wilkinson attribué tous les 4 ans aux auteurs d’un logiciel de calcul numérique particulièrement efficace, dont certains que je connaissais depuis peu (FFTW et Triangle) et d’autres à découvrir (deal.II)
- Enfin, sur les liens du jeudi de Neamar, un lien vers la page d’un chercheur listant les algorithmes considérés comme les plus importants par ses collègues et lui. Il y en a 32, assez pour évaluer vos connaissances en la matière ou les rafraichir, et apprendre éventuellement des choses:
- l’algorithme A* trouve le chemin « le plus court ou presque » entre deux noeuds d’ un graphe. Il est utilisé dans les GPS et dans les jeux vidéo pour les déplacements des personnages par « intelligence artificielle »
- Beam Search peut dans certains cas trouver un chemin meilleur qu’A*, mais nécessite plus de calculs.
- La dichotomie est la technique que les enfants utilisent pour chercher un mot dans le dictionnaire : on l’ouvre à la moitié, puis à la moitié de la moitié où se trouve le mot et ainsi de suite jusqu’à trouver la bonne page.
- « Branch and bound » : Séparation et évaluation est une méthode générique d’optmisation combinatoire permettant d’éviter d’évaluer toutes les possibilités.
- L’ algorithme_de_Buchberger est un truc de matheux datant de 1976, qui généralise à la fois le plus ancien algorithme connu, celui du PGCD d’Euclide et celui de l’élimination gaussienne (connue des Chinois dàjà 1700 ans plus tôt…)
- La compression des données omniprésentes dans nos fichiers informatiques. Il existe de nombreux algorithmes spécifiques, parmi lesquels la transformée_de_Burrows-Wheeler me parait particulièrement géniale.
- L’échange des clés Diffie-Hellman permet à deux personnes qui ne se connaissent pas d’échanger des informations confidentielles sur un canal non sécurisé. Indispensable en télécommunications.
- L’algorithme de Dijkstra détermine le chemin le plus court entre deux neouds d’un graphe, sous certaines contraintes expliquées dans l’article sur le GPS encore.
- Les différences finies permettent d’approximer des dérivées, comme dans la formule f’(x) = (f(x+h) – f(x-h)) / 2h. (Je les utilise tous les jours, mais est-ce vraiment des algorithmes ?)
- La Programmation Dynamique est une méthode d’optimisation sous contrainte. Elle permet d’obtenir une solution optimale à partir des solutions optimales de sous-problèmes. Curieusement, en 1976, on amontré que les algorithmes de programmation dynamique sont équivalents à ceux de recherche d’un chemin optimal dans un graphe…
- L’algorithme d’Euclide pour déterminer le plus grand diviseur commun (PGCD) de deux entiers est le plus ancien algorithme connu. Il est paru dans les « Eléments » d’Euclide autour de 300 av J.C et ne nécessite pas de factorisation des nombres.
- L’algorithme « espérance maximisation » est très utilisé en traitement d’images.
- La transformée de Fourier rapide (FFT) est extrêmement utilisée en traitement du signal, et plein d’autres domaines, jusque dans l’étude des succès Hollywoodiens.
- La descente de gradient est l’algorithme le plus connu pour obtenir le minimum d’une fonction à plusieurs variables.
- Les fonctions de hachage permettent de manipuler plus facilement de grosses données en les réduisant à des empreintes. Shazam utilise cette idée de manière spectaculairement efficace. Mais ici aussi, j’hésiterais à parler d’algorithme pour une « simple » fonction…
- Le Tas est une structure de données exploitée dans beaucoup d’algorithmes informatiques très efficaces comme le tri par tas. ( Il faut absolument que je trouve le temps d’étudier le « soft heap« , une structure de données « miraculeuse » découverte en 2000 )
- L‘algorithme de Karatsuba permet de multiplier 2 (grands) nombres plus vite qu’avec la méthode que vous avez apprise à l’école.
- L’algorithme LLL détermine des vecteurs de base « presque » orthogonaux à partir d’un grand nombre de vecteurs. Il est utilisé en cryptographie.
- l’algorithme_de_Ford-Fulkerson permet de résoudre le problème de flot maximum
- Le Tri fusion permet de réarranger rapidement une liste dans un ordre spécifique
- La Méthode_de_Newton permet de trouver une approximation des zéros d’une fonction, des solutions d’une équation à plusieurs variables, ou les minima/maxima.
- Q-learning est une technique d’ »apprentissage renforcé »
- le Crible quadratique est la meilleure méthode de factorisation d’un nombre, à part le crible sur le corps des nombres généralisés qui est à peine meilleur mais beaucoup plus compliqué. Si vous voulez casser une clé RSA, c’est ce qu’il vous faut, en plus de beaucoup de gros ordinateurs…
- RANSAC, pour »RANdom SAmple Consensus » est un algorithme d’ajustement de paramètres à des données qui ignore les données « visiblement complètement fausses »
- RSA, pour Rivest_Shamir_Adleman, est le génial algorithme de cryptographie a clé révélée utilisé dans la plupart des systèmes de sécurité actuels : carte bancaire, commerce électronique etc.
- l’algorithme_de_Schönhage-Strassen effectue des multiplications de grands entiers en utilisant la FFT. Sacrés mathématiciens…
- l’ algorithme_du_simplexe permet de résoudre les problèmes dits de programmation linéaire, dans lesquels on cherche à optimiser la valeurs d’une fonction de plusieurs variables devant satisfaire des contraintes d’inégalités.
- La décomposition_en_valeurs_singulières permet de factoriser des matrices rectangulaires, donc de résoudre des systèmes linéaires surdéterminés (avec plus d’équations que d’inconnues). Elle est utilisée dans de nombreux domaines, de la robotique aux prévisions météo.
- Résoudre des systèmes d’équations linéaires par élimination de Gauss-Jordan ou décomposition de_Cholesky est l’une des opérations les plus communes en analyse numérique, utilisée dans pratiquement tous les domaines de l’ingénierie.
- les « tenseurs de structure » (Structure_tensor en anglais) sont très utilisées en traitement d’image : ils permettent de quantifier l’appartenance d’un pixel à une région homogène. Méritent-ils de figurer dans les algorithmes ? la question est ouverte.
- Union-Find est une structure de données permettant de partitionner des données dans des ensembles disjoints, et de trouver rapidement à quel ensemble appartient une donnée ainsi que de réunir rapidement des ensembles.
- L’algorithme de Viterbi, une retombée de la conquête spatiale permettant de corriger les erreurs de transmission en télécommunication. Il est bien caché dans vos téléphones portables, mais il est là.
Connaissez-vous d’autres algorithmes dignes de figurer dans la liste ? les commentaires sont là pour les proposer.
Combien d’Helium ?
L’hélium est le 2ème élément le plus abondant dans l’Univers. 7% de tous les atomes sont de l’He4 essentiellement produit pendant la nuclésythèse primordiale. Ils représentent 25% de la masse totale de la matière puisqu’ils sont plus 4x plus lourds que l’Hydrogène, qui constitue 92% des atomes. La même proportion se retrouve dans le Soleil, qui n’a produit qu’environ 1% d’Helium de plus en 4.6 milliards d’années de fusion. C’est d’ailleurs dans le spectre du Soleil que l’hélium a été détecté en 1868 seulement , d’où son nom.
Car sur Terre le gaz qui gonfle les ballons de baudruche de vos enfants et les fait rigoler lorsque vous en inhalez pour parler comme Donald est beaucoup plus rare. Il ne compose que 5.2 ppm de l’atmosphère, et surtout à très haute altitude puisqu’il est plus léger que l’air. Dans la croute terrestre, ce n’est que le 72ème élément par ordre d’abondance : elle n’en contient que 0.008 ppm, trois fois moins que d’or par exemple.
Je pensais naïvement qu’on obtenait l’hélium par liquéfaction de l’air, et ça a effectivement été fait en 1898, mais Harry m’a raconté la vraie et intéressante histoire de la production industrielle de l’hélium.
Denver, USA, 1903. Des prospecteurs étatsuniens cherchent du gaz naturel et en trouvent, mais avec un léger défaut : il ne brule pas. Après analyse, on découvre que ce gisement contient beaucoup d’azote qui empêchait les 15% de méthane de s’enflammer, et 1.84% d’hélium que l’on peut extraire par liquéfaction du gaz. En quelques années, les USA produisent ainsi 5’700 m³ d’hélium, alors qu’il n’y en avait que 100 l en stock dans les labos du reste de la planète. A l’époque des dirigeables, l’hélium est un produit stratégique et les USA créent en 1925 la National_Helium_Reserve chargée de le stocker pour les besoins civils et militaires du pays.
Dès 1930 l’entreprise Zeppelin conçoit ses fameux dirigeables pour être gonflés à l’hélium, mais n’en obtient pas des USA et doit se résoudre à utiliser de l’hydrogène. Sans le nazisme, le Hindenburg aurait été ininflammable et les dirigeables n’auraient peut-être jamais disparu du ciel au profit des avions…
Encore qu’il ne soit pas sur que nous eussions* suffisamment d’hélium pour autant de dirigeables, et encore moins pour les nombreuses expériences de physique nécessitant de l’hélium liquide à l’avenir. Les gisements de gaz riches en hélium s’épuisent les uns après les autres, en commençant par ceux des USA. On extrait aujourd’hui l’hélium de gisements de gaz en contenant moins de 1%, ce qui le renchérit nettement. Mais surtout, on en extrait beaucoup plus que la Terre n’en produit.
Car l’hélium terrestre est produit en continu par la désintégration naturelle de l’uranium sous nos pieds ( il y en a 0.91 ppm dans la croute terrestre, 300x plus que d’or …). Le réacteur nucléaire sur lequel nous vivons produit ainsi environ 3000 tonnes d’hélium, soit 17 millions de m³ de gaz environ par an, dont une très large part ne se retrouve pas piégée dans le gaz naturel mais s’échappe discrètement de toute la surface du globe vers la haute atmosphère, où elle se perd dans l’espace. Or l’industrie gazière fournit plus de 200 millions de m³ d’hélium chaque année.
L’hélium est donc une ressource renouvelable, mais nettement surexploitée. L’économie de l’hélium est tout comme celle de l’hydrogène un sous-produit de l’industrie gazière. Quand il n’y aura plus de gaz naturel (dans 60 ans à un siècle), les deux gaz les plus abondants de l’univers deviendront beaucoup plus rares et chers sur Terre.
Note *: et de deux imparfaits du subjonctif
Sources:
- Hélium sur Periodic Table Online
- Epuisement du stock d Hélium sur imaginascience
- Qatar : double succès sur le marché de l’hélium, communiqué Air Liquide du 6 mai 2010
La reconnaissance vocale est morte : pet à son âme.
D’après « 2001 l’Odyssée de l’Espace », nos ordinateurs devraient comprendre notre voix depuis 9 ans. Depuis 1997, on trouve des logiciels de reconnaissance vocale pour PC, et depuis peu nos téléphones disposent de cette fonction. Mais on ne l’utilise pas. Je ne connais personne qui dicte ses e-mails, et vous ?
Comme tous les geeks j’ai essayé de temps en temps, parfois passé une heure à lire des textes d’apprentissage de la voix la plus monocorde possible à la nouvelle version d’un soft, et puis abandonné devant ses piètres performances. Ca ne marche pas, ou pas assez bien.
Robert Portner analyse cet échec dans »Rest in Peas: The Unrecognized Death of Speech Recognition« , titre subtilement traduit en français dans le présent article.
Le problème, c’est qu’après une phase de progrès rapides à la fin du siècle passé, le taux d’erreur de mots plafonne à 10% depuis 2001 , soit environ le triple du taux d’erreur d’un être humain. Et encore, c’est pour l’anglais « standard ». Le taux d’erreur est bien plus élevé pour d’autres langues, et catastrophique pour une conversation entre supporters de foot à la sortie du match.
Pourtant dans les années 1990, des systèmes très fiables avaient été mis au point pour distinguer quelques mots bien choisis dans des cockpits d’avion ou des chiffres au téléphone, et on s’était légitimement attendus à ce que la Loi de Moore permette de traiter rapidement le langage naturel. Et effectivement, aujourd’hui on sait bien reconnaitre des mots isolés. On sait à peu près éliminer les absurdités non conformes à la grammaire dans des phrases simples comme « le chat ment je la sous rit. » Mais pour distinguer entre « le chas mange la souris », »le chat mange là, sous l’riz » et »le chaman gela, sourit » et , il faut comprendre le sens de la phrase, voire le contexte dans lequel elle est prononcée…
Si l’ordinateur doit connaitre la différence entre un quadrupède carnivore et le trou d’une aiguille pour traiter une phrase triviale, on imagine que ce n’est pas demain qu’on dictera des contrats* ou des rapports à une machine. De gros projets ont été lancés par des poids lourds de l’informatique pour tenter de modéliser la connaissance humaine. Par exemple le projet MindNet de Microsoft [2] a analysé des millions de pages de textes existants pour construire un graphe sémantique gigantesque, duquel il ressort effectivement que dans une phrase comportant « chat » et « souris », le plus probable est que le chat chasse la souris. Un tel graphe peut certainement être utile en traduction automatique car on dispose d’un texte de départ, mais pour la reconnaissance vocale il faudrait étendre le graphe à la structure des phrases utilisées en conversation courante, qui peut être bien distincte du langage écrit. Et pour faire ça automatiquement, il faudrait la reconnaissance vocale…
Comme le note Portner, on pensait au début que la reconnaissance vocale était un premiers pas vers l’intelligence artificielle. Aujourd’hui de nombreux chercheurs estiment que l’intelligence artificielle est indispensable pour atteindre une reconnaissance vocale de qualité acceptable [2]. Les gros projets de recherche ont été abandonnés les uns après les autres, bloqués devant le mur si bien décrit par les Perlisismes sur l’intelligence artificielle comme:
« Une année de travail sur l’intelligence artificielle est suffisante pour vous faire croire en Dieu »
Le nombre de recherches sur « reconnaissance vocale » ou « Dragon Naturally Speaking » sur Google baisse régulièrement depuis 2001. Comme aucune idée fondamentalement nouvelle ne vient relancer la recherche, la reconnaissance vocale est morte, en toute discrétion.
Note* : me rappelle l’histoire de la secrétaire d’un célèbre ingénieur de la génération disctaphone qui avait commandé « 310 mètres d’isolation entre 2 étages » au lieu de « 3 centimètres » . Ca c’est avec les 2% d’erreurs de transcription humaines…
Références:
- The History of Automatic Speech Recognition Evaluations at NIST
- Microsoft Research : MindNet
-
Janet M. Baker et al. « Research Developments and Directions inSpeech Recognition and Understanding« , IEEE Signal Processing Magazine [75] MAY 2009













