<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>Commentaires sur : Google trie 1 PetaByte de données !</title>
	<atom:link href="http://drgoulu.com/2008/11/22/tri/feed/" rel="self" type="application/rss+xml" />
	<link>http://drgoulu.com/2008/11/22/tri/</link>
	<description>le blog du Dr. Goulu</description>
	<lastBuildDate>Mon, 21 May 2012 16:44:54 +0000</lastBuildDate>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=</generator>
	<item>
		<title>Par : Dr. Goulu</title>
		<link>http://drgoulu.com/2008/11/22/tri/#comment-994</link>
		<dc:creator>Dr. Goulu</dc:creator>
		<pubDate>Thu, 08 Apr 2010 20:07:18 +0000</pubDate>
		<guid isPermaLink="false">http://drgoulu.com/?p=852#comment-994</guid>
		<description>Le record d&#039;efficacité énergétique du tri (Joule sur http://sortbenchmark.org/ ) vient d&#039;être battu par un processeur Intel Atom utilisant 4 &quot;disques&quot; SSD plutôt que des disques durs.

source :http://www.techno-science.net/?onglet=news&amp;news=7666</description>
		<content:encoded><![CDATA[<p>Le record d&#8217;efficacité énergétique du tri (Joule sur <a href="http://sortbenchmark.org/" rel="nofollow">http://sortbenchmark.org/</a> ) vient d&#8217;être battu par un processeur Intel Atom utilisant 4 &laquo;&nbsp;disques&nbsp;&raquo; SSD plutôt que des disques durs.</p>
<p>source :<a href="http://www.techno-science.net/?onglet=news&#038;news=7666" rel="nofollow">http://www.techno-science.net/?onglet=news&#038;news=7666</a></p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : Tri réversible ? &#171; Dr. Goulu</title>
		<link>http://drgoulu.com/2008/11/22/tri/#comment-993</link>
		<dc:creator>Tri réversible ? &#171; Dr. Goulu</dc:creator>
		<pubDate>Sat, 30 Jan 2010 20:29:27 +0000</pubDate>
		<guid isPermaLink="false">http://drgoulu.com/?p=852#comment-993</guid>
		<description>[...] besoin de 4096*log(4096) bits, soit 6K, plus que les données! En passant, ça signifie qu&#8217;en triant beaucoup de petites données, on peut perdre plus de la moitié de l&#8217;information contenu dans la liste [...]</description>
		<content:encoded><![CDATA[<p>[...] besoin de 4096*log(4096) bits, soit 6K, plus que les données! En passant, ça signifie qu&#8217;en triant beaucoup de petites données, on peut perdre plus de la moitié de l&#8217;information contenu dans la liste [...]</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : Dr. Goulu</title>
		<link>http://drgoulu.com/2008/11/22/tri/#comment-992</link>
		<dc:creator>Dr. Goulu</dc:creator>
		<pubDate>Wed, 25 Feb 2009 18:04:39 +0000</pubDate>
		<guid isPermaLink="false">http://drgoulu.com/?p=852#comment-992</guid>
		<description>La conclusion de l&#039;article [2] te répond ceci :

&lt;em&gt;The MapReduce programming model has been successfully used at Google for many different purposes. We attribute this success to several reasons.

First, the model is easy to use, even for programmers without experience with parallel and distributed systems, since it hides the details of parallelization, fault-tolerance, locality optimization, and load balancing.

Second, a large variety of problems are easily expressible as MapReduce computations. For example, MapReduce is used for the generation of data for Google&#039;s production web search service, for sorting, for data mining, for machine learning, and many other systems.

Third, we have developed an implementation of MapReduce that scales to large clusters of machines comprising thousands of machines. The implementation makes efficient use of these machine resources and therefore is suitable for use on many of the large computational problems encountered at Google.&lt;/em&gt;

En bref, MapReduce permet de faire une parallélisation réellement bête et méchante car le programmeur n&#039;a rien besoin de connaitre à la programmation parallèle ni à l&#039;architecture de la machine cible !</description>
		<content:encoded><![CDATA[<p>La conclusion de l&#8217;article [2] te répond ceci :</p>
<p><em>The MapReduce programming model has been successfully used at Google for many different purposes. We attribute this success to several reasons.</p>
<p>First, the model is easy to use, even for programmers without experience with parallel and distributed systems, since it hides the details of parallelization, fault-tolerance, locality optimization, and load balancing.</p>
<p>Second, a large variety of problems are easily expressible as MapReduce computations. For example, MapReduce is used for the generation of data for Google&#8217;s production web search service, for sorting, for data mining, for machine learning, and many other systems.</p>
<p>Third, we have developed an implementation of MapReduce that scales to large clusters of machines comprising thousands of machines. The implementation makes efficient use of these machine resources and therefore is suitable for use on many of the large computational problems encountered at Google.</em></p>
<p>En bref, MapReduce permet de faire une parallélisation réellement bête et méchante car le programmeur n&#8217;a rien besoin de connaitre à la programmation parallèle ni à l&#8217;architecture de la machine cible !</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : Tom Roud</title>
		<link>http://drgoulu.com/2008/11/22/tri/#comment-991</link>
		<dc:creator>Tom Roud</dc:creator>
		<pubDate>Wed, 25 Feb 2009 04:24:16 +0000</pubDate>
		<guid isPermaLink="false">http://drgoulu.com/?p=852#comment-991</guid>
		<description>J&#039;ai du mal à comprendre la différence entre un MapReduce et une parallélisation bête et méchante en fait ...</description>
		<content:encoded><![CDATA[<p>J&#8217;ai du mal à comprendre la différence entre un MapReduce et une parallélisation bête et méchante en fait &#8230;</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : Dr. Goulu</title>
		<link>http://drgoulu.com/2008/11/22/tri/#comment-990</link>
		<dc:creator>Dr. Goulu</dc:creator>
		<pubDate>Sat, 22 Nov 2008 19:01:16 +0000</pubDate>
		<guid isPermaLink="false">http://drgoulu.com/?p=852#comment-990</guid>
		<description>@Hervé : oui, effectivement il existe des méthodes de tri O(n), mais elles ne sont pas générales, elles supposent que les données satisfont certaines hypothèses. Le tri par dénombrement (ou comptage) par exemple est assez spectaculaire mais suppose qu&#039;on puisse faire correspondre un petit nombre entier à chaque enregistrement, donc suppose aussi qu&#039;il existe beaucoup de données redondantes.

A noter que c&#039;est aussi le cas pour le jeu de cartes : si je réserve 4 colonnes de 18 places pour les cartes sur la table, je peux placer chaque carte directement à sa place rien qu&#039;en la regardant car je &quot;sais&quot; quelles sont les autres cartes, et qu&#039;il n&#039;y a qu&#039;une carte de chaque couple (couleur, valeur).

Le &quot;Terabyte Sort Benchmark&quot; fournit un générateur de données aléatoires qui empêche d&#039;utiliser ce genre de méthodes...

Mais il est vrai que ma phrase &quot;il n’existe pas de tri informatique en O(N).&quot; est trop brutale, je l&#039;adoucis en ajoutant &quot;général&quot;, merci de ta remarque.</description>
		<content:encoded><![CDATA[<p>@Hervé : oui, effectivement il existe des méthodes de tri O(n), mais elles ne sont pas générales, elles supposent que les données satisfont certaines hypothèses. Le tri par dénombrement (ou comptage) par exemple est assez spectaculaire mais suppose qu&#8217;on puisse faire correspondre un petit nombre entier à chaque enregistrement, donc suppose aussi qu&#8217;il existe beaucoup de données redondantes.</p>
<p>A noter que c&#8217;est aussi le cas pour le jeu de cartes : si je réserve 4 colonnes de 18 places pour les cartes sur la table, je peux placer chaque carte directement à sa place rien qu&#8217;en la regardant car je &laquo;&nbsp;sais&nbsp;&raquo; quelles sont les autres cartes, et qu&#8217;il n&#8217;y a qu&#8217;une carte de chaque couple (couleur, valeur).</p>
<p>Le &laquo;&nbsp;Terabyte Sort Benchmark&nbsp;&raquo; fournit un générateur de données aléatoires qui empêche d&#8217;utiliser ce genre de méthodes&#8230;</p>
<p>Mais il est vrai que ma phrase &laquo;&nbsp;il n’existe pas de tri informatique en O(N).&nbsp;&raquo; est trop brutale, je l&#8217;adoucis en ajoutant &laquo;&nbsp;général&nbsp;&raquo;, merci de ta remarque.</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : Herve Kabla</title>
		<link>http://drgoulu.com/2008/11/22/tri/#comment-989</link>
		<dc:creator>Herve Kabla</dc:creator>
		<pubDate>Sat, 22 Nov 2008 17:43:23 +0000</pubDate>
		<guid isPermaLink="false">http://drgoulu.com/?p=852#comment-989</guid>
		<description>Les tris avec comparaison ont effectivement une borne inférieure en O(nLogn). Mais il existe des tris lineaires! Je les ai decouverts en lisant l&#039;excellent pavé de Cormen/Leiserson/Rivest: tri par paquets, tri par base, tri par dénombrement. Ces algos ne font pas de comparaison directe entre les valeurs à trier! Incroyable, mais vrai...</description>
		<content:encoded><![CDATA[<p>Les tris avec comparaison ont effectivement une borne inférieure en O(nLogn). Mais il existe des tris lineaires! Je les ai decouverts en lisant l&#8217;excellent pavé de Cormen/Leiserson/Rivest: tri par paquets, tri par base, tri par dénombrement. Ces algos ne font pas de comparaison directe entre les valeurs à trier! Incroyable, mais vrai&#8230;</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : Tom Roud</title>
		<link>http://drgoulu.com/2008/11/22/tri/#comment-988</link>
		<dc:creator>Tom Roud</dc:creator>
		<pubDate>Sat, 22 Nov 2008 17:03:18 +0000</pubDate>
		<guid isPermaLink="false">http://drgoulu.com/?p=852#comment-988</guid>
		<description>Excellent billet, merci !
J&#039;adore le tri spaghetti, c&#039;est génial. Je ne sais pas si ça existe, mais on pourrait aussi faire un tris par tamis : on fabrique des particules de taille proportionnelle aux données qu&#039;on veut trier, et on laisse faire la physique, en tamisant avec une série de tamis superposés de taille décroissante; les particules les plus grosses seront en haut, celles les plus petites en bas. Un système physique qui ferait de la ségragation  de particules en fonction de leur taille marcherait aussi bien.</description>
		<content:encoded><![CDATA[<p>Excellent billet, merci !<br />
J&#8217;adore le tri spaghetti, c&#8217;est génial. Je ne sais pas si ça existe, mais on pourrait aussi faire un tris par tamis : on fabrique des particules de taille proportionnelle aux données qu&#8217;on veut trier, et on laisse faire la physique, en tamisant avec une série de tamis superposés de taille décroissante; les particules les plus grosses seront en haut, celles les plus petites en bas. Un système physique qui ferait de la ségragation  de particules en fonction de leur taille marcherait aussi bien.</p>
]]></content:encoded>
	</item>
</channel>
</rss>

<!-- Served from: drgoulu.com @ 2012-05-21 23:43:12 by W3 Total Cache -->
