<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Being Stuart &#187; Engines</title>
	<atom:link href="http://www.beingstuart.com/engines/feed" rel="self" type="application/rss+xml" />
	<link>http://www.beingstuart.com</link>
	<description>Stuart Delta sito ufficiale</description>
	<lastBuildDate>Thu, 02 Feb 2012 22:29:12 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.8.6</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>Surviving Panda</title>
		<link>http://www.beingstuart.com/engines/surviving-panda.html</link>
		<comments>http://www.beingstuart.com/engines/surviving-panda.html#comments</comments>
		<pubDate>Mon, 22 Aug 2011 10:08:58 +0000</pubDate>
		<dc:creator>Stuart D</dc:creator>
				<category><![CDATA[Engines]]></category>

		<guid isPermaLink="false">http://www.beingstuart.com/?p=904</guid>
		<description><![CDATA[Erano esattamente due anni che non pubblicavo contenuti SEO. Nell&#8217;Agosto del 2009 scrissi su Caffeine ma l&#8217;articolo è rimasto fino ad oggi figlio unico. L&#8217;estate, si sa, è la stagione delle esplosioni ormonali e degli amori, e questa in particolare è stata caratterizzata dall&#8217;avvento, dopo mesi di falsi allarmi, di Panda in Italia: migliore momento [...]]]></description>
			<content:encoded><![CDATA[<p>Erano esattamente due anni che non pubblicavo contenuti SEO. Nell&#8217;Agosto del 2009 scrissi su <a href="http://www.beingstuart.com/engines/google-caffeine-revolution.html" target="_blank">Caffeine</a> ma l&#8217;articolo è rimasto fino ad oggi figlio unico. L&#8217;estate, si sa, è la stagione delle esplosioni ormonali e degli amori, e questa in particolare è stata caratterizzata dall&#8217;avvento, dopo mesi di falsi allarmi, di Panda in Italia: migliore momento non c&#8217;è quindi per dargli un degno fratellino. Fuor di metafora, Caffeine e Panda (altrimenti detto Farmer Update) sono molto più parenti di quanto molti credano.</p>
<p><img class="alignnone size-full wp-image-915" title="panda11" src="http://www.beingstuart.com/wp-content/uploads/2011/08/panda11.jpg" alt="panda11" width="540" height="293" /></p>
<p><span id="more-904"></span>Lavorando abitualmente in mercati estremamente competitivi, caratterizzati da serp che possono variare anche più volte durante il corso della giornata, ho potuto osservare sin dal principio -ben prima dell&#8217;<a href="http://googlewebmastercentral.blogspot.com/2011/08/high-quality-sites-algorithm-launched.html" target="_blank">annuncio ufficiale del 12 agosto</a> &#8211; gli effetti della presunta estensione del <em>so-called</em> Panda su Google.it. Il manifesto programmatico di questo update algoritmico è reperibile sul blog ufficiale di Google: &#8220;<a href="http://googleblog.blogspot.com/2011/02/finding-more-high-quality-sites-in.html" target="_blank">Finding more high-quality sites in search</a>&#8221; (24 Febbraio 2011), seguito qualche mese dopo da precise linee guida ed indicazioni per i webmaster: &#8220;<a href="http://googlewebmastercentral.blogspot.com/2011/05/more-guidance-on-building-high-quality.html" target="_blank">&#8220;More guidance on building high quality&#8221;</a>, articolo che presentava l&#8217;ormai celebre lista di domande (valide anche a scopo di autodiagnosi per il proprio sito), quesiti simili a: &#8220;<em>Se tua figlia uscisse con l&#8217;autore di questa pagina web, ne saresti contento?</em>&#8220;, oppure: &#8220;<em>Se il titolare di questo sito un giorno uccidesse ventotto persone con un AK-47, ne rimarresti sorpreso?&#8221;</em>.</p>
<p>Per la prima volta abbiamo di fronte il tentativo di produrre un modello matematico che misuri l&#8217;emotività, la fiducia, l&#8217;affidabilità che un documento web ispira all&#8217;utente umano. Non è più quindi sufficiente ottimizzare una pagina web secondo i tradizionali fattori <em>onpage</em> (non insulterò la vostra intelligenza facendone un elenco) ma si deve operare affinchè il documento e l&#8217;intero sito di appartenenza abbiano qualità editoriale e look&amp;feel tali da soddisfare non solo la chiave di ricerca in senso stretto, ma fornire maggiori informazioni, approfondimenti, riferimenti e fonti, guadagnare la fiducia dell&#8217;utente e persuaderlo a rimanere, condividere, suggerire il documento ai propri contatti. Panda è quindi un update epocale non solo per l&#8217;inedito <em>buzz</em> che Google stesso ha voluto crearci intorno, ma perchè si avvicina molto alla realizzazione delle profezie di un lustro fa, che vedevano un motore capace non solo di intepretare (o indovinare) alla perfezione i desideri impliciti di una query, ma anche e soprattutto le sensazioni che un utente umano prova visitando un dato documento web. L&#8217;imparziale arbitro dell&#8217;eterna diatriba &#8220;scrivere per i motori Vs scrivere per i lettori&#8221;.</p>
<blockquote><p>[...] came up with a classifier to say, okay, IRS or Wikipedia or New York Times is over on this side, and the low-quality sites are over on this side. And you can really see mathematical reasons. (Matt Cutts)</p></blockquote>
<p>Come probabilmente avvenuto in passato, Google ha dato in outsourcing l&#8217;esame e la valutazione di un seed di siti di partenza, di cui ha tracciato un profilo, per cosi dire, emozionale. <strong>Parafrasando, liberissimamente</strong>, <a href="http://it.wikipedia.org/wiki/Paul_Ekman" target="_blank"><strong>Paul Ekman</strong></a>, abbiamo un set di emozioni negative come paura, rabbia, tristezza, disgusto e un set  di emozioni positive come soddisfazione, sollievo, piacere: ad ogni emozione suscitata è stato assegnato un valore, ovvero le sue coordinate all&#8217;interno di un ideale iperspazio. Avremo quindi che siti come Wikipedia, che presumibilmente suscitano alti valori di emozione positiva, staranno in determinate aree, la content farm <em>sui generis</em>, in aree diverse e distanti. I rimanenti siti, vale a dire tutti, saranno valutati in base alla vicinanza minore o maggiore ai siti considerati buoni.</p>
<p>Per una disamina più tecnica su Panda rimando a questo post di <strong>Enrico Altavilla</strong>: <a href="http://www.lowlevel.it/come-funzionano-panda-e-google-gli-aspetti-tecnici/" target="_blank">Come funzionano Panda e Google: gli aspetti tecnici</a></p>
<p>Bersaglio principale di Panda, com&#8217;è ormai arcinoto, sono le &#8220;<strong>content farm</strong>&#8221; (vedi <a href="http://en.wikipedia.org/wiki/Content_farm" target="_blank">voce su Wikipedia</a>), siti che tecnicamente non infrangono alcuna guideline di Google ma che per loro natura propongono, premeditatamente, contenuti di bassa qualità, informazioni sistematicamente di basso profilo in quanto l&#8217;abbandono da parte dell&#8217;utente, meglio se cliccando un Ad, è cercato ed incoraggiato: il lucro sul traffico uscente come core business.<br />
Va da sè che questo tipo di progetto non è molto diffuso in Italia [1] e mi ha spesso sorpreso, negli ultimi mesi, il panico di molti webmaster (i cui siti non erano neanche lontanamente associabili a content farm). Titolari di portali turistici e siti di hotel avevano ben più pressanti questioni (ad esempio l&#8217;imbastardimento delle serp organiche con i risultati local), titolari di ecommerce avevano ben più gravi e fisiologici limiti (ad esempio il riproporre descrizioni di prodotto, spesso fornite dai produttori, sempre identiche), operatori dei settori adult e finance avevano ben più di uno scheletro nell&#8217;armadio (ad esempio campagne di link building, per così dire&#8230; troppo creative)  eppure al minimo drop tutti a sentirsi vittime della <em>grande cospirazione del Panda</em>. [2]</p>
<p>Sono convinto che, almeno per quanto riguarda l&#8217;Italia, le piccole rivoluzioni nei risultati organici osservate negli ultimi mesi abbiano origine diversa da Panda. E un piccolo ma poco notato spoiler lo fornisce, neanche troppo tra le righe, <strong>Amit Singhal</strong> (grassetto mio):</p>
<blockquote><p>&#8220;Some publishers have fixated on our prior Panda algorithm change, but <strong>Panda was just one of roughly 500 search improvements</strong> we expect to roll out to search this year&#8221;</p></blockquote>
<p>Panda quindi assume il ruolo dell&#8217;alligatore albino, sacrificato e gettato in pasto ai media e ai SEO (categoria cordialmente detestata da Google, da sempre) per distrarli da modifiche under the hood dalle conseguenze anche più tragiche, nella prospettiva di chi si occupa di search marketing. Se altri update ci sono stati,e ci sono stati, due di questi riguardano una diversa valutazione dei link e una migliore capacità di rilevare linking-schema o pattern non naturali di link. Sono certo che recentemente molti webmaster si sono visti recapitare il warning per &#8220;unnatural links&#8221;. Non è un caso. Inoltre, almeno secondo quanto ho potuto osservare sulle miriadi di progetti e clienti che seguo, l&#8217;ennesimo tentativo di improvement del filtro per i contenuti duplicati e/o una rinnovata abilità di attribuire un contenuto al suo legittimo creatore [3].</p>
<p>Che Panda sia perfettibile è fuori discussione. Però è utile, indipendentemente dalla tipologia di sito che si gestisce e indipendentemente dal reale impatto di Panda sulla search italiana, cogliere l&#8217;occasione per un restyling sia della forma sia della sostanza del proprio progetto web.</p>
<h3>Ridurre e differenziare le parti boilerplate del sito. Advertising inclusi.</h3>
<p>Tenere sempre a mente che l&#8217;abilità di Google nel riconoscere e filtrare le porzioni di codice ripetute su ogni pagina (alla base del &#8216;Mayday&#8217; del 2010), come l&#8217;header, le sidebar, footer ed eventuali blocchi di advertising e andare al &#8220;cuore&#8221; dei contenuti, non va necessariamente a favore del webmaster: un documento che presenta 50 KB di codice boilerplate e tre righe di testo unico, è e rimane un documento con tre righe di testo unico.</p>
<h3>Consolidare molte pagine in una sola.</h3>
<p>Lo scenario di partenza, la cultura seo del passato, era la necessità di pubblicare online un sito con tante pagine, magari interconnesse. Seppur unici, pochi contenuti reali erano spalmati su molti documenti rispondenti a molte chiavi, in modo esatto, con poche variazioni.  Perfettamente etico e non in contrasto con le guidelines di Google. Ma ormai insufficiente a rendere il singolo documento autorevole ed esaustivo, come desiderato dagli ideatori di Panda.</p>
<p>Non si tratta di eliminare i rami secchi di un sito, ma di raccoglierli e riunirli in un unico, lungo, ramo: esiste la redirect 301, e -nella maggior parte dei casi [4]- Google la supporta e ne tiene conto in modo relativamente rapido.</p>
<p>Al tempo stesso, chi è in procinto di creare nuovi contenuti, farà meglio ad evitare di diluire il medesimo argomento su più documenti: meglio un singolo (iper)testo, esaustivo, autoconclusivo (<em>wikipedia style</em>, se non fosse chiaro ciò che intendo). Sì a riferimenti esterni (o altre pagine interne), ma solo se di reale utilità e approfondimento.</p>
<h3>Engagement. Ovvero quali siti non hanno interesse a trattenere l&#8217;utente, allacciare con lui  una relazione e invogliarlo a ritornare?</h3>
<p>Sono i siti made for adsense, i siti satellite (costruiti per aumentare la rilevanza di altri siti ), le content farm. Come detto prima, un alto bounce rate, incubo per la maggior parte dei webmaster, in siti di questo tipo è il tramite principale per ottenere lauti guadagni e/o allontanare la possibilità di spam report. Il basso profilo e i nulli tentativi di trattenere e &#8220;conoscere&#8221; il proprio utente, sono premeditati.</p>
<blockquote><p>Look at Suite 101. Go there, look around, figure out what they&#8217;re doing, and <strong>make sure you&#8217;re doing the opposite</strong>. (Matt Cutts)</p></blockquote>
<p>Allontanarsi, anche a livello estetico e strutturale da questo tipo di sito, è la chiave per avvicinarsi all&#8217;area dei siti considerati &#8220;<em>buoni</em>&#8220;.</p>
<h3>Surviving Panda. In conclusione.</h3>
<p>Il Panda fa parte di una sottofamiglia degli <em>ursidi</em>. E&#8217; un cuginetto dell&#8217;Orso Bruno, insomma, per sopravvivere all&#8217;attacco del quale ricordo che i metodi da fumetto, stendersi a terra e fingersi morti oppure saltare e agitare gambe e braccia per sembrare più grossi, non funzionano. Il mio consiglio è di credermi sulla parola.</p>
<p>L&#8217;applicazione di Panda nelle ricerche in lingua italiana, se realmente volta a colpire uno specifico tipo di web development e tutti i progetti che, più o meno volontariamente, ne richiamano la struttura, dovrebbe coincidere anche con l&#8217;incremento di ranking per moltissimi altri siti internet. La ricetta da me fornita in questo articolo, che in sintesi si basa sulla a) riduzione di boilerplate e -soprattutto- advertising sulle proprie pagine, b) sul consolidamento dei testi brevi in un unico testo coerente, e c) aumentare i punti di interesse e le possibilità di navigazione interna al sito [5] (potrei dire semplicisticamente &#8220;<em>ridurre il bounce rate</em>&#8221; ma esso è un dato controverso che, considerato a se stante, non è chiaro come e in che modo venga considerato dal motore), forse non copre tutti quei parametri formali di cui Panda tiene conto, ma rappresenta un effettivo allontanamento da quella tipologia di sito che l&#8217;algoritmo mira a ripulire dalle serp.</p>
<p>Tuttavia Panda, a mio parere, è giunto in Italia sollevando un polverone all&#8217;interno del quale  sono stati nascosti altri piccoli update o<em> improvement</em> degli algoritmi di ranking. A meno che non si gestisca un network di spudoratissime content farm made in Italy, i motivi di un drop o di un netto calo di referer da Google negli ultimi 20 giorni,  andranno ricercati analizzando problematiche seo nel proprio progetto che prescindono da Panda: link building troppo aggressiva e innaturale, contenuti duplicati (all&#8217;interno e all&#8217;esterno), lentezza del server, assenza di outbound links ecc.</p>
<p><strong>Note.</strong></p>
<p><small>[1] In molti associano <em>content farm</em>, termine che identifica un tipo ben preciso di sito, agli aggregatori news, ai comparatori di prezzo e, suppur raramente, alle directory e a siti che presentano user-generated content spesso non originale (comunicati stampa, inserzioni ecc.). Invero questi siti hanno punti di contatto: capitalizzazione del traffico uscente, discreti posizionamenti organici, nullo o scarso controllo editoriale sui contenuti pubblicati. Tuttavia, i siti che raccolgono, infiocchettano e servono contenuti già presenti su altre risorse non sono l&#8217;obiettivo primario di Panda.</small></p>
<p><small>[2] &#8220;<em>&#8230; e i giornali e i tg non ne parlanoooo! Svegliaaaaaaaa</em> [cit.]&#8220;.  Avrebbero potuto gridare &#8220;<strong>MayDay! Mayday</strong>!&#8221;, ma <a href="http://blog.tagliaerbe.com/2010/05/google-mayday-long-tail.html" target="_blank"> lo avevano già fatto l&#8217;anno prima.</a></small></p>
<p><small>[3] Google e l&#8217;eterna lotta per la corretta attribuzione di un contenuto al suo autore. In giugno di quest&#8217;anno ha <a href="http://googlewebmastercentral.blogspot.com/2011/06/authorship-markup-and-web-search.html" target="_blank">annunciato il supporto del tag html5 rel=author e XFN rel=me</a> . Per maggiori informazioni sull&#8217;integrazione di questo markup all&#8217;interno delle pagine web, leggere qui: <a href="http://www.google.com/support/webmasters/bin/answer.py?answer=1229920&amp;&amp;hl=en" target="_blank">http://www.google.com/support/webmasters/bin/answer.py?answer=1229920&amp;&amp;hl=en</a> (non disponibile in italiano nel momento in cui scrivo).</small></p>
<p><small>[4] Fenomeno ampiamente osservato; ai fini di presentare all&#8217;utente serp che siano di facile comprensione e &#8220;pulite&#8221;, accade talvolta che la redirect 301, almeno in apparenza, sia ignorata e venga trattata quasi come una 302. Ciò comunque non inficia il posizionamento e la raggiungibilità della risorsa che ha beneficiato della redirezione.</small></p>
<p><small>[5] E non regalate i vostri commenti a Facebook!  <a href="https://developers.facebook.com/docs/reference/plugins/comments/" target="_blank">Facebook comment box</a> è un plugin, utilizzato da sempre più webmaster, che permette agli utenti di FB di commentare i propri articoli o prodotti direttamente sul proprio sito. Ottima opportunità per aumentare la presenza sul social network per antonomasia e ridurre drasticamente le possibilità di spam e/o trolls. Tuttavia in primo luogo i commenti diventeranno &#8220;di&#8221; Facebook, con tutto ciò che ne potrebbe conseguire. In seconda battuta, i commenti non sono tecnicamente indicizzabili e per moltissime tipologie di sito i commenti sono lo strumento principale per: rendere maggiormente originale la singola risorsa, fidelizzare gli utenti e, se si è soliti rispondere ai commenti, incrementare la propria expertise.<br />
</small></p>
]]></content:encoded>
			<wfw:commentRss>http://www.beingstuart.com/engines/surviving-panda.html/feed</wfw:commentRss>
		<slash:comments>30</slash:comments>
		</item>
		<item>
		<title>Google Caffeine revolution</title>
		<link>http://www.beingstuart.com/engines/google-caffeine-revolution.html</link>
		<comments>http://www.beingstuart.com/engines/google-caffeine-revolution.html#comments</comments>
		<pubDate>Fri, 28 Aug 2009 14:10:21 +0000</pubDate>
		<dc:creator>Stuart D</dc:creator>
				<category><![CDATA[Engines]]></category>
		<category><![CDATA[gfs2]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[google caffeine]]></category>

		<guid isPermaLink="false">http://www.beingstuart.com/?p=26</guid>
		<description><![CDATA[Poco prima della metà di Agosto il mondo del search marketing è stato scosso dall'annucio in pompa magna di una nuova ed epocale infrastruttura di Google: <strong>Caffeine</strong>. Tempo di lasciarsi vincere dal panico e appendere il costumino da Super Seo al chiodo? No. Non ancora, almeno.]]></description>
			<content:encoded><![CDATA[<p><strong>Abstract</strong>: Google annuncia &#8220;<strong>Caffeine</strong>&#8220;, un update infrastrutturale che tocca il funzionamento del motore  di ricerca sin dalle sue fondamenta: <strong>recupero e storaggio delle informazioni presenti sul web</strong>. In questo articolo la time-line dei post ufficiali, le prime reazioni della blogosfera, la probabile backstory dell&#8217;update e, infine, un paio di considerazioni personali.</p>
<p>__</p>
<p>Poco prima della metà di Agosto il mondo del search marketing è stato scosso dall&#8217;annucio in pompa magna di una nuova ed epocale infrastruttura di Google: <strong>Caffeine</strong>. In pochi istanti i Seo, storicamente inclini a qualsiasi forma di panico, si sono raccolti intorno a Matt &#8220;Alopecia&#8221; Cutts, autoelettosi da tempo naturale estensore del motore di ricerca di Mountain View, in attesa di una sua dichiarazione illuminante in proposito. Dichiarazione che non ha tardato a giungere. Ma è proprio tempo di sprofondare nello sconforto e cambiare il proprio modo di fare seo? No.  Non ancora, almeno.</p>
<p><strong>10 Agosto 2009, ore 4.14 PM</strong></p>
<p><em><strong>&#8230; a next-generation architecture for Google&#8217;s web search. It&#8217;s the first step in a process that will let us push the envelope on size, indexing speed, accuracy, comprehensiveness and other dimensions. The new infrastructure sits &#8220;under the hood&#8221; of Google&#8217;s search engine, which means that most users won&#8217;t notice a difference in search results. But web developers and power searchers might notice a few differences, so we&#8217;re opening up a web developer preview to collect feedback.</strong></em></p>
<p><a href="http://googlewebmastercentral.blogspot.com/2009/08/help-test-some-next-generation.html">http://googlewebmastercentral.blogspot.com/2009/08/help-test-some-next-generation.html</a></p>
<p>Un cambiamento di infrastruttura quindi, che influenza modalità e velocità di reperimento e indicizzazione delle risorse e &#8220;non necessariamente&#8221; l&#8217;ordinamento dei risultati nelle serp. Il fatto che Google metta a disposizione un test URL  (<a href="http://www2.sandox.google.com">http://www2.sandox.google.com</a> )per raccogliere feedback da utenti e professionisti del search marketing fa immediatamente presumere che non si è di fronte -per ora- ad un cambiamento algoritmico (sui cui dettagli generalmente i Googletech sono più che restii a fornire dettagli).</p>
<p>Per quanto dall&#8217;osservazione di una trentina di serp per altrettante query si denotino differenze, alcune minime, alcune più rilevanti, il tutto fa presupporre che eventuali mutamenti nel ranking siano più dovuti ad &#8220;effetti collaterali&#8221; della nuova infrastruttura che ad un trattamento differente dei documenti nella compilazione delle pagine dei risultati.</p>
<p>La richiesta di commenti e riscontri fatta agli utenti molto probabilmente <strong>serve a Google per misurare la reale portata di questi <em>side-effect</em></strong>.</p>
<p> <strong>10 Agosto 2009, qualche ora dopo&#8230;</strong></p>
<p><a href="http://www.mattcutts.com/blog/caffeine-update/">http://www.mattcutts.com/blog/caffeine-update/</a></p>
<p>Matt Cutts pubblica sul suo blog un articolo che, contrariamente alle aspettative, non aggiunge nulla di nuovo rispetto all&#8217;articolo del Blog Ufficiale. Ribadisce, se mai ce ne fosse bisogno, che Caffeine non è una contromossa al sodalizio tra Microsoft e Yahoo! e che l&#8217;update non riguarda la User Interface.</p>
<p>Le due fonti citate costituiranno da quel momento, e per un&#8217;intera settimana, il contenuto principale di migliaia di articoli sull&#8217;argomento. Un rimbalzo di rara complessità balistica delle stesse parole che colpirà l&#8217;intero Web. Difficile trovare qualche articolo in cui il blogger o l&#8217;autore di turno azzardi qualche personale ipotesi.</p>
<p><strong>The Register</strong> si distingue dalla massa pubblicando un report, con piglio quasi da insider,  in cui spiega la backstory di &#8220;Caffeine&#8221;, un progetto di sviluppo e di rinnovo dell&#8217;intero File System durato due anni chiamato informalmente &#8220;GFS2&#8243; (Google File System 2) e che sicuramente è alla base dell&#8217;update di Agosto.</p>
<p><a href="http://www.theregister.co.uk/2009/08/14/google_caffeine_truth/">http://www.theregister.co.uk/2009/08/14/google_caffeine_truth/</a></p>
<p>Il File System tradizionale di Google (<a href="http://labs.google.com/papers/gfs.html">http://labs.google.com/papers/gfs.html</a> - vedi immagine sotto) si rivela efficace per effettuare operazioni in batch come il reperimento e l&#8217;indicizzazione dei documenti del web, ma poco efficace quando si tratta di gestire risorse frequentemente aggiornate come avviene su YouTube.</p>
<p><a href="http://www.beingstuart.com/wp-content/uploads/2009/08/gfs.jpg"><img class="alignnone size-medium wp-image-39" title="gfs" src="http://www.beingstuart.com/wp-content/uploads/2009/08/gfs-300x127.jpg" alt="gfs" width="300" height="127" /></a></p>
<p>Il GFS2, tra le novità, presenta non più la classica struttura <strong>Server Master - N chunkservers</strong>, ma presenta una <strong>serie di Server Master distribuiti che ospitano direttamente chunk di grandezza inferiore</strong> (1 MB contro i 64MB originari). </p>
<p>Se Caffeine è il nome &#8220;pubblico&#8221; della definitiva adozione del GFS2 (e probabilmente lo è) , si evince che la nuova infrastruttura ha ragione di essere non tanto per migliorare la qualità delle ricerche su Google, quanto per aggiornarne l&#8217;architettura dopo 10 anni di evoluzione del web che ha portato l&#8217;utenza a maggiori esigenze social e real time.</p>
<p>Il 16 Agosto, <strong>Aaron Wall</strong> di SeoBook, proprio partendo dalle speculazioni di The Register, pubblica la sua interpretazione di Caffeine.</p>
<p><a href="http://www.seobook.com/google-caffeine">http://www.seobook.com/google-caffeine</a></p>
<p> Assolutamente <strong>personali e arbitrarie</strong> le indicazioni per l&#8217;imminente futuro date ai seo:</p>
<p><strong><em>an increased weighting on domain authority &amp; some authoritative tag type pages ranking (like Technorati tag pages + Facebook tag pages), as well as pages on sites like Scribd ranking for some long tail queries based mostly on domain authority and sorta spammy on page text<br />
perhaps slightly more weight on exact match domain names<br />
perhaps a bit better understanding of related words / synonyms<br />
tuning down some of the exposure for video &amp; some universal search results</em></strong></p>
<p>Però al buon Mr. Wall va riconosciuto il merito di aver quantomeno provato a fare qualche ipotesi pratica invece di fare un bel CTRL-C CTRL-V e pulirsi la coscienza.</p>
<p><strong>Ma allora perchè i risultati di Google tradizionale sono diversi da quelli presentati sulla Sandbox (Google Caffeine)?</strong></p>
<p>Se non vi siete ancora addormentati è tempo per qualche mia speculazione.</p>
<p>Immaginate di dover fare la spesa (uova, acqua, pane, rum, vodka, gin, birra, martini, campari, una bottiglia di Sagrantino.. insomma le solite cose). Avete a disposizione esattamente 30 minuti per mettervi in macchina, girare per la città alla ricerca dei prodotti migliori, caricarli nel bagagliaio e tornare a casa.</p>
<p>Ecco la vostra macchina (carina vero?).</p>
<p><a href="http://www.beingstuart.com/wp-content/uploads/2009/08/pre-caffeine.jpg"><img class="alignleft size-medium wp-image-29" title="pre-caffeine" src="http://www.beingstuart.com/wp-content/uploads/2009/08/pre-caffeine-300x155.jpg" alt="pre-caffeine" width="300" height="155" /></a></p>
<p>Ed ecco la mappa della città (clicca per zoomare):</p>
<p><a href="http://www.beingstuart.com/wp-content/uploads/2009/08/piabta.jpg"><img class="alignnone size-medium wp-image-44" title="piabta" src="http://www.beingstuart.com/wp-content/uploads/2009/08/piabta-300x196.jpg" alt="piabta" width="300" height="196" /></a></p>
<p>Nonostante l&#8217;alto valore storico del mezzo che state guidando, è improbabile che riusciate in mezzora a compiere l&#8217;intero giro per recuperare il meglio. Avete un altro problema: lo spazio. Questo vi costringerà, nella fretta, non solo ad un giro limitato, ma anche una disposizione degli acquisti all&#8217;interno dell&#8217;auto che &#8220;non necessariamente&#8221; è la migliore e più razionale.</p>
<p>Ovvio, potete anche suddividere la spesa in più giorni e recarvi un giorno dal miglior venditore di acqua, poi dal miglior venditore di Vodka e così via, ma tempo che finite l&#8217;intero approviggionamento le merci che avete acquistato il primo giorno deperiranno.</p>
<p>Dopo 10 anni, potete farvi un caffè e godervi la Vostra nuova automobile:</p>
<p><a href="http://www.beingstuart.com/wp-content/uploads/2009/08/after-caffeine.jpg"><img class="alignnone size-medium wp-image-45" title="after-caffeine" src="http://www.beingstuart.com/wp-content/uploads/2009/08/after-caffeine-300x169.jpg" alt="after-caffeine" width="300" height="169" /></a></p>
<p>Non è plausibile che, con maggiore velocità e maggiore spazio, anche la modalità con cui fate la spesa cambierà radicalmente? In mezzora potrete comodamente acquisire le merci migliori e avrete il tempo di stiparle nel bagagliaio in modo più coerente. Non solo, ma con la Vostra nuova fiammante Porsche, neanche uno scenario simile (vedi immagine sotto) vi spaventerà più:</p>
<p><a href="http://www.beingstuart.com/wp-content/uploads/2009/08/newpiabta.jpg"><img class="alignnone size-medium wp-image-47" title="newpiabta" src="http://www.beingstuart.com/wp-content/uploads/2009/08/newpiabta-300x196.jpg" alt="newpiabta" width="300" height="196" /></a></p>
<p>Caffeine è basato su <strong>velocità e un migliore sistema di storaggio dei documenti</strong>. Non solo url e pagine web, ma video, news, social-web. Una nuova architettura pronta per il prossimo decennio di guerra del search, il terreno ideale per implementare, in futuro, la real-time search o, chissà, sperimentare algoritmi di semantica come l&#8217;ormai mitologica LSI (Latent Semantic Indexing), di fatto improponibile con il GFS tradizionale.</p>
<p>Variazioni delle serp tra Google e Google2 a mio parere sono effetti collaterali del nuovo sistema di indicizzazione, e non attengono necessariamente ad una nuova distribuzione di valori e pesi nella composizione e nel ranking dei documenti. Questo vale per ora. Ma se l&#8217;infrastruttura si dimostrerà davvero potente e performante come annunciato, Google potrebbe seriamente riaprire la guerra allo spam e alle risorse inutili che ha caratterizzato la parte mediana di quest&#8217;ultimo decennio: a quel punto il divario tra chi ha costruito onestamente la propria autorevolezza sul web e chi ha cavalcato malamente l&#8217;onda della visibilità online potrebbe, per questi ultimi, diventare seriamente incolmabile.</p>
<p><strong>Scenari futuri.</strong></p>
<p>Un Google meno obbligato all&#8217;austerità potrebbe rivoluzionare il concetto stesso di autorevolezza/autorità dei documenti sul web, al momento uno dei fattori più importanti del ranking ma molto spesso impropriamente influenzato (anche se in misura minore rispetto al passato) da link esterni artificiosi e da concetti facilmente aggirabili come l&#8217;anzianità del dominio. Un Google più veloce, potrebbe riuscire a muoversi con maggiore criterio nel grafo del web scindendo tra risorse &#8216;realmente&#8217; importanti e popolari e risorse dalla popolarità fittizia. Un Google più potente che può permettersi di approcciare senza timore tutte le realtà &#8220;social&#8221; del web moderno è anche in grado di valutare la rilevanza di un sito, di un documento, di un file multimediale ad un livello più alto, costringendo webmaster ad un approccio olistico al web marketing: dai motori di ricerca alle piattaforme social, dalla produzione di contenuti aggiornati alla capacità di realizzare reti di contatti e collegamenti tematici.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.beingstuart.com/engines/google-caffeine-revolution.html/feed</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
	</channel>
</rss>

