Engines

E in realtà il post potrebbe chiudersi qui. Con il titolo in: <h1>CAPS LOCK</h1>. Chi sa, sa; chi non sa, chieda ad un SEO lontano da microfoni, telecamere e wp-admin.

Engines

Da un punto di vista SEO, dove per SEO ormai si intende l’applicazione di più o meno sofisticate tecniche di seduzione per piacere a Google, la questione “h1” (rigorosamente minuscolo, gli anni 90 son finiti da un pezzo)  è generalmente considerata di scarso rilievo su una scala da zero a chissenefrega. Eppure, neanche troppo di rado, diventa lo scenario per simpatici scontri di cazzodurismo tra gli esperti del settore. Prima che il tag ‘more’ cali come una mannaia su questo abstract voglio evitare inutili suspense: mi affilio alla generazione dinosaura di consulenti che impongono ai clienti (e a se stessi) l’utilizzo di un solo h1 per pagina.

Engines

Parte oggi un esperimento SEO volto a dimostrare l’impatto sul posizionamento delle menzioni (o co-citazioni) di un brand. Me la prenderò comoda (anche per motivi tecnici), com’è giusto che sia. I risultati saranno comunque resi noti qui sul blog oppure ad un workshop aziendale o ad un Convegno di settore, oppure durante una cena di pesce con amici … e poi su questo blog. Insomma: stay tuned.

In questo articolo di presentazione dell’esperimento dichiarerò le finalità e gli strumenti che saranno utilizzati.

Va da sè che chi si occupa professionalmente di SEO può intervenire con feedback, critiche, suggerimenti. E’ un semplice test: qualsiasi commento, anche indignato -purchè tale indignazione sia motivata e dettagliata- sarà ben accetto e gradito.

Erano esattamente due anni che non pubblicavo contenuti SEO. Nell’Agosto del 2009 scrissi su Caffeine ma l’articolo è rimasto fino ad oggi figlio unico. L’estate, si sa, è la stagione delle esplosioni ormonali e degli amori, e questa in particolare è stata caratterizzata dall’avvento, dopo mesi di falsi allarmi, di Panda in Italia: migliore momento non c’è quindi per dargli un degno fratellino. Fuor di metafora, Caffeine e Panda (altrimenti detto Farmer Update) sono molto più parenti di quanto molti credano.

panda11

Abstract: Google annuncia “Caffeine“, un update infrastrutturale che tocca il funzionamento del motore  di ricerca sin dalle sue fondamenta: recupero e storaggio delle informazioni presenti sul web. In questo articolo la time-line dei post ufficiali, le prime reazioni della blogosfera, la probabile backstory dell’update e, infine, un paio di considerazioni personali.

__

Poco prima della metà di Agosto il mondo del search marketing è stato scosso dall’annucio in pompa magna di una nuova ed epocale infrastruttura di Google: Caffeine. In pochi istanti i Seo, storicamente inclini a qualsiasi forma di panico, si sono raccolti intorno a Matt “Alopecia” Cutts, autoelettosi da tempo naturale estensore del motore di ricerca di Mountain View, in attesa di una sua dichiarazione illuminante in proposito. Dichiarazione che non ha tardato a giungere. Ma è proprio tempo di sprofondare nello sconforto e cambiare il proprio modo di fare seo? No.  Non ancora, almeno.

10 Agosto 2009, ore 4.14 PM

… a next-generation architecture for Google’s web search. It’s the first step in a process that will let us push the envelope on size, indexing speed, accuracy, comprehensiveness and other dimensions. The new infrastructure sits “under the hood” of Google’s search engine, which means that most users won’t notice a difference in search results. But web developers and power searchers might notice a few differences, so we’re opening up a web developer preview to collect feedback.

http://googlewebmastercentral.blogspot.com/2009/08/help-test-some-next-generation.html

Un cambiamento di infrastruttura quindi, che influenza modalità e velocità di reperimento e indicizzazione delle risorse e “non necessariamente” l’ordinamento dei risultati nelle serp. Il fatto che Google metta a disposizione un test URL  (http://www2.sandox.google.com )per raccogliere feedback da utenti e professionisti del search marketing fa immediatamente presumere che non si è di fronte -per ora- ad un cambiamento algoritmico (sui cui dettagli generalmente i Googletech sono più che restii a fornire dettagli).

Per quanto dall’osservazione di una trentina di serp per altrettante query si denotino differenze, alcune minime, alcune più rilevanti, il tutto fa presupporre che eventuali mutamenti nel ranking siano più dovuti ad “effetti collaterali” della nuova infrastruttura che ad un trattamento differente dei documenti nella compilazione delle pagine dei risultati.

La richiesta di commenti e riscontri fatta agli utenti molto probabilmente serve a Google per misurare la reale portata di questi side-effect.

 10 Agosto 2009, qualche ora dopo…

http://www.mattcutts.com/blog/caffeine-update/

Matt Cutts pubblica sul suo blog un articolo che, contrariamente alle aspettative, non aggiunge nulla di nuovo rispetto all’articolo del Blog Ufficiale. Ribadisce, se mai ce ne fosse bisogno, che Caffeine non è una contromossa al sodalizio tra Microsoft e Yahoo! e che l’update non riguarda la User Interface.

Le due fonti citate costituiranno da quel momento, e per un’intera settimana, il contenuto principale di migliaia di articoli sull’argomento. Un rimbalzo di rara complessità balistica delle stesse parole che colpirà l’intero Web. Difficile trovare qualche articolo in cui il blogger o l’autore di turno azzardi qualche personale ipotesi.

The Register si distingue dalla massa pubblicando un report, con piglio quasi da insider,  in cui spiega la backstory di “Caffeine”, un progetto di sviluppo e di rinnovo dell’intero File System durato due anni chiamato informalmente “GFS2” (Google File System 2) e che sicuramente è alla base dell’update di Agosto.

http://www.theregister.co.uk/2009/08/14/google_caffeine_truth/

Il File System tradizionale di Google (http://labs.google.com/papers/gfs.html – vedi immagine sotto) si rivela efficace per effettuare operazioni in batch come il reperimento e l’indicizzazione dei documenti del web, ma poco efficace quando si tratta di gestire risorse frequentemente aggiornate come avviene su YouTube.

gfs

Il GFS2, tra le novità, presenta non più la classica struttura Server Master – N chunkservers, ma presenta una serie di Server Master distribuiti che ospitano direttamente chunk di grandezza inferiore (1 MB contro i 64MB originari). 

Se Caffeine è il nome “pubblico” della definitiva adozione del GFS2 (e probabilmente lo è) , si evince che la nuova infrastruttura ha ragione di essere non tanto per migliorare la qualità delle ricerche su Google, quanto per aggiornarne l’architettura dopo 10 anni di evoluzione del web che ha portato l’utenza a maggiori esigenze social e real time.

Il 16 Agosto, Aaron Wall di SeoBook, proprio partendo dalle speculazioni di The Register, pubblica la sua interpretazione di Caffeine.

http://www.seobook.com/google-caffeine

 Assolutamente personali e arbitrarie le indicazioni per l’imminente futuro date ai seo:

an increased weighting on domain authority & some authoritative tag type pages ranking (like Technorati tag pages + Facebook tag pages), as well as pages on sites like Scribd ranking for some long tail queries based mostly on domain authority and sorta spammy on page text
perhaps slightly more weight on exact match domain names
perhaps a bit better understanding of related words / synonyms
tuning down some of the exposure for video & some universal search results

Però al buon Mr. Wall va riconosciuto il merito di aver quantomeno provato a fare qualche ipotesi pratica invece di fare un bel CTRL-C CTRL-V e pulirsi la coscienza.

Ma allora perchè i risultati di Google tradizionale sono diversi da quelli presentati sulla Sandbox (Google Caffeine)?

Se non vi siete ancora addormentati è tempo per qualche mia speculazione.

Immaginate di dover fare la spesa (uova, acqua, pane, rum, vodka, gin, birra, martini, campari, una bottiglia di Sagrantino.. insomma le solite cose). Avete a disposizione esattamente 30 minuti per mettervi in macchina, girare per la città alla ricerca dei prodotti migliori, caricarli nel bagagliaio e tornare a casa.

Ecco la vostra macchina (carina vero?).

pre-caffeine

Ed ecco la mappa della città (clicca per zoomare):

piabta

Nonostante l’alto valore storico del mezzo che state guidando, è improbabile che riusciate in mezzora a compiere l’intero giro per recuperare il meglio. Avete un altro problema: lo spazio. Questo vi costringerà, nella fretta, non solo ad un giro limitato, ma anche una disposizione degli acquisti all’interno dell’auto che “non necessariamente” è la migliore e più razionale.

Ovvio, potete anche suddividere la spesa in più giorni e recarvi un giorno dal miglior venditore di acqua, poi dal miglior venditore di Vodka e così via, ma tempo che finite l’intero approviggionamento le merci che avete acquistato il primo giorno deperiranno.

Dopo 10 anni, potete farvi un caffè e godervi la Vostra nuova automobile:

after-caffeine

Non è plausibile che, con maggiore velocità e maggiore spazio, anche la modalità con cui fate la spesa cambierà radicalmente? In mezzora potrete comodamente acquisire le merci migliori e avrete il tempo di stiparle nel bagagliaio in modo più coerente. Non solo, ma con la Vostra nuova fiammante Porsche, neanche uno scenario simile (vedi immagine sotto) vi spaventerà più:

newpiabta

Caffeine è basato su velocità e un migliore sistema di storaggio dei documenti. Non solo url e pagine web, ma video, news, social-web. Una nuova architettura pronta per il prossimo decennio di guerra del search, il terreno ideale per implementare, in futuro, la real-time search o, chissà, sperimentare algoritmi di semantica come l’ormai mitologica LSI (Latent Semantic Indexing), di fatto improponibile con il GFS tradizionale.

Variazioni delle serp tra Google e Google2 a mio parere sono effetti collaterali del nuovo sistema di indicizzazione, e non attengono necessariamente ad una nuova distribuzione di valori e pesi nella composizione e nel ranking dei documenti. Questo vale per ora. Ma se l’infrastruttura si dimostrerà davvero potente e performante come annunciato, Google potrebbe seriamente riaprire la guerra allo spam e alle risorse inutili che ha caratterizzato la parte mediana di quest’ultimo decennio: a quel punto il divario tra chi ha costruito onestamente la propria autorevolezza sul web e chi ha cavalcato malamente l’onda della visibilità online potrebbe, per questi ultimi, diventare seriamente incolmabile.

Scenari futuri.

Un Google meno obbligato all’austerità potrebbe rivoluzionare il concetto stesso di autorevolezza/autorità dei documenti sul web, al momento uno dei fattori più importanti del ranking ma molto spesso impropriamente influenzato (anche se in misura minore rispetto al passato) da link esterni artificiosi e da concetti facilmente aggirabili come l’anzianità del dominio. Un Google più veloce, potrebbe riuscire a muoversi con maggiore criterio nel grafo del web scindendo tra risorse ‘realmente’ importanti e popolari e risorse dalla popolarità fittizia. Un Google più potente che può permettersi di approcciare senza timore tutte le realtà “social” del web moderno è anche in grado di valutare la rilevanza di un sito, di un documento, di un file multimediale ad un livello più alto, costringendo webmaster ad un approccio olistico al web marketing: dai motori di ricerca alle piattaforme social, dalla produzione di contenuti aggiornati alla capacità di realizzare reti di contatti e collegamenti tematici.