Engines

Worpress è il CMS più diffuso al mondo. E, come tale, e come fu per Windows negli anni 30 Avanti Cristo, attira l’attenzione di hacker, cracker, malwaristi della domenica e sfigati che ti vendono: “link da blog, ma tipo 10.000 a 20 dollari“. In pratica: appena scegli di pubblicare il tuo sitarello in WP, automaticamente sei preso di mira da centinaia di spammer che commentano (in automatico) at minchiam sul tuo blog.

Engines

Google, attraverso il Centro Editori, precisamente qui, presenta un’estensiva guida che, tra le altre cose, illustra le linee guida tecniche e di contenuto che un sito deve rispettare al fine di poter eseguire la richiesta di inclusione in Google News e sperare in un parere positivo da parte della piattaforma.

A partire da Gennaio 2019, come tecnico, ho presieduto alla richiesta di inclusione in Google News di quattordici siti internet. Otto dei quali accettati alla prima richiesta, quattro alla seconda richiesta (dopo 60 giorni), uno è stato rifiutato, formalmente, ma poi incluso automaticamente dopo 24 ore, e uno non è mai stato accettato. In quest’ultimo caso diciamo che me lo aspettavo: l’argomento del sito non era esattamente gradito in quel di Mountain View. Comunque posso dire, di aver una certa esperienza, competenza e “occhio” per quanto riguarda i requisiti per Google News. Sia quelli dichiarati da Google nella sua guida, sia quelli che impari poco a poco, osservando il pattern di navigazione dei curatori che decidono se accettare la richiesta.

Indice argomenti

Partiamo dalle basi: perché un webmaster dovrebbe voler entrare in Google News

Essenzialmente: per il traffico potenziale che la piattaforma porta ai siti che ne fanno parte. In realtà, data la competizione e il crescente numero di siti, nonché algoritmi non proprio precisissimi (eufemismo) nel categorizzare le notizie, almeno all’inizio Google News non farà la differenza.

Essere fonte di Google News, tuttavia, porta con sé alcuni piacevoli effetti collaterali, come l’indicizzazione pressoché in tempo reale dei nuovi contenuti che si pubblicano e anche una più veloce inclusione tra i risultati organici.

Nel periodo immediatamente successivo all’inclusione in Google News, e l’ho visto su tutti i siti che ho presentato, il traffico aumenta più per il migliorato trattamento di cui si beneficia tra i risultati organici che non per gli accessi provenienti dalla piattaforma di notizie.

NOTA. Google, ufficialmente, dichiara che non c’è nessun trattamento di favore nelle ricerche organiche per le fonti di Google News. Questo è vero, in linea teorica. Nella pratica, indicizzazione e ingresso nei risultati organica sono, da soli, in grado di generare maggiori accessi dal motore di ricerca.

Google News, inoltre, considera “manualmente” ogni richiesta. Posti i requisiti tecnici, che sono importanti, ma non sono tutto, il giudizio emesso dai curatori di News è relativo alla attendibilità del sito internet. È un giudizio umano, ovviamente, assolutamente fallibile, ma è un’attestazione tangibile della qualità della proposta di un sito. Che ne aumenta il valore.


Requisiti tecnici

La guida per i news producer di Google fornisce i requisiti tecnici che il sito deve soddisfare.

Vediamoli, brevemente, uno per uno:

Pagine di sezioni permanenti: ipotizziamo che il webmaster abbia una sezione notizie aggiornata, ma che l’URL rimanga sempre lo stesso (es: dominio.com/news), ovvero una pagina web che include contenuti estremamente dinamici. Google News potrebbe non essere in grado di scansionare la pagina. Eliminiamo pure il “potrebbe”: non la scansiona. Punto. Se il sito richiedente è composto unicamente di pagine di questo tipo, è pressoché impossibile ottenerne l’inclusione.

Contenuti accessibili: questa è semplice. Il crawler non deve essere bloccato da codice (es: meta robots), robots.txt o htaccess. Altrimenti che indicizza? Poi è chiaro, possono esserci pagine che webmaster non ha piacere che vengano indicizzate: Google rispetterà le sue direttive, ma va da sé che si vuole che le proprie notizie vada in News, Google deve poterle indicizzare.

Lingue e codifica: Una sola lingua per un solo contenuto. Contenuti bilingue (nella stessa pagina) sono il male. La codifica dei contenuti della pagina UTF-8 è la preferita.

Domini diversi: le tue notizie devono risiedere sullo stesso dominio (e/o sottodominio, aggiungo) per cui si fa la richiesta. Se si fa la richiesta per www.dominio.org e le news sono su news.dominio.org , la richiesta verrà respinta.

Questa era la parte facile. Ora c’è quella ancora più facile.

URL degli articoli. Un solo URL per un solo contenuto (unicità). E questo URL deve essere definitivo (permanenza). La guida non pone sufficiente accento al requisito successivo (che però è importantissimo), ovvero l’indicazione di non ripubblicare gli stessi articoli con URL diverso.

Sul serio: non va fatto. MAI. Anni fa mi sono divertito a fare il giochino di ripubblicare ogni giorno lo stesso articolo (con data e URL diversi) per “godermi” la snippet con foto prelevata da Google News e posta in cima ai risultati organici. L’ho fatto per una settimana: mi hanno beccato e cancellato il sito. Mai riammesso.

Linee guida sul layout della pagina: qui la guida non è generosa di suggerimenti, va detto. Tanto da chiedermi perché sia stata messa. Sulla base della mia esperienza, coloro che esamineranno il sito non fanno un giudizio di merito, che tu dica che gli asini volano o che l’omeopatia cura i tumori, ai curatori di Google News importa assai poco.

Il mio consiglio, mentre si attende la revisione da parte di Google News, è di mantenere un profilo medio basso, curando la lunghezza dei contenuti (che ovviamente devono essere originali) in relazione alle parti boilerplate come menu e footer, e tenere al minimo gli advertising, specie quelli troppo invasivi.

Ospitare il display Advertising di Google AdSense (secondo un vecchio adagio che “se fai vedere le pubblicità di Google, questo ti tratta megl) non serve a nulla. Ogni service di Google -Organico, News, Business Center, ADV, Adsense ecc.. – attiene a uffici diversi. E si odiano tutti tra di loro.

Requisiti per siti che richiedono registrazione e abbonamento: qui, sinceramente, non ho esperienza in merito. I siti che ho revisionato prima della richiesta di inclusione erano tutti open access. Ad ogni modo Google News non esclude che possano essere inclusi anche siti ad abbonamento (es: Corriere Della Sera è, tecnicamente, in abbonamento, ma compare in Google News), purché rispetti i requisiti tecnici spiegati qui: https://developers.google.com/search/docs/data-types/paywalled-content


Requisiti formali

Fin qui, diciamo, niente di trascendentale. La stragrande maggioranza dei CMS in circolazione assolve già nativamente il grosso dei requisiti tecnici per Google News.

Le cose si complicano quando si parla di requisiti formali. Google, nella sua infinita democrazia reinventata non fa grossa distinzione tra Testata Giornalistica Registrata e Sito di news esente da registrazione. Qualunque sito internet che rispetti i requisiti tecnici e sia aggiornato di frequente può ambire all’inclusione.

Essere una testata registrata assolve alcuni requisiti formali, ma non è scontato che li assolva tutti. Allo stesso tempo, un normale sito amatoriale, può non assolvere qualche requisito formale, ma può operare affinché li rispetti tutti.

Entrambe le tipologie di sito, quindi, sono soggette agli stessi controlli di forma da parte dei curatori di Google News. E condividono le medesime chance di essere inclusi o rifiutati.

Vediamo quelli classici:

Multiautorialità

Il tuo sito DEVE presentare due o più redattori o articolisti. Questo esclude i blog e i siti personali? Si. Li esclude.

Il primo passo è quello di rendere immediatamente visibile la natura multiautore del tuo sito.

Lo si fa in due modi:

  1. Ogni articolo è “firmato”. Ovvero il nome dell’autore dell’articolo è presente in cima o a piè di articolo;
  2. La pagina “Redazione”, o “Autori”, o [scegli tu], facilmente raggiungibile da un menu principale. Il menu “header” è quello preferito.

In merito al punto 1, hai libertà di gestire come gestire la “firma” dell’autore. Puoi decidere che cliccando sul nome dell’autore l’utente venga portato all’archivio dei suoi articoli (che è il comportamento di default di wordpress, ad esempio), oppure ad una sua pagina con la biografia estesa.

Puoi decidere se mettere una breve bio a piè di articolo, o non mettere nulla.

Il punto 2, ovvero la pagina che presenta tutti gli articolisti, è dove dovrai giocarti al meglio le tue carte.

Questa pagina presenta, come scritto sopra, l’organigramma del sito. Titolare, Responsabile Editoriale (se ce n’è uno), e gli autori che ci scrivono sopra.

Non è sufficiente mettere nome e cognome.

Il mantra di Google News è “affidabilità” delle fonti. In poche parole: vuole sapere tutto di te e dei tuoi articolisti.

Ogni persona che fa parte della macchina produttiva del sito deve trovare spazio in questa pagina, e di ognuna deve essere presente:

  • [OBBLIGATORIO] nominativo;
  • [OBBLIGATORIO] contatto email;
  • [OBBLIGATORIO] biografia con formazione accademica, esperienze, elementi che conferiscano autorevolezza all’articolista;
  • [RACCOMANDATO] eventuali contatti “social”, esempio Facebook, LinkedIn, Instagram;
  • [CONSIGLIATO] la presenza di una foto è preferibile;
  • [CONSIGLIATO] se l’autore ha una sua pagina personale sul sito, con l’elenco degli articoli da lui scritti e/o la biografia / CV completo, linkarla da qui;
  • [CONSIGLIATO] se l’autore ha un suo sito personale, linkarlo da qui.

Quanto sopra vale per il fondatore del sito, per un responsabile, per ognuno degli articolisti. Se hai la fortuna di avere molti autori che lavorano sul tuo sito, non temere che la pagina risulti alla fine troppo lunga. Questa pagina ha un’influenza altissima sulla decisione finale, ed è proprio così -cioè: piena di info- che deve essere.

Pagina: “Contatti”

Se la pagina “REDAZIONE/AUTORI/WHATEVER” è fondamentale per assolvere ai requisiti di “multiautorialità” e “attendibilità”, la pagina contatti assolve al requisito di “identificabilità“.

La pagina “Contatti”, oltre a dover essere visibile nei menu principali, non deve limitarsi a presentare un form, bensì includere le seguenti informazioni:

  • [OBBLIGATORIO] Indirizzo FISICO della redazione
  • [OBBLIGATORIO] Nome società, persona fisica, ecc. che risiede nell’indirizzo sopra riportato
  • [CONSIGLIATO] Qualsiasi altro indirizzo fisico, se ce ne sono altri (es: studio legale, ufficio amministrativo ecc.)
  • [OBBLIGATORIO] numero di telefono
  • [RACCOMANDATO] nominativo di chi risponde al numero di telefono sopra indicato: il titolare del sito? Il Capo Redattore? La signora delle pulizie?
  • [CONSIGLIATO] Un numero di rete fissa è consigliato, ma per la mia esperienza non è considerato requisito essenziale
  • [OBBLIGATORIO] Email, meglio se associata al dominio per cui si sta facendo la richiesta
  • [CONSIGLIATO] form contatti. Strano a dirsi, il form in sé non è considerato requisito essenziale, ma lo consiglio perché è un modo in più perché gli utenti ti contattino.

Pagina: “Chi siamo”

Le pagine “REDAZIONE” e “CONTATTI” sono da considerarsi la essenziali ai fini dell’inclusione in Google News da un punto di vista strettamente formale. Devono esserci e presentare quelle informazioni.

La pagina “Chi siamo” -che viene consultata dai curatori di Google News- è la tua occasione per attestare (o creare artificiosamente, se preferisci, purché sia coerente) il tuo pedigree.

Per la gestione della pagina hai due scelte, equivalenti. Ovvero, non ce n’è una preferibile rispetto all’altra.

a. Paginona lunga, con o senza indice di navigazione interna, in cui esporrai diffusamente, a costo di apparire verboso:

  • [OBBLIGATORIO] chi sei / chi siete;
  • [OBBLIGATORIO] esperienza nel settore;
  • [OBBLIGATORIO] finalità del sito (la classica mission);
  • [CONSIGLIATO] target cui sono rivolti i contenuti del sito ;
  • [CONSIGLIATO] chi finanzia l’attività del sito;
  • [FACOLTATIVO] finalità commerciali del sito;
  • [FACOLTATIVO] raccolta pubblicitaria, ovvero il dettaglio degli advertising, ove presenti, inseriti nel sito;

b. Pagina “Chi siamo” e sotto pagine correlate, ognuna delle quali associata alle voci che ho etichettato come “obbligatorie” nel precedente elenco.

La pagina “Chi siamo” -ed eventuali sotto pagine- deve essere linkate dai menu principali, perfettamente visibile e raggiungibile dall’utente (e dai revisori di Google News)

Footer (Piè di pagina) – Tutti i footer di tutte le pagine

Anche questa è una parte della pagina sempre controllata dai revisori di Google News, e deve includere:

  • [OBBLIGATORIO] Nome del sito (o dell’organizzazione che gestisce il sito, in caso le due denominazioni non coincidano);
  • [CONSIGLIATO] Partita Iva (se c’è), o iscrizione Tribunale come Testata giornalistica, o entrambe le informazioni;
  • [OBBLIGATORIO] Indirizzo FISICO della redazione, deve coincidere con quello della pagina “Contatti”
  • [OBBLIGATORIO] Email, deve coincidere con quella della pagina “Contatti”
  • [OBBLIGATORIO] Numero telefono, deve coincidere con quello della pagina “Contatti”

Altre informazioni che devono comparire in tutte le pagine (non necessariamente nel footer)

Oltre ai consueti link alla “Privacy Policy” e alla “Cookie Policy” – mi raccomando, sempre ben visibili- a scopo GDPR, suggerisco di inserire le seguenti informazioni:

  • [CONSIGLIATO] Licenza d’uso dei contenuti
  • [RACCOMANDATO] Devono essere presenti, in tutte le pagine, le categorie per cui si è fatta richiesta di inclusione in Google News.
  • [CONSIGLIATO] Altre policy rilevanti per la conduzione del sito, come la comment policy.

Conclusioni

Per i requisiti “formali”, ovvero quelle pagine che attestano non solo il fondamentale aspetto multiautoriale ma anche l’attendibilità e l’identificabilità del sito candidato all’ingresso in Google News non ci sono regole scritte.

E’ essenziale fornire più informazioni possibili, come in un CV, al fine di persuadere i revisori di Google News che hai titolo di parlare di ciò che parli, che sei reperibile e contattabile, hai esperienza e autorevolezza.


Richiesta di inclusione in Google News

Quando inoltri la richiesta di inclusione in Google News il sito deve già assolvere tutti i requisiti tecnici e formali sopra indicati.

Il processo di valutazione, rispetto a qualche anno fa, è veloce, nell’ordine delle 24/48/72 ore a seconda delle richieste pervenute insieme alla tua: non hai il tempo materiale per fare la richiesta e: “intanto ci lavoro“.

Verifica della proprietà del sito

Il modo più semplice è verificare il sito attraverso Search Console.

Completata la verifica con successo, il tuo sito comparirà in lista se visiti questa pagina. Ovvero: il Centro Editori Google News.

La schermata che ti trovi a video sarà una cosa simile:

Se tutto ha funzionato, vedrai il tuo sito internet con la label “Verificata” e un bottone “Richiedi Inclusione nell’Indice di News“. Il quale, senza timidezza o tremolio delle dita, va premuto.

Si aprirà un overlayer così:

Ovvero un form da compilare in ogni sua parte. Le informazioni richieste sono semplici: una descrizione del sito (rimani conciso e limitati alla descrizione del sito. Frasi come: “Vi prego accettatemi!!!” non servono), città (coincide con i dettagli forniti nella pagina contattti) ecc.

Occhio a questa parte, la più critica:

Per quanto riguarda le sezioni di “News”, altro non sono che le categorie da cui desideri che Google News prelevi le tue notizie. Ne puoi suggerire quante ne vuoi cliccando su “+ Aggiungi altre sezioni”.

Sei pronto a cliccare “INVIA“? Pensaci due o tre volte e, se proprio ne sei sicuro, vai e colpisci.

Cosa succede dopo aver inoltrato la richiesta?

Dopo tutto il lavoro propedeutico all’ingresso a Google News che hai fatto (o fatto fare) per adeguare il tuo sito, il meglio che tu possa fare adesso è berti un buon Margarita. Lo Champagne d’annata tienilo in fresco per quando ti daranno il responso positivo. O negativo. Insomma: brinderemo per festeggiare o brinderemo per dimenticare, come dicono in Irlanda.

L’esatto processo di revisione del tuo sito da parte di Google News non è noto. Tuttavia, pur non essendo un insider (hai capito che stiamo dalla stessa parte, no?), qualche indizio lo si può ricavare dai dati di navigazione durante l’esame del tuo sito.

Google News riceve la tua richiesta, pervenuta attraverso il modulo che hai compilato. Un revisore della piattaforma prende in carico la tua richiesta; la esamina e la carica su un panel interno, cui hanno accesso lui e X volontari / curatori / revisori che iniziano a navigare sul tuo sito ed esprimono un giudizio positivo o negativo sul tuo sito.
Raccolti i feedback, in caso di parere negativo il revisore predispone la risposta (automatizzata) al webmaster.

Quali pagine saranno prese in esame durante una review? Tutte le pagine “obbligatorie”: Redazione, in primis, e i la pagina Contatti. Tutte le pagine statiche informative, anche la Cookie Policy e la Privacy Policy. Vengono prese in esame anche le categorie (Sezioni di News) che hai presentato, ma anche tutte le altre.

Il processo di review, analisi e formulazione di un parere dura qualche ora e viene effettuato da non meno di una ventina di volontari i quali navigano liberamente sul sito.

Ricevuto un numero sufficiente di valutazioni, il tizio di Google che ha raccolto Il responso chiude il task ed emette il responso. Che viene inviato il giorno dopo. Trovi il responso nel Centro Editori, ovvero nella pagina da cui hai effettuato la richiesta.

Ad esempio:

La mail di risposta è automatica, ma include l’esatto motivo del rifiuto della tua richiesta.

Purtroppo, in caso di rifiuto del tuo sito, prima di sottoporre nuovamente la tua candidatura, dovrai aspettare 60 GIORNI. Puoi segnarti la data sul calendario se ci tieni, ma in ogni caso non ti sarà possibile reinoltrare la richiesta finché il bottone corrispondente non ricomparirà nel Centro Editori.

Se invece il responso è positivo, non ti viene inviata nessuna comunicazione. Lo so, tanto sbattimento e neanche un riconoscimento tipo: “Quant’è bello il tuo sito!!!“.

Te ne accorgi, tuttavia, perché nel Centro Editori hai una schermata simile:

Inoltre, prova del nove, facendo una query “Site:tuodominio.com” del tuo sito su news.google.it, iniziano a spuntare i tuoi articoli.


[AIUTO] Consulenza per entrare in Google News

Nella guida che hai letto ho inserito più elementi possibili per renderti in grado (tu o il tuo team di sviluppo e copywriter) per inoltrare una richiesta di inclusione a Google News. Se la segui nel dettaglio, posso garantirti che hai almeno il 90% di possibilità di ricevere un parere positivo.

Ma se hai bisogno di una mano, sono a tua disposizione. Un parere, informale e non vincolante, lo do sempre volentieri a chiunque.

Scrivimi due righe a: stuart.delta @ gmail.com e ti assisterò volentieri.

Engines

Nonostante, per mia grande fortuna, già da qualche mese non svolga ufficialmente attività di SEO  -ho trovato nel fancazzismo la mia dimensione ideale- mi ritrovo ancora a redigere consulenze per i miei ex-clienti storici (vi amo!); capita inoltre di entrare in contatto con perfetti sconosciuti che si rivolgono a me col tipico timore reverenziale di chi è convinto di trovarsi al cospetto di un TOP SEO <spoiler>non lo sono</spoiler><spoilerissimo>non lo sono mai stato</spoilerissimo>. Per questi ultimi, forse perché alimentano temporaneamente la mia autostima, mi metto più che volentieri a disposizione  secondo una di queste tre fasce di prezzo: a) ZERO € | b) DONAZIONE PAYPAL | c) UN PASTO CALDO. Inutile dire che la prima opzione è quella più gettonata. Hai presente il classico prospect che ad un certo punto se ne esce con: “Eh ma mio cugino la SEO me la fa gratis!” Nel 99% sta parlando di me. Sono diventato il “cugino che fa il SEO” di mezza tutta Italia.

Engines

E in realtà il post potrebbe chiudersi qui. Con il titolo in: <h1>CAPS LOCK</h1>. Chi sa, sa; chi non sa, chieda ad un SEO lontano da microfoni, telecamere e wp-admin.

Engines

Da un punto di vista SEO, dove per SEO ormai si intende l’applicazione di più o meno sofisticate tecniche di seduzione per piacere a Google, la questione “h1” (rigorosamente minuscolo, gli anni 90 son finiti da un pezzo)  è generalmente considerata di scarso rilievo su una scala da zero a chissenefrega. Eppure, neanche troppo di rado, diventa lo scenario per simpatici scontri di cazzodurismo tra gli esperti del settore. Prima che il tag ‘more’ cali come una mannaia su questo abstract voglio evitare inutili suspense: mi affilio alla generazione dinosaura di consulenti che impongono ai clienti (e a se stessi) l’utilizzo di un solo h1 per pagina.

Engines

Parte oggi un esperimento SEO volto a dimostrare l’impatto sul posizionamento delle menzioni (o co-citazioni) di un brand. Me la prenderò comoda (anche per motivi tecnici), com’è giusto che sia. I risultati saranno comunque resi noti qui sul blog oppure ad un workshop aziendale o ad un Convegno di settore, oppure durante una cena di pesce con amici … e poi su questo blog. Insomma: stay tuned.

In questo articolo di presentazione dell’esperimento dichiarerò le finalità e gli strumenti che saranno utilizzati.

Va da sè che chi si occupa professionalmente di SEO può intervenire con feedback, critiche, suggerimenti. E’ un semplice test: qualsiasi commento, anche indignato -purchè tale indignazione sia motivata e dettagliata- sarà ben accetto e gradito.

Erano esattamente due anni che non pubblicavo contenuti SEO. Nell’Agosto del 2009 scrissi su Caffeine ma l’articolo è rimasto fino ad oggi figlio unico. L’estate, si sa, è la stagione delle esplosioni ormonali e degli amori, e questa in particolare è stata caratterizzata dall’avvento, dopo mesi di falsi allarmi, di Panda in Italia: migliore momento non c’è quindi per dargli un degno fratellino. Fuor di metafora, Caffeine e Panda (altrimenti detto Farmer Update) sono molto più parenti di quanto molti credano.

panda11

Abstract: Google annuncia “Caffeine“, un update infrastrutturale che tocca il funzionamento del motore  di ricerca sin dalle sue fondamenta: recupero e storaggio delle informazioni presenti sul web. In questo articolo la time-line dei post ufficiali, le prime reazioni della blogosfera, la probabile backstory dell’update e, infine, un paio di considerazioni personali.

__

Poco prima della metà di Agosto il mondo del search marketing è stato scosso dall’annucio in pompa magna di una nuova ed epocale infrastruttura di Google: Caffeine. In pochi istanti i Seo, storicamente inclini a qualsiasi forma di panico, si sono raccolti intorno a Matt “Alopecia” Cutts, autoelettosi da tempo naturale estensore del motore di ricerca di Mountain View, in attesa di una sua dichiarazione illuminante in proposito. Dichiarazione che non ha tardato a giungere. Ma è proprio tempo di sprofondare nello sconforto e cambiare il proprio modo di fare seo? No.  Non ancora, almeno.

10 Agosto 2009, ore 4.14 PM

… a next-generation architecture for Google’s web search. It’s the first step in a process that will let us push the envelope on size, indexing speed, accuracy, comprehensiveness and other dimensions. The new infrastructure sits “under the hood” of Google’s search engine, which means that most users won’t notice a difference in search results. But web developers and power searchers might notice a few differences, so we’re opening up a web developer preview to collect feedback.

http://googlewebmastercentral.blogspot.com/2009/08/help-test-some-next-generation.html

Un cambiamento di infrastruttura quindi, che influenza modalità e velocità di reperimento e indicizzazione delle risorse e “non necessariamente” l’ordinamento dei risultati nelle serp. Il fatto che Google metta a disposizione un test URL  (http://www2.sandox.google.com )per raccogliere feedback da utenti e professionisti del search marketing fa immediatamente presumere che non si è di fronte -per ora- ad un cambiamento algoritmico (sui cui dettagli generalmente i Googletech sono più che restii a fornire dettagli).

Per quanto dall’osservazione di una trentina di serp per altrettante query si denotino differenze, alcune minime, alcune più rilevanti, il tutto fa presupporre che eventuali mutamenti nel ranking siano più dovuti ad “effetti collaterali” della nuova infrastruttura che ad un trattamento differente dei documenti nella compilazione delle pagine dei risultati.

La richiesta di commenti e riscontri fatta agli utenti molto probabilmente serve a Google per misurare la reale portata di questi side-effect.

 10 Agosto 2009, qualche ora dopo…

http://www.mattcutts.com/blog/caffeine-update/

Matt Cutts pubblica sul suo blog un articolo che, contrariamente alle aspettative, non aggiunge nulla di nuovo rispetto all’articolo del Blog Ufficiale. Ribadisce, se mai ce ne fosse bisogno, che Caffeine non è una contromossa al sodalizio tra Microsoft e Yahoo! e che l’update non riguarda la User Interface.

Le due fonti citate costituiranno da quel momento, e per un’intera settimana, il contenuto principale di migliaia di articoli sull’argomento. Un rimbalzo di rara complessità balistica delle stesse parole che colpirà l’intero Web. Difficile trovare qualche articolo in cui il blogger o l’autore di turno azzardi qualche personale ipotesi.

The Register si distingue dalla massa pubblicando un report, con piglio quasi da insider,  in cui spiega la backstory di “Caffeine”, un progetto di sviluppo e di rinnovo dell’intero File System durato due anni chiamato informalmente “GFS2” (Google File System 2) e che sicuramente è alla base dell’update di Agosto.

http://www.theregister.co.uk/2009/08/14/google_caffeine_truth/

Il File System tradizionale di Google (http://labs.google.com/papers/gfs.html – vedi immagine sotto) si rivela efficace per effettuare operazioni in batch come il reperimento e l’indicizzazione dei documenti del web, ma poco efficace quando si tratta di gestire risorse frequentemente aggiornate come avviene su YouTube.

gfs

Il GFS2, tra le novità, presenta non più la classica struttura Server Master – N chunkservers, ma presenta una serie di Server Master distribuiti che ospitano direttamente chunk di grandezza inferiore (1 MB contro i 64MB originari). 

Se Caffeine è il nome “pubblico” della definitiva adozione del GFS2 (e probabilmente lo è) , si evince che la nuova infrastruttura ha ragione di essere non tanto per migliorare la qualità delle ricerche su Google, quanto per aggiornarne l’architettura dopo 10 anni di evoluzione del web che ha portato l’utenza a maggiori esigenze social e real time.

Il 16 Agosto, Aaron Wall di SeoBook, proprio partendo dalle speculazioni di The Register, pubblica la sua interpretazione di Caffeine.

http://www.seobook.com/google-caffeine

 Assolutamente personali e arbitrarie le indicazioni per l’imminente futuro date ai seo:

an increased weighting on domain authority & some authoritative tag type pages ranking (like Technorati tag pages + Facebook tag pages), as well as pages on sites like Scribd ranking for some long tail queries based mostly on domain authority and sorta spammy on page text
perhaps slightly more weight on exact match domain names
perhaps a bit better understanding of related words / synonyms
tuning down some of the exposure for video & some universal search results

Però al buon Mr. Wall va riconosciuto il merito di aver quantomeno provato a fare qualche ipotesi pratica invece di fare un bel CTRL-C CTRL-V e pulirsi la coscienza.

Ma allora perchè i risultati di Google tradizionale sono diversi da quelli presentati sulla Sandbox (Google Caffeine)?

Se non vi siete ancora addormentati è tempo per qualche mia speculazione.

Immaginate di dover fare la spesa (uova, acqua, pane, rum, vodka, gin, birra, martini, campari, una bottiglia di Sagrantino.. insomma le solite cose). Avete a disposizione esattamente 30 minuti per mettervi in macchina, girare per la città alla ricerca dei prodotti migliori, caricarli nel bagagliaio e tornare a casa.

Ecco la vostra macchina (carina vero?).

pre-caffeine

Ed ecco la mappa della città (clicca per zoomare):

piabta

Nonostante l’alto valore storico del mezzo che state guidando, è improbabile che riusciate in mezzora a compiere l’intero giro per recuperare il meglio. Avete un altro problema: lo spazio. Questo vi costringerà, nella fretta, non solo ad un giro limitato, ma anche una disposizione degli acquisti all’interno dell’auto che “non necessariamente” è la migliore e più razionale.

Ovvio, potete anche suddividere la spesa in più giorni e recarvi un giorno dal miglior venditore di acqua, poi dal miglior venditore di Vodka e così via, ma tempo che finite l’intero approviggionamento le merci che avete acquistato il primo giorno deperiranno.

Dopo 10 anni, potete farvi un caffè e godervi la Vostra nuova automobile:

after-caffeine

Non è plausibile che, con maggiore velocità e maggiore spazio, anche la modalità con cui fate la spesa cambierà radicalmente? In mezzora potrete comodamente acquisire le merci migliori e avrete il tempo di stiparle nel bagagliaio in modo più coerente. Non solo, ma con la Vostra nuova fiammante Porsche, neanche uno scenario simile (vedi immagine sotto) vi spaventerà più:

newpiabta

Caffeine è basato su velocità e un migliore sistema di storaggio dei documenti. Non solo url e pagine web, ma video, news, social-web. Una nuova architettura pronta per il prossimo decennio di guerra del search, il terreno ideale per implementare, in futuro, la real-time search o, chissà, sperimentare algoritmi di semantica come l’ormai mitologica LSI (Latent Semantic Indexing), di fatto improponibile con il GFS tradizionale.

Variazioni delle serp tra Google e Google2 a mio parere sono effetti collaterali del nuovo sistema di indicizzazione, e non attengono necessariamente ad una nuova distribuzione di valori e pesi nella composizione e nel ranking dei documenti. Questo vale per ora. Ma se l’infrastruttura si dimostrerà davvero potente e performante come annunciato, Google potrebbe seriamente riaprire la guerra allo spam e alle risorse inutili che ha caratterizzato la parte mediana di quest’ultimo decennio: a quel punto il divario tra chi ha costruito onestamente la propria autorevolezza sul web e chi ha cavalcato malamente l’onda della visibilità online potrebbe, per questi ultimi, diventare seriamente incolmabile.

Scenari futuri.

Un Google meno obbligato all’austerità potrebbe rivoluzionare il concetto stesso di autorevolezza/autorità dei documenti sul web, al momento uno dei fattori più importanti del ranking ma molto spesso impropriamente influenzato (anche se in misura minore rispetto al passato) da link esterni artificiosi e da concetti facilmente aggirabili come l’anzianità del dominio. Un Google più veloce, potrebbe riuscire a muoversi con maggiore criterio nel grafo del web scindendo tra risorse ‘realmente’ importanti e popolari e risorse dalla popolarità fittizia. Un Google più potente che può permettersi di approcciare senza timore tutte le realtà “social” del web moderno è anche in grado di valutare la rilevanza di un sito, di un documento, di un file multimediale ad un livello più alto, costringendo webmaster ad un approccio olistico al web marketing: dai motori di ricerca alle piattaforme social, dalla produzione di contenuti aggiornati alla capacità di realizzare reti di contatti e collegamenti tematici.