Erano esattamente due anni che non pubblicavo contenuti SEO. Nell’Agosto del 2009 scrissi su Caffeine ma l’articolo è rimasto fino ad oggi figlio unico. L’estate, si sa, è la stagione delle esplosioni ormonali e degli amori, e questa in particolare è stata caratterizzata dall’avvento, dopo mesi di falsi allarmi, di Panda in Italia: migliore momento non c’è quindi per dargli un degno fratellino. Fuor di metafora, Caffeine e Panda (altrimenti detto Farmer Update) sono molto più parenti di quanto molti credano.

panda11

Lavorando abitualmente in mercati estremamente competitivi, caratterizzati da serp che possono variare anche più volte durante il corso della giornata, ho potuto osservare sin dal principio -ben prima dell’annuncio ufficiale del 12 agosto – gli effetti della presunta estensione del so-called Panda su Google.it. Il manifesto programmatico di questo update algoritmico è reperibile sul blog ufficiale di Google: “Finding more high-quality sites in search” (24 Febbraio 2011), seguito qualche mese dopo da precise linee guida ed indicazioni per i webmaster: ““More guidance on building high quality”, articolo che presentava l’ormai celebre lista di domande (valide anche a scopo di autodiagnosi per il proprio sito), quesiti simili a: “Se tua figlia uscisse con l’autore di questa pagina web, ne saresti contento?“, oppure: “Se il titolare di questo sito un giorno uccidesse ventotto persone con un AK-47, ne rimarresti sorpreso?”.

Per la prima volta abbiamo di fronte il tentativo di produrre un modello matematico che misuri l’emotività, la fiducia, l’affidabilità che un documento web ispira all’utente umano. Non è più quindi sufficiente ottimizzare una pagina web secondo i tradizionali fattori onpage (non insulterò la vostra intelligenza facendone un elenco) ma si deve operare affinchè il documento e l’intero sito di appartenenza abbiano qualità editoriale e look&feel tali da soddisfare non solo la chiave di ricerca in senso stretto, ma fornire maggiori informazioni, approfondimenti, riferimenti e fonti, guadagnare la fiducia dell’utente e persuaderlo a rimanere, condividere, suggerire il documento ai propri contatti. Panda è quindi un update epocale non solo per l’inedito buzz che Google stesso ha voluto crearci intorno, ma perchè si avvicina molto alla realizzazione delle profezie di un lustro fa, che vedevano un motore capace non solo di intepretare (o indovinare) alla perfezione i desideri impliciti di una query, ma anche e soprattutto le sensazioni che un utente umano prova visitando un dato documento web. L’imparziale arbitro dell’eterna diatriba “scrivere per i motori Vs scrivere per i lettori”.

[…] came up with a classifier to say, okay, IRS or Wikipedia or New York Times is over on this side, and the low-quality sites are over on this side. And you can really see mathematical reasons. (Matt Cutts)

Come probabilmente avvenuto in passato, Google ha dato in outsourcing l’esame e la valutazione di un seed di siti di partenza, di cui ha tracciato un profilo, per cosi dire, emozionale. Parafrasando, liberissimamente, Paul Ekman, abbiamo un set di emozioni negative come paura, rabbia, tristezza, disgusto e un set  di emozioni positive come soddisfazione, sollievo, piacere: ad ogni emozione suscitata è stato assegnato un valore, ovvero le sue coordinate all’interno di un ideale iperspazio. Avremo quindi che siti come Wikipedia, che presumibilmente suscitano alti valori di emozione positiva, staranno in determinate aree, la content farm sui generis, in aree diverse e distanti. I rimanenti siti, vale a dire tutti, saranno valutati in base alla vicinanza minore o maggiore ai siti considerati buoni.

Per una disamina più tecnica su Panda rimando a questo post di Enrico Altavilla: Come funzionano Panda e Google: gli aspetti tecnici

Bersaglio principale di Panda, com’è ormai arcinoto, sono le “content farm” (vedi voce su Wikipedia), siti che tecnicamente non infrangono alcuna guideline di Google ma che per loro natura propongono, premeditatamente, contenuti di bassa qualità, informazioni sistematicamente di basso profilo in quanto l’abbandono da parte dell’utente, meglio se cliccando un Ad, è cercato ed incoraggiato: il lucro sul traffico uscente come core business.
Va da sè che questo tipo di progetto non è molto diffuso in Italia [1] e mi ha spesso sorpreso, negli ultimi mesi, il panico di molti webmaster (i cui siti non erano neanche lontanamente associabili a content farm). Titolari di portali turistici e siti di hotel avevano ben più pressanti questioni (ad esempio l’imbastardimento delle serp organiche con i risultati local), titolari di ecommerce avevano ben più gravi e fisiologici limiti (ad esempio il riproporre descrizioni di prodotto, spesso fornite dai produttori, sempre identiche), operatori dei settori adult e finance avevano ben più di uno scheletro nell’armadio (ad esempio campagne di link building, per così dire… troppo creative) eppure al minimo drop tutti a sentirsi vittime della grande cospirazione del Panda. [2]

Sono convinto che, almeno per quanto riguarda l’Italia, le piccole rivoluzioni nei risultati organici osservate negli ultimi mesi abbiano origine diversa da Panda. E un piccolo ma poco notato spoiler lo fornisce, neanche troppo tra le righe, Amit Singhal (grassetto mio):

“Some publishers have fixated on our prior Panda algorithm change, but Panda was just one of roughly 500 search improvements we expect to roll out to search this year”

Panda quindi assume il ruolo dell’alligatore albino, sacrificato e gettato in pasto ai media e ai SEO (categoria cordialmente detestata da Google, da sempre) per distrarli da modifiche under the hood dalle conseguenze anche più tragiche, nella prospettiva di chi si occupa di search marketing. Se altri update ci sono stati,e ci sono stati, due di questi riguardano una diversa valutazione dei link e una migliore capacità di rilevare linking-schema o pattern non naturali di link. Sono certo che recentemente molti webmaster si sono visti recapitare il warning per “unnatural links”. Non è un caso. Inoltre, almeno secondo quanto ho potuto osservare sulle miriadi di progetti e clienti che seguo, l’ennesimo tentativo di improvement del filtro per i contenuti duplicati e/o una rinnovata abilità di attribuire un contenuto al suo legittimo creatore [3].

Che Panda sia perfettibile è fuori discussione. Però è utile, indipendentemente dalla tipologia di sito che si gestisce e indipendentemente dal reale impatto di Panda sulla search italiana, cogliere l’occasione per un restyling sia della forma sia della sostanza del proprio progetto web.

Ridurre e differenziare le parti boilerplate del sito. Advertising inclusi.

Tenere sempre a mente che l’abilità di Google nel riconoscere e filtrare le porzioni di codice ripetute su ogni pagina (alla base del ‘Mayday’ del 2010), come l’header, le sidebar, footer ed eventuali blocchi di advertising e andare al “cuore” dei contenuti, non va necessariamente a favore del webmaster: un documento che presenta 50 KB di codice boilerplate e tre righe di testo unico, è e rimane un documento con tre righe di testo unico.

Consolidare molte pagine in una sola.

Lo scenario di partenza, la cultura seo del passato, era la necessità di pubblicare online un sito con tante pagine, magari interconnesse. Seppur unici, pochi contenuti reali erano spalmati su molti documenti rispondenti a molte chiavi, in modo esatto, con poche variazioni. Perfettamente etico e non in contrasto con le guidelines di Google. Ma ormai insufficiente a rendere il singolo documento autorevole ed esaustivo, come desiderato dagli ideatori di Panda.

Non si tratta di eliminare i rami secchi di un sito, ma di raccoglierli e riunirli in un unico, lungo, ramo: esiste la redirect 301, e -nella maggior parte dei casi [4]- Google la supporta e ne tiene conto in modo relativamente rapido.

Al tempo stesso, chi è in procinto di creare nuovi contenuti, farà meglio ad evitare di diluire il medesimo argomento su più documenti: meglio un singolo (iper)testo, esaustivo, autoconclusivo (wikipedia style, se non fosse chiaro ciò che intendo). Sì a riferimenti esterni (o altre pagine interne), ma solo se di reale utilità e approfondimento.

Engagement. Ovvero quali siti non hanno interesse a trattenere l’utente, allacciare con lui  una relazione e invogliarlo a ritornare?

Sono i siti made for adsense, i siti satellite (costruiti per aumentare la rilevanza di altri siti ), le content farm. Come detto prima, un alto bounce rate, incubo per la maggior parte dei webmaster, in siti di questo tipo è il tramite principale per ottenere lauti guadagni e/o allontanare la possibilità di spam report. Il basso profilo e i nulli tentativi di trattenere e “conoscere” il proprio utente, sono premeditati.

Look at Suite 101. Go there, look around, figure out what they’re doing, and make sure you’re doing the opposite. (Matt Cutts)

Allontanarsi, anche a livello estetico e strutturale da questo tipo di sito, è la chiave per avvicinarsi all’area dei siti considerati “buoni“.

Surviving Panda. In conclusione.

Il Panda fa parte di una sottofamiglia degli ursidi. E’ un cuginetto dell’Orso Bruno, insomma, per sopravvivere all’attacco del quale ricordo che i metodi da fumetto, stendersi a terra e fingersi morti oppure saltare e agitare gambe e braccia per sembrare più grossi, non funzionano. Il mio consiglio è di credermi sulla parola.

L’applicazione di Panda nelle ricerche in lingua italiana, se realmente volta a colpire uno specifico tipo di web development e tutti i progetti che, più o meno volontariamente, ne richiamano la struttura, dovrebbe coincidere anche con l’incremento di ranking per moltissimi altri siti internet. La ricetta da me fornita in questo articolo, che in sintesi si basa sulla a) riduzione di boilerplate e -soprattutto- advertising sulle proprie pagine, b) sul consolidamento dei testi brevi in un unico testo coerente, e c) aumentare i punti di interesse e le possibilità di navigazione interna al sito [5] (potrei dire semplicisticamente “ridurre il bounce rate” ma esso è un dato controverso che, considerato a se stante, non è chiaro come e in che modo venga considerato dal motore), forse non copre tutti quei parametri formali di cui Panda tiene conto, ma rappresenta un effettivo allontanamento da quella tipologia di sito che l’algoritmo mira a ripulire dalle serp.

Tuttavia Panda, a mio parere, è giunto in Italia sollevando un polverone all’interno del quale  sono stati nascosti altri piccoli update o improvement degli algoritmi di ranking. A meno che non si gestisca un network di spudoratissime content farm made in Italy, i motivi di un drop o di un netto calo di referer da Google negli ultimi 20 giorni,  andranno ricercati analizzando problematiche seo nel proprio progetto che prescindono da Panda: link building troppo aggressiva e innaturale, contenuti duplicati (all’interno e all’esterno), lentezza del server, assenza di outbound links ecc.

Note.

[1] In molti associano content farm, termine che identifica un tipo ben preciso di sito, agli aggregatori news, ai comparatori di prezzo e, suppur raramente, alle directory e a siti che presentano user-generated content spesso non originale (comunicati stampa, inserzioni ecc.). Invero questi siti hanno punti di contatto: capitalizzazione del traffico uscente, discreti posizionamenti organici, nullo o scarso controllo editoriale sui contenuti pubblicati. Tuttavia, i siti che raccolgono, infiocchettano e servono contenuti già presenti su altre risorse non sono l’obiettivo primario di Panda.

[2] “… e i giornali e i tg non ne parlanoooo! Svegliaaaaaaaa [cit.]”.  Avrebbero potuto gridare “MayDay! Mayday!”, ma lo avevano già fatto l’anno prima.

[3] Google e l’eterna lotta per la corretta attribuzione di un contenuto al suo autore. In giugno di quest’anno ha annunciato il supporto del tag html5 rel=author e XFN rel=me . Per maggiori informazioni sull’integrazione di questo markup all’interno delle pagine web, leggere qui: http://www.google.com/support/webmasters/bin/answer.py?answer=1229920&&hl=en (non disponibile in italiano nel momento in cui scrivo).

[4] Fenomeno ampiamente osservato; ai fini di presentare all’utente serp che siano di facile comprensione e “pulite”, accade talvolta che la redirect 301, almeno in apparenza, sia ignorata e venga trattata quasi come una 302. Ciò comunque non inficia il posizionamento e la raggiungibilità della risorsa che ha beneficiato della redirezione.

[5] E non regalate i vostri commenti a Facebook!  Facebook comment box è un plugin, utilizzato da sempre più webmaster, che permette agli utenti di FB di commentare i propri articoli o prodotti direttamente sul proprio sito. Ottima opportunità per aumentare la presenza sul social network per antonomasia e ridurre drasticamente le possibilità di spam e/o trolls. Tuttavia in primo luogo i commenti diventeranno “di” Facebook, con tutto ciò che ne potrebbe conseguire. In seconda battuta, i commenti non sono tecnicamente indicizzabili e per moltissime tipologie di sito i commenti sono lo strumento principale per: rendere maggiormente originale la singola risorsa, fidelizzare gli utenti e, se si è soliti rispondere ai commenti, incrementare la propria expertise.

Surviving Panda

Category: Engines
34