Classifiche di blog e riflessioni
Le novità in circolazione impongono di ritornare sull’argomento classifiche per i blog. Da tempo stiamo lavorando a una classifica che prenda in considerazione non solo Technorati ma anche altre fonti (Google, Yahoo!, Bloglines ecc.). Generare un algoritmo che dia risultati privi di anomalie macroscopiche non è facile. Ad esempio i dati di Alexa (che sono condizionati dall’installazione di una barra da parte dell’utente), se inclusi nell’algoritmo, generano grossi problemi.
Altri hanno ripreso a “misurare” i blog, portandosi però dietro vecchi problemi. Partiamo dal minore. Nel creare una classifica è poco raccomandabile partire da una base numerica di blog limitata, per almeno un motivo: la classifica non sarà in grado di tenere conto dei meme (che fanno acquistare molti link in periodi di tempo brevi). Faccio un esempio concreto: se ho ben capito Alex sta creando tanti blog-civetta su Blogspot per hackerare la sua posizione nelle classifiche (credo che lo faccia a scopo provocatorio e di test); la classifica di BlogItalia, comprendendo quasi 8000 blog anche senza link, era già “reattiva” ieri, mentre l’altra non riportava il blog in ascesa.
Eppure il problema maggiore che ci si trova ad affrontare è un altro: si possono escludere dei blog per il loro contenuto? La classifica aggregata esclude i blog che forniscono template e secondo me è un errore. Il blog è un CMS, quindi se io volessi riportare ogni giorno (esempio) il mio abbigliamento e i lettori mi leggessero e linkassero non trovo motivi per un’esclusione. Semmai il punto è un altro: alcuni blog di template richiedono come condizione necessaria per l’utilizzo dei template che venga inserito un link. Potrebbe essere questo un criterio di esclusione, vista la “non-volontarietà” (o “libertà condizionata”) del link? In linea teorica sì, però una riflessione approfondita ci porta a chiederci se tutti i link inseriti in altri casi siano “liberi”. I link dei nostri blogroll non hanno tutti lo stesso peso: alcuni sono inseriti per stima, altri per scambio, altri per i motivi più disparati. In questo contesto, nell’impossibilità di tenere conto delle motivazioni del singolo link, credo che non si possano effettuare esclusioni perché risulterebbero arbitrarie. Il criterio (discutibilissimo) è “un link = un punto”, tanto più che il risultato finale, la classifica, non sarà rappresentativa e andrà considerata semplicemente uno strumento orientativo. Assolutamente errato, a mio avviso (e anche un po’ “ego-élitista”?), escludere i blog che non hanno un feed.
AGGIORNAMENTO: Ludo faccio appello a te per rendere open source l’applicazione che effettua le interrogazioni via API e genera la classifica in modo da poter adottare criteri diversi dai tuoi. Lo farai? ;)
AGGIORNAMENTO 2: come prevedibile ha detto di no.
Tony..in privato ti ho mandato una seconda mail, non lo faccio qui.. sai com’è.. meglio dirtele in privato certe cose
E perché? Parla, dai. :)
Finalmente un post… era da un pezzo che non ne vedevo su questo blog, il lavoro fatto da Alex e da Me è una piccola dimostrazione di come certi network e relativi autori vivano grazie all’autoreferenza dei link..
In sintesi linkandosi alcuni autori non si accontentano di avere l’ego appagato ma ritengono anche di essere autorevoli, ma non solo si mettono anche a scrivere libri, fare conferenze e similaria…ed infine a pontificare…
Ti inviterei a visitare i link nella top100 (tua o di ludo) e vedrai come scritto nel post sui nostri siti, è cosi.. poca qualità, molti link tra amci..commenti a zero..
Chiariamo: io scrivo il blog in primis per me e quindi affermo il diritto di scrivere ciò che mi pare. Corto, lungo, serio, faceto, argomentato o linkato che sia.
L’autoreferenzialità non mi pare quella che intendi tu e se qualcuno ci invita ai convegni e riteniamo opportuno andare non credo ci siano ostacoli.
I cluster sono una cosa comunissima nelle reti e pochi commenti non sono univocamente interpretabili come fai tu. Lurkare non è intrinsecamente un male.
Buona lettura. :)
Ma chi ti vuole togliere la libertà di scrivere cio che ti pare.. vai dove ti pare…lungi da me.
PS: A proposito di cluster e lurkare, La bolla 1.0 è già esplosa, non è che stai respirando ancora i fumi?
Classifiche di blog e riflessioni
Qualche commento veloce sull’ultimo post di Tony Siino (cui per comodità ho copiato il titolo) sulle classifiche di blog.
Nel creare una classifica è poco raccomandabile partire da una base numerica di blog limitata, per almeno un motivo: la c…
Tony, dici delle cose condivisibili ma tralasci, secondo il mio personalissimo punto di vista, alcuni punti fondamentali:
primo: una classifica dichiara U]cosa si propone di misurare; il blog più visitato, quello più autorevole, quello più votato, etc.
Senza questa precisazione iniziale di quale classifica stiamo parlando?
secondo: con che criterio selezioni i blog da inserire in classifica? la cosa è tutt’altro che secondaria sia perchè banali questioni di tecnicismi possono, per esempio, escludere interi blocchi di blog sia perchè dovresti definire a priori con che criterio distingui ciò che è blog da ciò che blog non è; e su questo punto la questione si fa pelosa assai; autolimitarsi a blog secondo criteri più astrusi (es. la presenza o meno dei feed, cosa per me sbagliata in linea di principio: è come se in una classifica di auto escludessi tutte quelle senza abs) mi pare un rimedio peggiore del male.
terzo: ci sarebbe da discutere sulla validità dei meccanismi di calcolo della classifica; Alexa e Technorati prendono delle sonore cantonate e falsano i risultati, per esempio
Ma questo del meccanismo di calcolo è un punto minore; se chiarissi i primi due punti avresti già raggiunto un risultato da premio ;-)
Carlo
Grazie per il tuo commento Carlo.
Quanto al primo punto le classifiche contano i link perché il dato che abbiamo è quello. Caricarlo di significati è per me un buon modo per finire per sbagliarsi.
Per la selezione dei blog su BlogItalia (la classifica è comunque un servizio per gli iscritti) il criterio è l’iscrizione: chi è iscritto a noi e a Technorati viene “misurato”. Non è il migliore criterio forse, anzi se dovessi suggerirne uno penso al respondent driven sampling. Non proseguo per non entrare in questioni metodologiche “hard”.
Il blog è un CMS?!
Oggi è ripartito alla grande il meme l’algoritmo per la classifica dei blog è fallace perchè [aggiungete la vostra…] .
Partendo dal presupposto che è tendenzialmente vero, in quanto creato da esseri umani, perchè prende dati statistici, qu…
Guardate questo blog in top100:
Il mio amico Antonio De Chiara, chiedeva in un commento come fosse possibile che un blog con una media inferiore a 400 visite giornaliere e con commenti quasi nulli fosse in top100 ( cliccate sul logo shinistat ):
http://www.webdomus.it/tao/?p=709
Oggi dopo la pubblicazione dell’articolo oltre a non aver mai risposto ha censurato la domanda commento del povero Antonio De Chiara.
Non entro nel merito del discorso tecnico..la posizione in classifica del mio blog la seguo distrattamente, la verifico cioè ogni tanto senza dargli molto peso, perchè credo che il valore di un blog, ed il suo potenziale interesse per eventuali inserzionisti pubblicitari, dipende più dall’avere un pubblico omogeneo, piuttosto che un’audience vasta ma assortita in modo dispersivo..
non posso fare a meno però di notare che nel secondo trimestre del mio blog, nato a gennaio, ho raddoppiato i contatti rispetto al primo, ma Techonati fa scendere il mio blog dalla centoventesima posizione circa del primo trimestre alla circa 300esima attuale.
Chiedo agli esperti: come funziona il meccanismo? meno lettori si hanno e più si sale? E viceversa?
Già che ci sono, segnalo un’ altra incongruenza: come fanno alcuni blog appartenenti a network a spiccare nella classifica “combinata” di tua creazione, se non sono i primi neppure nel loro circuito?
Se non sono primo su dieci, come faccio ad essere primo su mille? (mentre gli effettivi primi di questi network non appaiono neppure nei bassifondi della classifica generale?)..
posso fare questo discorso serenamente e super partes perchè purtroppo non mi sto riferendo al mio blog: molti colleghi di Blogosfere hanno molti più contatti di me..
Senza entrare nel tecnico, però, mi sembra che gli esempi che ho citato siano l’harakiri della logica più elementare!!
Ma se stiamo parlando di posizioni basate sul numero dei link che c’entrano commenti e visite?
Mai parlato di commenti. Ho sollevato un problema di carattere generale: la sensazione che i risultati sono dopati, alla luce di incongruenze evidentissime e facili da rilevare anche da un non tecnico come me. Dagli esperti mi aspetto spiegazioni scientifiche, ma per stigmatizzare che due più due non fa sette non ho bisogno della laurea in informatica o matematica…
Beh Ernesto…sono meno linkati evidentemente. Le query a Technorati sono riproducibili da chiunque e quindi il processo è assolutamente trasparente.
algoritmi? anomalie? sono ben altre le misure che ci interessano carino!
Ma perchè prima di fare appelli dall’alto dei tuoi seminari sull’open source a Palermo non rendi pubblico Blogitalia? Sarebbe un primo passo no?
Non mi pare che BlogItalia sia privato. ;)
La pena della classifica
Ieri è partita una divertentissima discussione tra sordi dedicata alla spinosa questione delle classifiche dei blog. Si parla, guardacaso, di affidabilità delle fonti (i blog stessi), di definizione di blog e ci si rintuzza tra gelosie varie e quant…
a dire il vero io rientro nelle statistiche di alexa e non mi pare di avere mai aggiunto nessuna “alexa bar”.
Mau tu rientri come tenutario di blog. I dati del tuo blog vengono contati in base a quanto lo visitano gli utenti con le barre installate.
In caso il trackback non arrivi e ti fischiano le orecchie, passa da me ;-)
Bene mi dai l’indirizzo ftp che scarico il sorgente allora..
Eccoti l’indirizzo: http://ftp.nonèmicaunprogramma.blogitalia.it. ^__^
So che non è un programma è un’applicazione web.
Visto che blogitalia dici che non privato sarebbe giusto che rendi pubblici i sorgenti,no? magari la comunità open che tu conosci attraverso la frequentazione dei due seminari a Palermo lo può migliorare.. no? oppure il concetto open per te è “quello che è mio è mio, quello che è tuo è mio”..
Scusami ma adesso ho la riunione della setta dei blogger ma linkonici con Mantellini e gli altri. A dopo! :)
Vedi tony, fare lo sbruffone e prendere in giro, non rispondere alle domande ed evitarle, non ti fanno onore. mi sarei aspetto almeno un contradditorio, si vede che è il tuo modus quando capisci che non hai argomenti per pontificare…
Non è che non ti voglia rispondere. Per quanto mi riguarda il codice che genera le pagine di BlogItalia te lo posso pure dare ma senza dati che te ne fai? Non voglio continuare questa discussione a due perché la trovo balneare e inutile per come è declinata e da un po’ di interventi non ti poni garbatamente e sei cospirazionista…e poi, come ti ho detto, siamo in riunione con la setta ché dobbiamo decidere a morra cinese a chi toccano i link oggi! Un po’ di tatto! :P
Tu incomincia a rendere veramente open tutta l’applicazione blogitalia, poi deciderò magari passo la serata a leggere codice anzichè la gazzetta.. come sai non è importante cosa ne faccia.. lo pubblichi con la sua bella licenza e vedrai no? Poi come lo scarico io potranno farlo miliardi di persone..cosa fai chiedi a tutti cosa ci fanno?Non lo hanno spiegato ai due seminari di palermo, come funziona l’open source?
Per quanto riguarda la mancanza di rispetto delle persone ..comunque vedo che continui,eppure sei siciliano e qualcosa nel DNA dovresti ancora averlo. Sai che nn c’è nessuna teoria dei blogcospiratori o altre fesserie…se pensi di deligittimare chi la pensa diversamente da te,dileggiandolo, vai avanti..pensavo di trovare una persona preparata ed in grado di fare un confronto costruttivo…ma sembri piuttosto il classico “personaggio ” tutte chiacchere e distintivo…
Resto in attesa dell’indirizzo del server ftp
yup, me ne sono accorto dopo che la barra serve a chi mi contatta per indicare ad Alexa che mi ha contattato. Mi sembra un sistema strano per calcolare la popolarità, ma chi sono io per giudicare?
Apre il blog della Top100 italiana
Arriva finalemente il blog della “Statistica dei blog italiani” (ex Top 100) di Ludovico, proprio mentre si scatenano le polimiche.
C’è chi ne mette in dubbio la buona fede e tenta di sabotarla a scopo dimostrativo, chi ne fa un’analisi di orientamento p