Archivo de la etiqueta: CompareBlogs

Bye, bye CompareBlogs…

A veces es necesario poner un poquito de orden en tu vida y cerrar algunos capítulos para poder ir avanzando en otros.

Es algo parecido a esas ex-novias que sigues viendo y que sin darte cuenta te impiden pasar página y emprender nuevas relaciones.

Con CompareBlogs aprendí muchísimo: de bases de datos, de xml, de feeds, de opml, de codificación de texto, de importación de datos, de creación de ficheros, de parseado, de apis, de blogs… tal vez lo más importante que aprendí es que sabía y sigo sabiendo muy poco (como la gran mayoría) pero que investigando y estudiando se puede conseguir salir de casi cualquier atolladero. 

Aprendemos cuando tenemos un problema que resolver.

Invertí muchas pero que muchas horas en él, pero llegado un punto deje de tener esas horas y se fue quedando viejuno. Los dos últimos agostos en los que he tenido un respiro intenté levantarlo de nuevo, tenía muchas ideas -algunas creo que buenas- pero o yo programo muy lento o el día no tiene suficientes horas (supongo que una mezcla de ambas)… en seguida se me echó encima septiembre y otra vez sin tiempo para nada que no de dinero.

Este fin de semana por fin me he decidido a hacer lo que llevaba rumiando desde hace meses: he abierto una nueva sección en mi blog ”Blogosfera” y he volcado en ella todos los blogs de CompareBlogs clasificados (no todos) con acuerdo a su temática.

Me sigue interesando el tema de los blogs y voy a seguir escribiendo sobre ellos pero a partir de ahora voy a intentar no dispersarme e intentar concentrar todos mis experimentos dentro de FernandoPlaza.com, también intentaré compartir todas las pequeñas aplicaciones que programe y crea que puedan ser útiles para el resto: así devuelvo un poquito de todo lo que me ha dado Internet.

Blogosfera: Google PageRank vs Technorati Rank

Analizamos en este gráfico Google PageRank vs Technorati Rank en 384 blogs de CompareBlogs y vemos qué web se comportan de manera anómala. Datos actualizados con el nuevo PageRank a 28 de sept de 2008

Desde que estuve utilizando el API de Technorati sigo con bastante atención la evolución de mi (mediocre) posición en el ranking de Technorati con acuerdo a los blogs que me van enlazando. 

Aprovechando que hoy se ha actualizado el PageRank de Google se me ha ocurrido que sería interesante relacionar en un gráfico las dos magnitudes, echando mano de la base de datos de blogs de CompareBlogs.

Antes de nada decir que me sentiría mucho más cómodo si un analisis de este tipo lo hiciera gente que sabe más que yo sobre numeritos, ley de potencias y matemáticas en general como fernand0, JJ o rvr… pero ya se sabe que a falta de pan buenas son tortas y por si alguien se anima al final del artículo adjunto excels y csv con todos los datos.

Mi análisis personal

Evidentemente existe una relación entre las dos magnitudes, con muchos blogs que se comportan de la manera predecilble: cuanto mejor están posicionados en el ranking de Technorati mayor PageRank tienen.

No obstante hay algunas webs con resultados atípicos.

Dentro de aquellos blogs analizados con ranking por debajo de 1000, la mayor parte de ellos tiene Pagerank 7 y 8… los menos 6 y sólo vemos un punto discordante que corresponde a La Mate por un Yogur, que tiene a día de hoy Pagerank 4 y sin embargo tiene rank 47. También destaca Kirai con Pakerank 4 y con un muy buen 1645 ranking en Technorati.

También podemos encontrar un grupo de blogs discordantes con PageRank 8 y sin embargo no tan bien posicionados en el ranking de Technorati, son Instapundit, Eschaton y Blogger Buzz… y el que más se sale de la gráfica Librarian´Internet Index.

Bajando a blogs con Pagerank 7 y no tan bien posicionados en el rankig de Technorati tenemos a fernand0, Google Base Blog y Bambino.

Supongo que esto da para mucho análisis y alguna que otra conclusión.

Datos del experimento:

  • Datos con gráfica en Excel
  • Datos en formato CSV (sin gráfico)

Delicious PostLinks, para crear posts de enlaces recomendados

Delicious PostLinks es una pequeña herramienta que accede a tu feed público en Delicious y te genera el código para pegar en tus entradas de enlaces recomendados.

Aprovechando que hoy es el día de los Blogs, me gustaría compartir con vosotros una pequeña herramienta que he programado para crear mis posts de enlaces semanales, la he llamado Delicious PostLinks y está alojada en CompareBlogs:

¿Qué es y para qué sirve Delicious PostLinks?

Enlazar periódicamente entradas interesantes de otros blogs es un hábito muy recomendable y una práctica muy extendida entre algunos de mis bloggers favoritos: Javier de Loogic,  Antonio Ortiz de Error500, J.L. Orihuela de eCuadernoCarlos Blanco, Fernando Polo… etc.

Delicious PostLinks es una pequeña herramienta que accede a tu feed público en Delicious y te permite realizar pequeños cambios para poder publicar tu listado de enlaces recomendados en una manera fácil, rápida y sencilla.

¿Cómo funciona?

1 – El peso de todo el trabajo recae en Delicious de Yahoo!, si como yo, ya tienes cuenta perfecto! Si no tienes, necesitarás crearte una, te recomiendo que te instales el plugin para Internet Explorer o el de Firefox (que es aun mejor).

2 – Se trata de que según vayas revisando los blogs que lees, añadas a tu cuenta de Delicious los enlaces que luego te gustaría compartir con tus lectores de tu blog. Con los plugin es realmente sencillo y la única precaución que debes tener es la de guardar la URL de entrada concreta (permalink) y no la Home del blog o la URL de tu agregador.

 

3 – Al guardar el enlace, además de poderle asignar etiquetas puedes almacenar un fragmento del artículo que te ayude a recordar de qué trataba (también puedes redactar tú una pequeña descripción… pero se trata de tardar el menor tiempo posible, por eso yo siempre utilizo un fragmento del propio artículo).
4 - Guárdate en favoritos Delicious PostLinks: www.fernandoplaza.com/apps/delicious/ y así podrás acceder a ella rápidamente. Sustituye mi nombre de usuario en Delicious (fernandoplaza) por el tuyo y verás como aparecen tus últimos enlaces públicos, con el desplegable puedes ver hasta 15 enlaces.Si lo deseas puedes realizar un filtro de tus últimos enlaces por una o varias etiquetas, para ello tienes que intrucir en la casilla tu nombre de usuario y después de una “/” la etiquetas separadas por +. Por ejemplo: compareblogs/geek+linux

5 – Actualmente con Delicious PostLinks puedes: 

  • Eliminar enlaces que no quieras publicar: marca el checkbox de las entradas que quieras borrar, pulsa actualizar y desaparecerán (los enlaces no se borran de delicious).
  • Modificar el título y la descripción de un enlace: realiza todos los cambios que necesites en las entradas y después pulsa en actualizar, puedes cambiar el título o la descripción de varios enlaces al mismo tiempo.
  • Incluir el autor o el origen de la entrada: si no lo rellenas no pasa nada, algunos blogs incluyen el nombre del blog en el título de la entrada, queda mucho más claro mover esa información a su apartado correspondiente (algo que se puede hacer muy rápido seleccionando y arrastrando).
  • Previsualizar como quedará el resultado.
6 – Una vez que has terminado de hacer todos los cambios pulsa en “actualizar” Delicious PostLinks crea el código con la lista de enlaces, incluyendo en el title del enlace la descripción del enlace.
 7 – Crea tu entrada: Pulsa en “seleccionar todo para copiar”, si usas Internet Explorer el código de la entrada pasará directamente a tu portapapeles, si estás en Firefox tendrás que utilizar el método tradicional (Ctrl+C o botón derecho del ratón: Copiar). Entra en tu sistema de publicación (Blogger, WordPress, Movable Type…) y pega el código dentro de tu entrada en la vista HTML. 


Espero que os resulte útil y que os ayude a ahorrar mucho tiempo… ese es el objetivo.

UTF-8, probado, probando… 漢音

Estamos migrando el charset de todos nuestro CMS a UTF-8 y con ello el de todos los blogs que gestionamos con él.

Hasta el momento utilizábamos ISO-8859-1 (latin1), que para escribir en español va de maravilla, pero más allá de eso no da más de si y para CompareBlogs necesitamos más porque tenemos usuarios que han dado de alta blogs en muchos idiomas y cuando intentamos importar sus tags o cualquier otra información de las apis de delicious, technorati o bloglines nos encontramos con que muchas veces no podemos hacerlo porque el contenido ha sido escrito en griego, japonés o quién sabe.

El cambio lo intentamos hace ya bastante tiempo pero nos dimos de bruces con un impedimento que parecía insalvable, todo nuestro código está escrito en Vbscript y utilizamos ODBC para conectarnos a mySQL y el conector que había en ese momento (MySQL Connector/ODBC 3.51) no era compatible con UTF8. 

Por suerte desde principio de año ya está disponible el nuevo conector/ODBC 5.1  que parece que sí es compatible. Como siempre, las pruebas las está sufriendo este blog y vosotros que me leéis.. y cuando aquí todo vaya bien iremos realizando el cambio en el resto de webs.

El procedimiento ha sido el siguiente:

1 – Leer los siguientes artículos, para refrescar mis parcos conocimientos:

2 – Hacer una copia de seguridad de la base de datos de este blog, abrir el archivo resultante (.sql) con ultraEdit y guardarlo con otro nombre en formato utf-8. Modificar el charset en la sentencia CREATE TABLE, cambiando “latin1″ por “utf8″.

3 – Crear una base de datos nueva (en mySQL 4.1 o superior) e importar el archivo modificado. Ahora los datos de los que se alimenta la web deberían estar todos en UTF-8.

4 – Ahora hay que modificar el meta tag del charset y cambiarlo a utf-8. De esa manera le diremos al explorador que nos visite, que nuestra página está escrita en utf8.

Generando ficheros en formato UTF-8

Una de los problemas que me he encontrado es a la hora de generar los feeds, ya que hasta el momento los metía en una variable y luego el contenido de esa varible lo volcaba en un fichero de texto con FSO (FileSystemObject)

Set fso = CreateObject("Scripting.FileSystemObject")
Set myFile = fso.CreateTextFile(ruta_archivos & FOLDER_ATOMXML & "" & post_uri & ".xml", True)
myFile.Write(entry_v)
myFile.Close

Que funcionaba perfectamente, pero que para crear archivos UTF-8 no vale, por lo que lo hemos tenido que cambiar por algo como esto:

Set fsT = CreateObject("ADODB.Stream")
fsT.Type = 2   'Specify stream type - we want To save text/string data.
fsT.CharSet = "utf-8" 
fsT.Open
fsT.writetext entry_v
fsT.SaveToFile ruta_archivos & FOLDER_ATOMXML & "" & post_uri & ".xml", 2
fsT.close
set fsT= Nothing

Asi que os seguiré contando como va esta aventura, que supongo que me terminará dando más lata de la que pienso.

Organizando la blogosfera, en serio…

Es dificil clasificar un blog, salvo los de temática muy concreta: Marketing, Coches, Gadgets… la mayor parte de los blogs habría que archivarlos en Inclasificables.

En muchas ocasiones ni sus propios autores saben de qué tratan sus blogs, citando a Pablo, el hombre bi-reto: “Si supiese de que va mi blog, sabría hacia donde dirigir mi vida”.Pero el que no te sepas definir a ti mismo es algo normal, normalmente las personas que te rodean sabrán mejor cómo eres (salvo tu familia). Muchos de tus lectores ya te han diseccionado y clasificado:
  • colocándote dentro de una carpeta concreta dentro de sus feeds (en la captura superior: etiquetas con fondo azul a la derecha).
  • otros te han guardado y etiquetado en delicious (etiquetas amarillas)
  • y tú mismo te has ido etiquetando cuando archivabas tus posts dentro de ciertas categorías, una información que si has utilizado correctamente el microformato adecuado algunos servicios como Technorati habrán capturado (etiquetas verdes).

Uniendo esa información y ponderándola con acuerdo al número de veces que se ha utilizado esa precisa etiqueta, podemos hacernos una idea de cuál es la temática de un blog. No obstante, las etiquetas tienen tres limitaciones importantes:1 – Se requiere un gran volumen de etiquetado (folksonomy) para poder obtener conclusiones mecanizadas acertadas, e incluso en sitios como Delicious donde hay miles de usuarios etiquetando, algunos blogs sólo han sido guardados un par de veces, por lo que confiar en que esas etiquetas son correctas sin una supervisión manual-humana es un poco arriesgado. Por cierto, que todos los sitios dados de alta en CompareBlogs están ya volcados en Delicious con todas nuestras etiquetas y otras tantas que hemos ido recuperando de varias fuentes.

2 – Algunas etiquetas en esencia significan lo mismo, pero eso de manera mecanizada no es sencillo deducirlo. Por poner un ejemplo sencillo: blog, blogs, weblogs, weblog, bitácora, blogger, bitácoras, blogging, blogosfera… son etiquetas muy populares cuando se clasifican blogs y todas ellas significan lo mismo: se deberían sumar, a la hora de valorar su peso dentro del volumen total de etiquetas utilizadas.

Para paliar con esto Delicious tiene los “tag bundles”, en esencia se trata de etiquetar etiquetas. Cuando le pregunté a Nacho Puell cómo lidiaban con esto en 11870.com me comentó que ellos generaban “clusters de etiquetas” y así es como lo hemos llamado nosotros también en CompareBlogs (abajo en azul los clusters, y el número de etiquetas que agrupa cada uno):

3 - La etiquetas no son jerárquicas -por definición-. Lo mires como lo mires, de manera mecanizada es difícil deducir una jerarquía de un etiquetado. Los directorios jerárquicos son mucho más exactos en ese aspecto, en TopMadrid nosotros utilizamos un directorio jerárquico para clasificar los establecimientos de los que escribimos, por ejemplo: Hogar y Jardín en Madrid > Muebles > Muebles de Baño.

Pero este sistema tiene muchas desventajas y genera verdaderos quebraderos de cabeza, por lo que para organizar los blogs estamos optando por un sistema híbrido: a los blogs se les etiqueta con información obtenida de distintas fuentes, a su vez esas etiquetas se agrupan en clusters de etiquetas y esos clusters se organizan jerárquicamente… Este sistema una vez lo hayamos testeado suficientemente nos gustaría poder exportarlo a TopMadrid y DolceCity.

CompareBlogs: balance a día de hoy

Antes de ver si definitivamente cerramos el libro o abrimos un nuevo capítulo, hacemos un pequeño balance de las debilidades que tenía CompareBlogs como servicio.

No me cabe duda de que en CompareBlogs llegamos a generar valor real, prueba de ello fue la cantidad de enlaces y apoyo que recibimos desde el primer momento. Aprendimos muchísimo programándolo y aun hoy aplicamos en otros desarrollos la experiencia que adquirimos gestionando toda esa información. 
 
El problema de CompareBlogs es que era un servicio que obtenía todos los datos de agregadores (Bloglines, Feedness, Rojo, Feedburner, Odeo…), algunos de ellos de muy reciente creación y en cierta manera más que un mashup éramos un servicio “parasitario” ya que en su mayoría todas estas fuentes no disponían de APIs sobre las que desarrollar algo estable y con garantías de continuidad. 

Por esa razón mantenerlo en funcionamiento resultaba muy costoso: el menor cambio en la fuente de datos de origen suponía invertir muchas horas en revisar el código, y salvo en Bloglines estos cambios 2.0 eran muy frecuentes. Además tuvimos que tirar a la papelera funcionalidades enteras cuando Feedness interrumpió el servicio o cuando Rojo y Odeo dejaron de compartir la información sobre sus suscriptores: este tipo de cosas resultaban bastante frustrantes.

Para escapar de esa dependencia empezamos a realizar experimentos a partir del contenido generado por los propios blogs y fue cuando todo se terminó de desmadrar: el volumen de datos que se generaba diariamente era enorme, más aun teniendo en cuenta que muchos experimentos estaban basados en un análisis comparativo histórico, lo que nos obligaba a procesar y luego almacenar absolutamente todo.

La puntilla final nos llegó con el anuncio de la nueva versión de Bloglines, que no tenía -y sigue sin tener- ni pies ni cabeza: ¿donde está la lista de suscriptores? ¿los perfiles de usuario? ¿y los blogroll públicos?… por suerte nuestro querido `Bloglines Classic´ sigue manteniéndose una año después en primera línea, pero todo apuntaba a que la mecha se agotaba a la vuelta de la esquina… y con lo liados que estábamos con nuevos proyectos teníamos que medir bien nuestras fuerzas.

Algo parecido a lo nuestro creo que le pasó a top.blogs.es, aunque CompareBlogs nunca fue ranking me puedo hacer una idea de la cantidad de datos que necesitaba engullir top.blogs.es cada vez que se actualizaba… a parte que el desarrollo no era exclusivo de WSL por lo que me imagino que si revivirlo implica desviar la atención de otros proyectos más interesantes para el negocio es normal que por el momento se haya discontinuado.

Siguiendo con los rankings, el de Alianzo sigue activo aunque mi impresión es que sufre un poco de `falta de competencia´, otros tipo Wikio o Bitacoras a mi personalmente como servicio no me aportan mucho, pero claro es que no aparezco en ninguno de ellos

En general un ranking como proyecto no me atrae en absoluto, debe ser aburrido. La blogosfera sigue ofreciendo muchísimas posibilidades más interesantes: hay cosas que todavía no se han conseguido y que vendrían muy bien a todos los bloggers.

Prediciendo qué blogs vivirán y cuáles perecerán

Hemos concluido la primera limpieza de los blogs de CompareBlogs y ya hemos iniciado la integración en nuestro CMS: el mismo que mueve TopMadrid, DolceCity y mi blog personal.

Tras revisar los 736 blogs y podcasts que estaban dados de alta en CompareBlogs (actualmente en reposo), hemos borrado todos aquellos que ya no estaban on-line o que llevaban mucho tiempo sin publicar y también hemos actualizado las direcciones de los que han movido su blog.

Teniendo en cuenta que la mayor parte de ellos se dieron de alta en el 2005 habíamos asumido que tras la limpieza nos íbamos a quedar con menos de la mitad… al final esto de bloguear se termina dejando ¿no? Pues parece que no, después de 3 años sólo hemos retirado un 10%: los blogs que en su día seleccionamos gozán en su mayoría de buena salud, algo que me ha alegrado mucho.

En una segunda fase de CompareBlogs y tras ver los rasgos comunes de aquellos blogs que han quedado en el camino, yo afinaría aun más los criterios de selección para las nuevas incorporaciones:

Blog en dominio propio: ni alojados en blogspot, ni en bitacoras, ni similares… una gran parte de los blogs que hemos retirado estaban alojados en estos CMS o estaban colocados en subcarpetas de otros dominios. La migración a un dominio propio es la evolución natural de todo blogger pertinaz. Contratar un dominio y alojamiento para tu blog es una decisión de compromiso con tu proyecto… y me parece un requisito duro pero justificado.

Cierta antigüedad: un año de actividad estaría bien, aunque creo que nos podríamos conformar con seis meses. La proporción de procastinadores y egomaníacos en la blogosfera debe ser muy alta y también las fiebres de tipo: “acabo de crear mi blog y voy a darlo de alta hasta en la sopa“. Frenemos esos impulsos iniciales para que el tiempo desgaste los ánimos de los no comprometidos.

Page Rank: Ya, ya… que el tamaño no importa. Hoy el techo de la blogosfera española se encuentra en PR6, considero que limitar la entrada a blogs con al menos PR3 no es excesivamente rígido, sólo requiere un poquito de constancia y algunos enlaces externos relevantes.

Algo de Contenido: Al inconstante se le da muy bien hacer el mejor artículo de su vida para luego una vez alcanzadas las cotas más altas de calidad abandonar el blog. Algo de contenido, digamos un mínimo de 100 entradas son de nuevo una prueba de compromiso con el proyecto. 

Blog Vivo: Aquí yo fijaría dos criterios: uno para entrar y otro para ser expulsado. Más de seis meses sin actualizar el blog es como para llamar a la grúa… y para valorar la indoniedad de un nuevo miembro yo exigiría una actualización no inferior a unas cuatro entradas mensuales, sin interrupciones excesivamente prolongadas.

Suscriptores: Si todo el mundo utilizara Feedburner sería sencillo y conveniente fijar una circulación mínima de unos 100 ó 200 suscriptores, en CompareBlogs en su día exigíamos 100 suscriptores en Bloglines (algo que puede llevar bastante tiempo conseguir dependiendo de la temática del blog). En cualquier caso, dado que es dificil aglutinar de manera automatizada el número total de suscriptores… yo reservaría este criterio para tomar decisiones en caso de duda.

Y luego claro está, se debe de disponer de cierto margen para las excepciones… aunque cuantas menos mejor.

pd - por cierto, tras aplicar estos filtros quedarían fuera todo mis mediocres oponentes del reto blogger

Un día en la blogosfera by Feedpics

Como ya he explicado aquí alguna vez Feedpics es un sencillo agregador que captura las imágenes que se publican en más de 700 blogs, las almacena y crea thumbs a partir de ellas. A través de un API -actualmente en beta- o desde CompareBlogs uno puede incluir esas imágenes en su web: cómo una especie de índice visual de lo último publicado en su blog.

Éste es un fragmento de una captura con las últimas 1050 thumbs generadas por Feedpics:

Resulta interesante echar un vistazo a estos paneles: si observas con detenimiento puedes ver los últimos “temas calientes” en la blogosfera: RocketBoom, el cabezazo de Zidane, el estreno de Superman o el lanzamiento del nuevo Firefox… a veces la misma imagen se repite en seis o siete blogs (algo bastante frecuente en blogs de gadgets, de cine o de noticias).

Si fuera John Nash, el de “Una mente maravillosa” tal vez podría encontrar algún código oculto o sacar alguna conclusión más interesante…

Feedpics: últimas beta-pruebas ¿quieres participar?

Ya llevamos una semana de pruebas oficiales con Feedpics, y por ahora todo va muy bien… tanto es así que nos gustaría probar a meter Feedpics en aun más webs antes de liberar el API definitivamente.

El funcionamiento de Feedpics es muy sencillo, copias unos CSS con los que puedes controlar el aspecto y un código con la configuración que deseas y ¡Boom! (como diría Steve Jobs)… ya está funcionando en tu página.

¿Para qué sirve Feedpics?

Feedpics es un índice visual de tus últimos posts que colocado en tu sidebar o barra lateral (o donde tú quieras) se convierte en un reclamo para que tus visitante realicen una visita más profunda de tu web o para que desde posts antiguos sepan lo último de lo que has estado hablando.

El aspecto estético de Feedpics es bastante atractivo y se puede configurar totalmente con CSS, nosotros nos quedamos con 1 de cada 10 imágenes por lo que si incluyes menos de 10 sólo aperecera un “by Feedpics” en pequeñito.

Nosotros nos ocupamos de obtener las fotos de tu blog, alojamos las thumbs y actualizamos el contenido de la rejilla, por lo que no te tienes que preocupar de nada y la transferencia de tu servidor no se va a resentir.

¿Y la gente hace click?

Pues sí, nosotros lo tenemos instalado actualmente en nuestra guía, por ejemplo en la sección de masters en Madrid y mostramos en la rejilla de Feedpics las novedades del blog. Éstas son las estadísticas del rendimiento de Feedpics (a las que tu tendrás acceso en tiempo real cuando instales el código):


El porcentaje de clicks es de entre el 1,75% y el 1,99% con la rejilla de 2×4 (dos columnas con cuatro thumbs por columna). Yo esto lo valoro de la siguiente manera, he introducido algo que no queda mal y que me ha enviado 149 visitas al blog… visitantes que puede que de otra manera no hubieran navegado más por mi página porque es más que probable que hayan llegado desde Google.

El porcentaje de eficacia depende del contenido de las fotos, del posicionamiento dentro del diseño de tu página, del número de thumbs y de la relación contextual… jugando con estas variables se podría aumentar aun más el rendimiento de Feedpics (al fin y al cabo no hay mucha relación entre masters en Madrid y la última tienda que ha abierto Zara en Madrid o el mejor spa de la ciudad, que es del tipo de cosas que hablamos en TopMadrid).

¿Quieres ser Beta-Tester?

Pues contacta conmigo y te enviaré todo lo que necesitas, el único requisito es estar dado de alta en CompareBlogs… si aun no estás dado de alta y tienes más de 50 suscriptores en Bloglines sumando todos tus feeds puedes darte de alta ahora mismo.

PD. Puede que ya contactarás conmigo interesado en ser beta-tester de Feedpics, si todavía no te he enviado las instrucciones vuelve a enviarme un e-mail porque se me ha debido de traspapelar tu dirección y disculpa las molestias.