Sopa de bits » Blog » Sitios sociales atacados por el spam... o la caquita del perro del vecino
30
abr 2007

Sitios sociales atacados por el spam... o la caquita del perro del vecino

Connotea parece estar siendo atacada por el spam, y por lo que me envían al correo de mi cuenta, creen que yo soy uno de los causantes. Desde luego se trata de un error, pero de momento se han cargado todos mis enlaces.

Más allá de esto, creo que los sitios de enlaces van a tener que cambiar de política para evitar el spam que deben de estar sufriendo. Creo que no les será difícil determinar que no es tan importante cargarse cuentas de usuarios, como lo podría ser identificar fuentes de contenidos (dominios, por ejemplo) poco fiables.

 

El usuario no es un buen indicador de spam

Probablemente la característica diferenciadora de Connotea (pongamos que respecto a del.icio.us, por ejemplo) sea que tiene detrás un grupo editorial muy potente. Eso es algo que supongo que se toman muy a pecho los responsables del sitio: ¿Connotea debería ser el sitio escogido por científicos para organizar sus enlaces favoritos? Alguien les ha contado al grupo Nature lo que es la web 2.0?

Yo me lo imagino así: alguien decide montar una plaza pública donde los usuarios se supone que pueden entrar, y realizar una serie de actividades bajo una serie de condiciones de uso. Bueno, hasta ahí todo perfecto... El problema es que alguien entra con un perro que... se hace caquita. ¿Y ahora qué? Dónde queda lo de web social? Alguien saca a relucir los términos y condiciones del sitio (ese texto que casi nadie lee) para eliminar la cuenta del usuario.

Vale: cuenta eliminada. El usuario perrito43 borrado. Uy! Se ha dado de alta perrito44 que... también se ha hecho caquita.

Da igual si perrito43 y perrito44 son el mismo usuario. Ahora resulta que sabemos lo que no nos gusta, y por lo tanto podemos filtrar de un modo u otro lo que otros usuarios filtran en el portal en concreto. Pero jamás lo podremos hacer en tiempo real, y en cualquier caso, no saldrá rentable. Así que no hace falta que nos agobiemos tanto por este tema.

En el fondo, lo que hay que tener en cuenta en los términos y condiciones del sitio es que los responsables del matenimiento no se pueden hacer responsables del contenido que ponen sus usuarios. Y también poner a disposición de otros usuarios la posibilidad de reportar enlaces con contenidos poco éticos o... malolientes.

Reutilizar tecnología digital puede no ser ecológico, pero sí útil

Lo que sí es importante es saber reutilizar la tecnología que existe para el spam. Así, si disponemos de sistema de detección de spam para el correo electrónico, qué tal si lo utilizamos para reportar la posibilidad de spam en enlaces añadidos en los servicios de favoritos?

Desde luego el criterio del número de destinatarios no es válido, pero sí que lo puede ser la relación entre el contenido del título del favorito, los tags utilizados, y el contenido final de la URL de destino. Si a eso sumamos el usuario que ha originado el enlace, ya tenemos suficientes indicadores para mejorar la tasa de spam que pueda generar un usuario concreto,

Por lo que he comprobado en del.icio.us, el secreto está en no superar un número máximo de enlaces spam para una etiqueta determinada. Parece que luego pasas desapercibido.

Probablemente la siguiente evolución podrá ser el uso de arañas para inspeccionar el contenido del enlace añadido al sistema, para determinar el nivel de relación entre las etiquetas y el contenido indexado. Desde luego, el sistema deberá detectar la diferencia de idiomas entre las etiquetas y el recurso, pero dado que las palabras indicadoras de spam pueden ser fácilmente reconocibles, es posible que con un tiempo relativamente corto de ajustes, el sistema pueda empezar a tener buenos resultados en procesos de filtraje.

Comentarios

Se han cerrado los comentarios para esta entrada