Páginas 1
31
may 2008

Las cinco tendencias en el tagging

Sacándole minutos al sueño me permito reseñar una noticia que he leído sobre una conferencia que tuvo lugar el pasado 30 de Abril de 2008 en la IA SUMMIT 2008.

El comentario en sí viene a raíz de Tagging: five emerging trends.

Yendo al grano:

  • El mercado quiere (por no decir "necesita") estructura. Es decir, según el mercado, las mejores etiquetas son las que representan mejor la estructura (las menos ambiguas).
  • Hay espacio para todos los grados de estabilidad y obsolescencia. Es decir, tienen que haber conjuntos de términos y conceptos que permitan establecer una base sólida, mientras que otros conjuntos de términos serán volátiles y estarán más enfocados a la innovación. Estas capas de actividad, más que cohabitar, se integran y son moderadamente permeables.
  • Combinación de lo humano y lo automático. Ninguno de los extremos es adecuado.
  • La comunidad (y lo que comparte) determina el uso de los tags y por lo tanto es un factor importante a tener en cuenta para definir los tags.
  • Los tags son una fuente de innovación por la capacidad de interacción que dan a los usuarios.

Desde luego, suena a algo, ¿no? Algunos dicen que se ha reinventado la catalogación como quien reinventa la rueda.

03
mar 2008

Clustering en recursos corporativos y generalistas

Pueden existir diferencias notables entre colecciones de recursos etiquetados a nivel corporativo y los que han sido etiquetado en un ámbito más generalista. Actualmente, con el uso de feeds y la profusión de servicios de bookmarking social, puede tener lugar la golosa alternativa de fagocitar recursos ya etiquetados por otros dentro de la colección corporativa.

Lo que pasa es que las características internas de un conjunto de recursos etiquetados pueden variar según su origen, enfoque y la variedad de usuarios que lo utilizan.

El artículo clustering tags in enterprise and web floksonomies (Simpson, 2008) explora esas posibilidades considerando dos colecciones paradigmáticas, y dos algoritmos de clustering.

 

03
ago 2007

Organización de la información personal III - estructuración de los directorios

Después del post sobre la eliminación de los archivos duplicados y el de las dos visiones en la organización de la información, ya llegan las fases más manuales del proceso de organización de los archivos. Es una tarea que requiere de tu completa implicación, y que por lo tanto es lenta por definición, pero no tediosa: reorganizar documentos implica revisar todo lo que pasa o ha pasado por tus manos, con lo que es un buen ejercicio para refrescar la memoria. También es un momento para descartar...

Quizá te sirvan los criterios que he utilizado para reorganizar mi información personal...

05
jul 2007

Cadena trófica: Fagocitar, rumiar y digerir información

Hoy ha sido el último día de exámenes de este curso académico, y el examen ha sido uno de esos pocos donde sabes que hay quien desarrolla con esmero su actividad pedagógica. Eso es de agradecer. Pocos profesores harán un examen personalizado (sí sí, personalizado: un alumno, un examen), en el que no sólo deberás esforzarte por responder, sino que vas a sacar conclusiones interesantes sobre lo que sabías hasta ahora.

Ante la pregunta "Crees que los usuarios del servicio X solicitan un tipo de información tan básica? No sería posible pensar que lo que demandan es una información con mayor grado de síntesis, que es más fácil de asimilar y aplicar?"...

Mi respuesta ha incluído el concepto de cadena trófica...

 

20
jun 2007

La teoría de la relevancia en lingüística

En el post sobre el concepto de la pragmática, se comentaba el hecho que existe un aspecto de la codificación del mensaje que se centra en la postura del emisor, y no del código. Para evitar al máximo los errores de decodificación del mensaje, Grice proponía sus máximas y su principio de cooperacion que en resumen venían a decir: "si quieres que te entiendan, se claro, conciso y directo".

Después es necesario identificar ese factor de ruido y determinar una posible vía de solución, siempre dependiente del consenso entre emisor y receptor.

Para cerrar el tema estricto de la pragmática, vale la pena comentar que en el artículo sobre ciberpragmática se analiza la temática del procesamiento del lenguaje natural en entornos de comunicación de poca calidad comunicativa (comunicación por texto, o voz, sin capacidad para percibir gran parte del lenguaje verbal), se establecía que esa situación exponía a cierto nivel de desconcierto a los usuarios. En algunos casos, la reacción es aprovechar ese nivel de intimidad para convertir en sistema un conjunto de falsedades que generan una identidad virtual.

Aunque estoy más interesado por la comunicación escrita, es un artículo interesante por lo que expone en cuanto a la relación entre comunicación, identidad e intimidad. En el momento que una persona tiene la opción de descartar su parte pragmática de la comunicación, puede dejar de lado su propia identidad, reservando la identidad.

Alrededor del 1986, Sperber y Wilson definieron la teoría de la relevancia como la teoría que estudia la forma como los usuarios valoran la relevancia de un mensaje en base a la decodificación.

A diferencia de la pragmática, que tiene una base más filosófica, la teoría de la relevancia tiene una base más empírica, y en cualquier caso (aunque se asume que la relevancia en sí no es cuantificable) establece los objetivos básicos del emisor y receptor, además del análisis de la comunicación para la maximización de la relevancia.

Pues nada, espero que las siguientes aportaciones os sean relevantes ;-) ...

21
may 2007

Sitios sociales y Spam: buscando referencias

En referencia al artículo sobre los sitios sociales y el spam, he estado buscando también información. Sobretodo referencias que puedan relacionar herramientas como los Antispam, y los algoritmos de cálculo de la relevancia en la recuperación de la información. Sirva lo siguiente como pequeña recopilación de recursos...

 

30
abr 2007

Sitios sociales atacados por el spam... o la caquita del perro del vecino

Connotea parece estar siendo atacada por el spam, y por lo que me envían al correo de mi cuenta, creen que yo soy uno de los causantes. Desde luego se trata de un error, pero de momento se han cargado todos mis enlaces.

Más allá de esto, creo que los sitios de enlaces van a tener que cambiar de política para evitar el spam que deben de estar sufriendo. Creo que no les será difícil determinar que no es tan importante cargarse cuentas de usuarios, como lo podría ser identificar fuentes de contenidos (dominios, por ejemplo) poco fiables.

 

14
abr 2007

Lógica borrosa y tagging (I)

La lógica difusa (o borrosa) es una disciplina más conocida entre la ingeniería que entre las matemáticas. Su base conceptual hay que buscarla en la teoría de los "fuzzy sets" o conjuntos difusos, propuestos en 1965 por Lofti A. Zadeh, que en 1973 completó esta teoría de conjuntos con una lógica que aportó funcionalidades operativas.

Ya lejanos de ese año, me atrae la idea de que quizá se pueda encontrar su aplicación al tagging, especialmente en la fase de la recuperación de la información. Este artículo es el primero de una serie que está en proceso de redacción...

02
abr 2007

Un primer post

Escoger una fecha fácil no era algo intencionado, pero siempre es mejor poder recordarla. Así que doy por inaugurado el blog sopadebits.com en un 1 de Abril de 2007 ;-).

Aunque quizá sería bueno empezar a desglosar los contenidos de esta sopa de bits que día a día trato de digerir. Por fin me atrevo a empezar a cocinar!

Páginas 1