A blog about data, information and IT, by Mario Alberich

May 01
2014

El cuarteto de Anscombe, cuando la forma importa

Tómate un minutillo para hacer unos cálculos sobre estas dos muestras de datos:

Read more »

Apr 22
2014

Visualizar para inducir, analizar para deducir

Quieres comerte una naranja y la pelas, porque la corteza de naranja es amarga y no te gusta, ¿cierto? Pero claro, luego viene tu madre, o tu abuela, y te dice que no tires la pela. Y con eso ellas te cocinan una especie de almíbar que luego añadirán al bizcocho que vas a disfrutar de lo lindo. Y así te das cuenta que te has estado perdiendo algo, tirando a la basura todas las pelas de naranjas anteriores.

Read more »

Sep 26
2013

España en llamas: la dificultad de obtener la información

El proyecto España en llamas se promocionó desde la fundación Civio para recopilar la información sobre los incendios forestales en España a lo largo de los años. Posteriormente obtuvo la financiación necesaria vía goteo.org, y echó a andar.

Read more »

Sep 16
2013

Los datos no crecen en las hojas de cálculo (mira en la basura)

En más de una conversación de café he sacado el comentario sobre lo vacíos que últimamente están los contenedores de basura. Por no hablar del metro y otros transportes públicos.  Son claros indicadores de la crisis, contrapuestos a la retórica de los macroindicadores.

Read more »

Aug 21
2013

Prediciendo los trending topics de twitter antes que sucedan

Reconozco que afronto con escepticismo los análisis de predicción de tendencias.  Pero la metodología que han seguido, más allá del puro algoritmo matemático, merece mención aparte. Aunque no lo he puesto a prueba, merece mención por los resultados finales:

Read more »

Jun 09
2011

Políticos accidentales: ¿Seleccionar legisladores aleatorios mejora la eficiencia parlamentaria?

Curioso artículo el que he encontrado hoy en arxiv.org, sobre una simulación que propone la hipótesis con la que titulo esta entrada (salvo los interrogantes, que los he añadido yo).  El preprint en cuestión está en inglés y se titula Accidental Politicians: How Randomly Selected Legislators Can Improve Parliament Efficiency (puedes descargar directamente la versión PDF del artículo).

Read more »

Feb 19
2009

Muestreo estadístico

Quizá este artículo podría resumirse diciendo que el muestreo estadístico es algo similar a una fotografía, pero dirigido a los datos, no a las imágenes.

Bueno, ya está. Ha quedado claro ¿no? Si es así, déjame pensar: no te dedicas a la fotografía, ¿verdad? Un conocedor de este arte podría argumentar: "en fotografía hay muchos estilos, técnicas y herramientas".  En el muestreo también, sólo que un buen resultado no luce tanto Guiño.

El muestreo estadístico es la toma de contacto con la realidad antes de llevar la muestra al laboratorio.  Desde el punto de vista teórico de las matemáticas puras, es un mal necesario.  Pero desde el punto de vista del trabajo de campo y del análisis empírico, escoger el tipo de muestreo estadístico es todo un arte.

Y desde luego, es un arte que va mucho más allá que el muestreo aleatorio simple.
Read more »

Jan 05
2008

Por qué P = Q = 0,5?

Nada más refrescante en la víspera de Reyes que un poco de estadística, ¿verdad? Pues ya me imagino que no, pero me apetecía comentar esta especie de axioma que aparece en la inmensa mayoría de encuestas de opinión, y que todo el mundo cree o simplemente ignora, mientras que unos pocos entienden a fondo.

Si te interesa, continúa, y sino, ya nos vemos en otro momento...

Read more »

Tags

gestión documental 10     Recuperación información 11     Linux 7     Usabilidad 5     open source 3     Tagging 12     lógica borrosa 2     fuentes de información 12     Google 6     off-topic 6     spam 2     grafos 6     Web social 11     modelización 12     Productividad 11     buscadores 2     utilidades 17     Profesionales 9     SEO 5     estándares 3     veracidad 3     relevancia 2     lingüística 2     PLN 2     lenguajes documentales 2     apis-mashups 3     reseñas 7     Flash 7     Gráficos estadísticos 13     Publicidad 3     Innovación 5     muestreo estadístico 9     PHP 14     internet 2     testeo 12     desarrollo 3     visualizacion 36     javascript 16     datos abiertos 9     elecciones 2     simulación 5     html5 7     phing 9     ssh 2     seguridad 3     indicadores 2     demografía 3     media 2     algoritmos 7     shell 4     mysql 2     backup 2     big data 6     twitter 2     d3js 11     revealjs 2     metodología 6     data-journalism 6     smartcities 2     NYT 2     privacidad 3     benchmarking 4     recopilaciones 21     magento 5     formacion 2     github 2     HHVM 3     psicología 2     angularjs 3     grep 2     nodejs 5     promises 2     mapreduce 3     crossfilter 2     exploración de datos 2     machine learning 2    

© 2007 and beyond Mario Alberich, licensed under CC-BY-SA unless stated otherwise.