RSS
-
Entradas recientes
Categorías
Etiquetas
apis-mashups Buscadores Clustering datos abiertos desarrollo elecciones estándares Flash fuentes de información Gestión documental Google grafos Gráficos estadísticos html5 Innovación internet Java javascript lenguajes documentales Lingüística Linux Lógica borrosa modelización Muestreo estadístico off-topic open source PHP PLN Productividad Profesionales Publicidad Recuperación información relevancia reseñas SEO spam tag 1 tag 2 Tagging testeo Usabilidad utilidades veracidad visualizacion Web socialComentarios recientes
- Mario en Análisis web com Piwik y GNU R (I)
- Wilderson Medina en Modelos lineales (regresión lineal) – 2
- Javascript | Pearltrees en El ecosistema Javascript (Rhino)
- erik araneda en Análisis web com Piwik y GNU R (I)
- Responsabilidad y voto « Reset Mental en Sobre las Elecciones Europeas y la decisión de voto
Archivos
- septiembre 2011
- junio 2011
- mayo 2011
- abril 2011
- marzo 2011
- enero 2010
- octubre 2009
- junio 2009
- mayo 2009
- abril 2009
- marzo 2009
- febrero 2009
- enero 2009
- septiembre 2008
- mayo 2008
- abril 2008
- marzo 2008
- febrero 2008
- enero 2008
- diciembre 2007
- octubre 2007
- septiembre 2007
- agosto 2007
- julio 2007
- junio 2007
- mayo 2007
- abril 2007
Category Archives: Matemática
Visualización de datos: Una aproximación ingénua
Hasta ahora había comentado la representación visual estrictamente relacionada con gráficos estadísticos estándares, como en el caso de Open Flash Chart 2. Sin embargo los gráficos estadísticos no siempre son aplicables, y es necesario buscar alternativas.
El área de la visualización de datos es una encrucijada de caminos: por un lado está la vertiente técnica (no sólo tecnológica), en la que se generan los datos, y de la que se obtienen las reglas que les afectan. Por el otro están todas las cuestiones relacionadas con la usabilidad y la interacción, algo especialmente importante si hablamos del entorno digital. Finalmente está el factor gráfico, que busca representar una realidad en base a formas, perspectivas, tonalidades, texturas y demás desde un punto de vista de conjunto.
Sobre las Elecciones Europeas y la decisión de voto
Domingo se celebran las elecciones Europeas. Lo cierto es que las encuestas vaticinan un alto nivel de abstención. Bueno o malo, el sistema electoral está estructurado, y las decisiones que tomamos al respecto tienen una consecuencia.
Mi comentario aquí se limita a aclarar el cómo se traduce cada tipo de voto al resultado final. Para aclarar esto es necesario concretar el significado de los tipos de votos, y analizar ventajas, inconvenientes y beneficios para los partidos políticos. El color político queda totalmente al margen del artículo.
Modelos lineales (regresión lineal) – 2
Con esta segunda parte comento los pasos del proceso de cálculo de los errores cuadráticos y la determinación del mejor modelo.
Cabe decir que lo que explico aquí no debe tomarse al pie de la letra, ya que evito entrar en detalles casi imprescindibles (como el cálculo matricial y el contraste de hipótesis) para dominar este proceso.
La decisión viene tomada porque hay ingente cantidad de documentación disponible sobre los detalles de este proceso, y pocos que se centren en cuestiones más pedagógicas.
Modelos lineales (regresión lineal)
Los modelos lineales son una herramienta muy utilizada para el análisis de datos que presentan una relación causa-efecto. El punto de partida en un modelo lineal son conjunto de datos que se presentan simultáneamente, y que a priori pueden explicar el comportamiento de la variable que queremos analizar (la que se denomina la variable respuesta o dependiente) a partir del resto.
El proceso de análisis de los modelos lineales es relativamente sencillo en cuanto que sistemático, siempre que se tengan las nociones básicas sobre producto matricial, o bien se disponga de una aplicación informática que haga la tarea por nosotros.
De todos modos, esta técnica de tanto uso oculta una serie de cuestiones de sentido común que ayudarían a entender su razón de ser. Los concepto com error cuadrático medio o el error total son conceptos esenciales que sin embargo permanecen ocultos al entendimiento general.
Open Flash Chart 2 – Mejorando los gráficos estadísticos
Tenía pendiente escribir una actualización para comentar los cambios en la versión 2 de Open Flash Chart (OFC2). En esencia la biblioteca funciona de forma casi idéntica a la versión 1, salvo algunas correcciones de errores y mejoras concretas, pero hay también hay un cambio importante.
El verdadero salto cualitativo está en la introducción del formato JSON . El proceso de configuración se hace más transparente, tanto para revisar la estructura en búsqueda de potenciales errores, como también por la libertad que da este formato al enviar los datos. Vayamos por partes.
Variables aleatorias, la semilla estadística
Las variables aleatorias son la base de la estadística probabilística actual. Son el paradigma sobre el que se asienta toda la estadística matemática.
Es por esto que la variable aleatoria es el concepto que cualquiera que quiera tratar con datos estadísticos debe entender a fondo, si no quiere echar mano a las mismas /herramientas/ ante cualquier situación.
A menudo, cuando surge el tema de la estadística como asignatura universitaria, surge la idea de la dificultad de esta asignatura en las carreras universitarias. La razón principal por la que creo que esto sucede tiene que ver con el concepto de las variables aleatorias. Es decir, que no se explica adecuadamente.
En muchas carreras se trabaja sobre un punto de partida: el control. A partir de ahí, hay que explicar la forma como ese control se puede perder. En ese contexto, la estadística pierde parte de su sentido. Enseñar un contraste de hipótesis sobre el paradigma del control es como narrar una película sólo con letras vocales.
La estadística (al menos la probabilística) parte de otra premisa: supongamos que todo tiene su componente aleatorio; que todo se mueve. A partir de este supuesto, analicemos la forma como se presenta esta aleatoriedad para establecer unas bases para un control que tiene tolerancia a los errores.
¿Parece lo mismo? No se parece en nada.
Continue reading
Muestreo estadístico
Quizá este artículo podría resumirse diciendo que el muestreo estadístico es algo similar a una fotografía, pero dirigido a los datos, no a las imágenes.
Bueno, ya está. Ha quedado claro ¿no? Si es así, déjame pensar: no te dedicas a la fotografía, ¿verdad? Un conocedor de este arte podría argumentar: "en fotografía hay muchos estilos, técnicas y herramientas". En el muestreo también, sólo que un buen resultado no luce tanto
.
El muestreo estadístico es la toma de contacto con la realidad antes de llevar la muestra al laboratorio. Desde el punto de vista teórico de las matemáticas puras, es un mal necesario. Pero desde el punto de vista del trabajo de campo y del análisis empírico, escoger el tipo de muestreo estadístico es todo un arte.
Y desde luego, es un arte que va mucho más allá que el muestreo aleatorio simple.
Continue reading
Por qué P = Q = 0,5?
Nada más refrescante en la víspera de Reyes que un poco de estadística, ¿verdad? Pues ya me imagino que no, pero me apetecía comentar esta especie de axioma que aparece en la inmensa mayoría de encuestas de opinión, y que todo el mundo cree o simplemente ignora, mientras que unos pocos entienden a fondo.
Si te interesa, continúa, y sino, ya nos vemos en otro momento…
Comentarios desactivados