Herramientas de visualización de datos

De MediaWiki
Ir a la navegación Ir a la búsqueda

Visualización de datos

La visualización de datos es el proceso de crear una representación visual de las tendencias, los patrones y las perspectivas críticas de un conjunto de datos. Es fundamental en el ingente volumen de información que se maneja en el entorno de Big Data.

Formas visuales de representar los datos

Existen entre otras estas formas visuales de representar los datos:

Gráficos circulares
Amosan desgloses porcentuais.
Táboas
amosan datos demasiado complicados para usar texto.
Liñas de tempo
ofrecen unha secuencia de acontecementos ao longo do tempo.
Histogramas
amosan a distribución dun conxunto de datos composto por datos continuos ou discretos.
Diagramas de Gantt
amosan a liña de tempo dun proxecto.
Diagrama de caixas e bigotes
ofrecen un resumo de cinco medidas dun conxunto de datos (inclúe as cifras mínimas, o primeiro cuartil, a mediana, o tercer cuartil e o máximo).
Diagrama de dispersión
Amosan unha relación entre dous conxuntos de datos (coma a altura fronte o peso).
Diagrama de barras
Amosan a distribución dos datos en dúas categorías (coma os resultados das probas A/B)

Na páxina de datos abertos do goberno hai dous artigos interesantes:

Pasos a seguir para representar visualmente los datos

Los pasos a seguir para representar visualmente los datos son:

  1. Reúne el conjunto de datos
  2. «Limpia» los datos para asegurarte de que son coherentes y no tienen errores.
  3. Utiliza el software para crear la visualización sobre el conjunto de datos.
  4. Evalúa la validez de la visualización

Herramientas de visualización de datos

Revisaremos algunas de las herramientas más utilizadas para representar gráficamente los datos y facilitar la comprensión del mensaje que nos trasmiten.

Funcionalidade principal Ferramenta
Web Scrapping
Parsehub
Scrappy
Table Capture
Funcion ImportHTML
Depuración de datos
Open Refine
Talend Open Studio
Conversión de datos
Mr. Data Converter
Beautify Converter
Tabula
Análise de datos e linguaxes de programación
Weka
Knime
Orange
R
Python
GNU Octave
Visualización
Kibana
Tableau Public
SpagoBI
Grafana
APIs e librerías de visualización
Google Chart Tools
JavaScript InfoVis Toolkit
D3.JS
Matplolib
Bokeh
Visualización e tratamento de datos xeoespaciáis
Carto
Openlayers
OpenStreetMap
Geopy
GDAL
PROJ.4 y PROJ.4S
Análise de redes
Gephi
NodeXL

QlikView

QlikSense

Tableau

Versións

Diferentes versións de Tableau

Tableau Desktop

Versión instalable que que permite desenvolver e definir dashboards en local a través do que Tableau chama Libros de Traballo.

  • Conexión de datos: Permite conectar a multitud de datos a través de ficheiros (Excel, Access, CSV, JSON, PDF, etc.) ouu servidores de datos (SQL Server, MySQL, Oracle, Firebird, Dropbox, ODBC, etc.)
  • Actualización y sincronización: No permite actualizar automáticamente los datos, únicamente de forma manual a con las opciones de refresco abriendo de nuevo el Libro de Trabajo.
  • Acceso e visibilidad: gardase en ficheiros locais. Se se envía a outra persona, esta precisará Tableau Desktop e acceso ao servidor de datos.

Esta opción é para conectar a datos e diseñar dashboards de forma local para un mesmo, ou compartir estes dashboards nas plataformas que veremos a continuación.

A versión Personal so conectaría a ficheros e a profesional (de pago con proba 14 días) que habilita todas las posibilidades de conexión a datos.

Tableau Server

Tableau Server es la plataforma que centraliza el almacenamiento de los Libros de Trabajo, permitiendo su distribución e intercambio para que otros usuarios puedan acceder a ellos a través de su navegador web. Además mantiene los datos actualizados y bajo una estructura de carpetas o proyectos con niveles de privacidad por usuario. Sus licencias son paralelas a las de Tableau Desktop y se despliega en tu propia infraestructura Cloud.

  • Conexión de datos: Permite conectar a cualquier dato al que hayamos conectado nuestro Libro de Trabajo, siempre que se tenga acceso al fichero o servidor.
  • Actualización y sincronización: A través de actualizaciones programadas o en tiempo real.
  • Acceso y visibilidad: Los usuarios pueden acceder con su navegador según sus permisos de visualización.
  • Seguridad: La que ofrezca tu infraestructura

Esta versión es para quienes necesitan distribuir sus libros con diferentes personas y que accedan a los mismos con un simple navegador; gestionando completamente la administración de la plataforma. Tableau Server permite mantener los datos actualizados e incluso de forma limitada (aunque cada vez menos limitada) permite editar los libros de trabajo con el navegador.

Tableau Online

Tableau Online es una plataforma equivalente a Tableau Server, con todas sus ventajas y posibilidades pero alojada en los servidores de Tableau, por lo que no necesitas disponer de infraestructura Cloud propia. Al igual que Tableau Server, necesitas de forma paralela Tableau Desktop para publicar los Libros de Trabajo y su módulo Tableau Bridge para mantener los datos actualizados y sincronizados cuando estos están en ficheros o servidores locales.

  • Conexión de datos: Permite conectar a cualquier dato al que hayamos conectado nuestro Libro de Trabajo, lo hará directamente Tableau Online si el servidor es accesible vía Internet o con Tableau Bridge si están en local.
  • Actualización y sincronización: A través de actualizaciones programadas o en tiempo real.
  • Acceso y visibilidad: Los usuarios pueden acceder con su navegador según sus permisos de visualización.
  • Seguridad: Tan buena como la que ofrece la infraestructura de Tableau.

Esta versión es para quienes necesitan distribuir sus libros con diferentes personas y que accedan a los mismos con un simple navegador; olvidándose de la gestión administrativa del servidor al estar alojada en un servidor autogestionado. También permite mantener los datos actualizados y una edición limitada de los libros de trabajo con el navegador.

Tableau Reader

É unha versión completamente gratuita que solo permite abrir Libros de Trabajo para su visualización e interacción, siempre que estos hayan sido diseñados previamente con Tableau Desktop de forma empaquetada. Por buscar una analogía, es un programa que instalas en tu equipo y funciona como lo hace un visor de archivos PDF.

  • Conexión de datos: Solo aquellos que hayan sido empaquetados en el libro de trabajo.
  • Actualización y sincronización: No permite actualizar los datos.
  • Acceso y visibilidad: Son ficheros TWBX que puedes enviar a cualquier persona para que abra a través de su equipo.
  • Seguridad: La que pueda tener tu equipo, además los datos se han extraído y empaquetado en el fichero por lo que puede considerarse una brecha de seguridad en muchos casos.

Esta opción es para aquellas personas que quieres quieran abrir dashboards que otra persona haya diseñado y que no requieren que los datos se actualicen.

Tableau Public

É tamén gratuito pero con posibilidades de deseñar y desenvolver dashboards. La limitación que tiene frente a Tableau Desktop es que solo permite conectar a unas pocas fuentes de datos y que los libros se almacenan publicando en la nube pública y abierta de Tableau.

  • Conexión de datos: Solo puede conectar a ficheros Excel, CSV u Hojas de Google
  • Actualización y sincronización: No permite actualizar los datos automáticamente si se trata de ficheros Excel o CSV aunque permite configurar un refresco de las Hojas de Google.
  • Acceso y visibilidad: Se almacena exclusivamente en la plataforma pública de Tableau
  • Seguridad: Muy baja, pues cualquier persona puede acceder a los datos a través de Internet.

Tableau Public é unha opción moi válida para o ámbito académico ou xornalístico para desenvolver dashboards e compartir os seus deseños con todo o mundo; mais difícilmente será solución válida para empresas que necesiten traballar cos seus datos.

Tarefa

Revisa os gráficos de Tableau Public. Identifica un que che guste especialmente, indicando o motivo.

Power BI

Domo

Pentaho

MicroStrategy

Business Objects

RJMetrics

Klipfolio

Otras

Looker Studio

Tendencias de visualización de datos

Contenidos interactivos

La interacción es atractiva y pedagógica, e insta al receptor a revisar con más atención la información. Las herramientas de visualización de datos tienen diseños responsivos o responsive, accesible desde cualquier tipo de pantalla (ajustan el contenido al tamaño y resolución de la pantalla).

Integración de datos

La recopilación y procesamiento de mucha información es una necesidad. La posibilidad de combinar e integrar herramientas y fuentes de datos es un hecho. Colaboración social. La colaboración brinda nuevas oportunidades, permitiendo a los usuarios que contribuyan con aportaciones en tiempo real.

Retos de la visualización de datos

La visualización de datos presenta algunos retos que pueden llevar a la tergiversación de la información o a la exageración de ciertos datos.

Simplificación excesiva de los datos

La simplificación excesiva de los datos puede hacer que se pierda información clave. Por ejemplo, imagine que realiza un informe sobre el rendimiento académico. El informe muestra un gráfico de barras que indica que el rendimiento académico ha disminuido, mientras que el uso de videojuegos por parte de los estudiantes ha aumentado en la última década.

El informe concluye que el uso de los videojuegos ha tenido un impacto negativo en los estudios académicos. Sin embargo, la visualización de los datos estaba demasiado simplificada, no se han tenido en cuenta datos demográficos ni otros factores que también influyen en el rendimiento académico.

Exageración

Se pueden representar datos no relacionados y crear correlaciones inexistentes. Los usuarios malintencionados pueden utilizar esta visualización de datos inexactos para justificar un comportamiento perjudicial o una mala toma de decisiones.

Por ejemplo, un grupo gasta en exceso en un equipo de fabricación para apoyar a un proveedor con el que tienen una relación cercana. Después, justifican la compra mediante informes de visualización de datos que destacan cómo ha mejorado la seguridad de los trabajadores tras la instalación del nuevo equipo. Sin embargo, varios factores que no tenían nada que ver con el nuevo equipo contribuyeron a la seguridad de los trabajadores.

Prejuicios sociales

Los prejuicios afectan negativamente a la visualización de datos. El equipo que elabora los informes de datos podría sesgar los resultados preseleccionando los datos que se ajustan a sus preferencias.

Aunque las herramientas de visualización de datos son precisas, el equipo que las gestiona puede introducir involuntariamente sesgos en la selección de los datos o en el tratamiento de limpieza de estos.

Referencias

Ferramentas