Herramientas de visualización de datos
Sumario
Visualización de datos
La visualización de datos es el proceso de crear una representación visual de las tendencias, los patrones y las perspectivas críticas de un conjunto de datos. Es fundamental en el ingente volumen de información que se maneja en el entorno de Big Data.
Formas visuales de representar los datos
Existen entre otras estas formas visuales de representar los datos:
- Gráficos circulares
- Amosan desgloses porcentuais.
- Táboas
- amosan datos demasiado complicados para usar texto.
- Liñas de tempo
- ofrecen unha secuencia de acontecementos ao longo do tempo.
- Histogramas
- amosan a distribución dun conxunto de datos composto por datos continuos ou discretos.
- Diagramas de Gantt
- amosan a liña de tempo dun proxecto.
- Diagrama de caixas e bigotes
- ofrecen un resumo de cinco medidas dun conxunto de datos (inclúe as cifras mínimas, o primeiro cuartil, a mediana, o tercer cuartil e o máximo).
- Diagrama de dispersión
- Amosan unha relación entre dous conxuntos de datos (coma a altura fronte o peso).
- Diagrama de barras
- Amosan a distribución dos datos en dúas categorías (coma os resultados das probas A/B)
Na páxina de datos abertos do goberno hai dous artigos interesantes:
- Visualización de datos: los mejores gráficos para representar comparaciones
- Cómo elegir el gráfico correcto para visualizar datos abiertos
Pasos a seguir para representar visualmente los datos
Los pasos a seguir para representar visualmente los datos son:
- Reúne el conjunto de datos
- «Limpia» los datos para asegurarte de que son coherentes y no tienen errores.
- Utiliza el software para crear la visualización sobre el conjunto de datos.
- Evalúa la validez de la visualización
Herramientas de visualización de datos
Revisaremos algunas de las herramientas más utilizadas para representar gráficamente los datos y facilitar la comprensión del mensaje que nos trasmiten.
Funcionalidade principal | Ferramenta |
---|---|
Web Scrapping | |
Parsehub | |
Scrappy | |
Table Capture | |
Funcion ImportHTML | |
Depuración de datos | |
Open Refine | |
Talend Open Studio | |
Conversión de datos | |
Mr. Data Converter | |
Beautify Converter | |
Tabula | |
Análise de datos e linguaxes de programación | |
Weka | |
Knime | |
Orange | |
R | |
Python | |
GNU Octave | |
Visualización | |
Kibana | |
Tableau Public | |
SpagoBI | |
Grafana | |
APIs e librerías de visualización | |
Google Chart Tools | |
JavaScript InfoVis Toolkit | |
D3.JS | |
Matplolib | |
Bokeh | |
Visualización e tratamento de datos xeoespaciáis | |
Carto | |
Openlayers | |
OpenStreetMap | |
Geopy | |
GDAL | |
PROJ.4 y PROJ.4S | |
Análise de redes | |
Gephi | |
NodeXL |
QlikView
QlikSense
Tableau
Versións
Tableau Desktop
Versión instalable que que permite desenvolver e definir dashboards en local a través do que Tableau chama Libros de Traballo.
- Conexión de datos: Permite conectar a multitud de datos a través de ficheiros (Excel, Access, CSV, JSON, PDF, etc.) ouu servidores de datos (SQL Server, MySQL, Oracle, Firebird, Dropbox, ODBC, etc.)
- Actualización y sincronización: No permite actualizar automáticamente los datos, únicamente de forma manual a con las opciones de refresco abriendo de nuevo el Libro de Trabajo.
- Acceso e visibilidad: gardase en ficheiros locais. Se se envía a outra persona, esta precisará Tableau Desktop e acceso ao servidor de datos.
Esta opción é para conectar a datos e diseñar dashboards de forma local para un mesmo, ou compartir estes dashboards nas plataformas que veremos a continuación.
A versión Personal so conectaría a ficheros e a profesional (de pago con proba 14 días) que habilita todas las posibilidades de conexión a datos.
Tableau Server
Tableau Server es la plataforma que centraliza el almacenamiento de los Libros de Trabajo, permitiendo su distribución e intercambio para que otros usuarios puedan acceder a ellos a través de su navegador web. Además mantiene los datos actualizados y bajo una estructura de carpetas o proyectos con niveles de privacidad por usuario. Sus licencias son paralelas a las de Tableau Desktop y se despliega en tu propia infraestructura Cloud.
- Conexión de datos: Permite conectar a cualquier dato al que hayamos conectado nuestro Libro de Trabajo, siempre que se tenga acceso al fichero o servidor.
- Actualización y sincronización: A través de actualizaciones programadas o en tiempo real.
- Acceso y visibilidad: Los usuarios pueden acceder con su navegador según sus permisos de visualización.
- Seguridad: La que ofrezca tu infraestructura
Esta versión es para quienes necesitan distribuir sus libros con diferentes personas y que accedan a los mismos con un simple navegador; gestionando completamente la administración de la plataforma. Tableau Server permite mantener los datos actualizados e incluso de forma limitada (aunque cada vez menos limitada) permite editar los libros de trabajo con el navegador.
Tableau Online
Tableau Online es una plataforma equivalente a Tableau Server, con todas sus ventajas y posibilidades pero alojada en los servidores de Tableau, por lo que no necesitas disponer de infraestructura Cloud propia. Al igual que Tableau Server, necesitas de forma paralela Tableau Desktop para publicar los Libros de Trabajo y su módulo Tableau Bridge para mantener los datos actualizados y sincronizados cuando estos están en ficheros o servidores locales.
- Conexión de datos: Permite conectar a cualquier dato al que hayamos conectado nuestro Libro de Trabajo, lo hará directamente Tableau Online si el servidor es accesible vía Internet o con Tableau Bridge si están en local.
- Actualización y sincronización: A través de actualizaciones programadas o en tiempo real.
- Acceso y visibilidad: Los usuarios pueden acceder con su navegador según sus permisos de visualización.
- Seguridad: Tan buena como la que ofrece la infraestructura de Tableau.
Esta versión es para quienes necesitan distribuir sus libros con diferentes personas y que accedan a los mismos con un simple navegador; olvidándose de la gestión administrativa del servidor al estar alojada en un servidor autogestionado. También permite mantener los datos actualizados y una edición limitada de los libros de trabajo con el navegador.
Tableau Reader
É unha versión completamente gratuita que solo permite abrir Libros de Trabajo para su visualización e interacción, siempre que estos hayan sido diseñados previamente con Tableau Desktop de forma empaquetada. Por buscar una analogía, es un programa que instalas en tu equipo y funciona como lo hace un visor de archivos PDF.
- Conexión de datos: Solo aquellos que hayan sido empaquetados en el libro de trabajo.
- Actualización y sincronización: No permite actualizar los datos.
- Acceso y visibilidad: Son ficheros TWBX que puedes enviar a cualquier persona para que abra a través de su equipo.
- Seguridad: La que pueda tener tu equipo, además los datos se han extraído y empaquetado en el fichero por lo que puede considerarse una brecha de seguridad en muchos casos.
Esta opción es para aquellas personas que quieres quieran abrir dashboards que otra persona haya diseñado y que no requieren que los datos se actualicen.
Tableau Public
É tamén gratuito pero con posibilidades de deseñar y desenvolver dashboards. La limitación que tiene frente a Tableau Desktop es que solo permite conectar a unas pocas fuentes de datos y que los libros se almacenan publicando en la nube pública y abierta de Tableau.
- Conexión de datos: Solo puede conectar a ficheros Excel, CSV u Hojas de Google
- Actualización y sincronización: No permite actualizar los datos automáticamente si se trata de ficheros Excel o CSV aunque permite configurar un refresco de las Hojas de Google.
- Acceso y visibilidad: Se almacena exclusivamente en la plataforma pública de Tableau
- Seguridad: Muy baja, pues cualquier persona puede acceder a los datos a través de Internet.
Tableau Public é unha opción moi válida para o ámbito académico ou xornalístico para desenvolver dashboards e compartir os seus deseños con todo o mundo; mais difícilmente será solución válida para empresas que necesiten traballar cos seus datos.
Tarefa
Revisa os gráficos de Tableau Public. Identifica un que che guste especialmente, indicando o motivo.
Power BI
Domo
Pentaho
MicroStrategy
Business Objects
RJMetrics
Klipfolio
Otras
Looker Studio
Tendencias de visualización de datos
Contenidos interactivos
La interacción es atractiva y pedagógica, e insta al receptor a revisar con más atención la información. Las herramientas de visualización de datos tienen diseños responsivos o responsive, accesible desde cualquier tipo de pantalla (ajustan el contenido al tamaño y resolución de la pantalla).
Integración de datos
La recopilación y procesamiento de mucha información es una necesidad. La posibilidad de combinar e integrar herramientas y fuentes de datos es un hecho. Colaboración social. La colaboración brinda nuevas oportunidades, permitiendo a los usuarios que contribuyan con aportaciones en tiempo real.
Retos de la visualización de datos
La visualización de datos presenta algunos retos que pueden llevar a la tergiversación de la información o a la exageración de ciertos datos.
Simplificación excesiva de los datos
La simplificación excesiva de los datos puede hacer que se pierda información clave. Por ejemplo, imagine que realiza un informe sobre el rendimiento académico. El informe muestra un gráfico de barras que indica que el rendimiento académico ha disminuido, mientras que el uso de videojuegos por parte de los estudiantes ha aumentado en la última década.
El informe concluye que el uso de los videojuegos ha tenido un impacto negativo en los estudios académicos. Sin embargo, la visualización de los datos estaba demasiado simplificada, no se han tenido en cuenta datos demográficos ni otros factores que también influyen en el rendimiento académico.
Exageración
Se pueden representar datos no relacionados y crear correlaciones inexistentes. Los usuarios malintencionados pueden utilizar esta visualización de datos inexactos para justificar un comportamiento perjudicial o una mala toma de decisiones.
Por ejemplo, un grupo gasta en exceso en un equipo de fabricación para apoyar a un proveedor con el que tienen una relación cercana. Después, justifican la compra mediante informes de visualización de datos que destacan cómo ha mejorado la seguridad de los trabajadores tras la instalación del nuevo equipo. Sin embargo, varios factores que no tenían nada que ver con el nuevo equipo contribuyeron a la seguridad de los trabajadores.
Prejuicios sociales
Los prejuicios afectan negativamente a la visualización de datos. El equipo que elabora los informes de datos podría sesgar los resultados preseleccionando los datos que se ajustan a sus preferencias.
Aunque las herramientas de visualización de datos son precisas, el equipo que las gestiona puede introducir involuntariamente sesgos en la selección de los datos o en el tratamiento de limpieza de estos.
Referencias
- Guía de visualizaciónde datos. ISBN: 978-84-393-9734-2. Generalitat de Cataluña. Licencia Reconocimiento 4.0 de CC.
- Guía de visualización de datos para Entidades Locales. Edición: Red de Entidades Locales por la Transparencia y la Participación Ciudadana de la FEMP bajo licencia Creative Commons Reconocimiento.
- La importancia de la visualización gráfica de los datos
- ¿Qué es una visualización interactiva? Te mostramos un ejemplo
Ferramentas
- Las herramientas de visualización de datos más populares
- Las herramientas de análisis de datos más populares
- Las herramientas de depuración y conversión de datos más populares
- Las librerías y APIs de visualización de datos más populares
- Las herramientas de visualización geoespacial más populares
- Las herramientas de análisis de redes más populares