Hola a todos y bienvenidos. Mi nombre es Josep Curto y soy profesor de la Universidad Oberta de Catalunya. En este video hablaremos de, finalmente, la visualización de gráficos y pasaremos desde gráficos muy simples a un cuadro de mando. Los tres temas que trataremos en este video son, primero, el análisis exploratorio de datos, segundo, el análisis visual y, tercero, la creación de un cuadro de mando. Todo ello, con la herramienta que hemos considerado que puede ser de las más interesantes, que es Tableau. Empezamos con la primera sección. ¿Por qué es necesario empezar con el análisis exploratorio de datos? Porque, a veces, nuestros usuarios de negocio, nuestro cliente, no tiene claro qué es lo que quiere entender, no tiene clara las preguntas y, por lo tanto, es necesario empezar explorando el dato. Primero, tenemos que revisar cuál es la interfaz para análisis exploratorio o visual de datos en Tableau. Cuando entramos por primera vez, una vez hemos pasado de la carga de los datos, tendremos esta interfaz. Esta interfaz tiene diferentes secciones y vamos a revisar una por una. La primera de ellas es las perspectivas de negocio, las perspectivas de análisis. Es decir, Tableau separa en dos tipos de atributos, los atributos que son para analizar desde un punto de vista y los atributos que son métricas. Por lo tanto, tenemos una sección que son las dimensiones y otra sección que son las métricas de análisis. Ello nos beneficia, ello nos permite diferenciar, claramente, cuáles son los valores que son numéricos y los que no lo son. La segunda parte, que es muy importante, es el área de trabajo. Es decir, Tableau es una herramienta del "drag and drop" orientada al usuario final, es decir, de arrastrar aquellos valores y luego un poquito de configuración para ajustarlos a nuestras necesidades de análisis. Por lo tanto, ¿qué haremos en nuestros siguientes análisis? Usar esa área de trabajo o el área superior de columnas y filas, o el área de marcas llamada "Marks" que nos permite acabar de ampliar el detalle de análisis de Tableau. ¿Qué más? Tenemos una parte de paginación, es decir, a veces queremos páginar en función de una categoría. Imaginaros que queremos separar nuestro gráfico en años y tenemos diversos años. Podríamos usar la parte de paginación para crear, no una, sino múltiples figuras que evolucionan conforme va cambiando el año. Tenemos una sección de filtros, unos filtros diferentes. Mientras que el filtro que aplicábamos en la carga datos reduce el conjunto de datos, este filtro lo único que hace es simplifica lo que se presenta en la visualización, pero no reduce el dato original. Y, finalmente, tenemos otra sección que es la sección de marcas. Esta sección de marcas nos permite hacer el ajuste, es decir, ampliar nuestro análisis, ya sea con colores, con etiquetas, con un mayor nivel de detalle o, incluso, con las típicas "tooltip", burbujas, que amplían la información. Todo ello viene matizado con un detalle muy importante que es la sección "Show Me". La sección "Show Me" es la sección donde, os explicaba antes, hay los principios de visualización embebidos. Por defecto, en estos momentos, como no tenemos ningún dato, esta sección nos indica que no tenemos ningún gráfico disponible. A medida que nosotros vayamos añadiendo dimensiones de análisis o métricas, se irán activando las diferentes gráficas y veréis que se activarán siempre y cuando tengan sentido, es decir, que tengan un número adecuado de dimensiones y tengan un número adecuado de métricas. ¿Cuál es el objetivo? El objetivo es reducir los errores, como os comentaba antes, de visualización, aquellos sesgos cognitivos que podamos tener por defecto y así crear la mejor visualización. Conocida ya la interfaz, tenemos que también tener presente que, además, podemos crear tres tipos de elementos, la hoja de trabajo, que es la parte de exploración visual o análisis exploratorio de datos, una segunda sección que es la de crear un cuadro de mando, que el foco es hace un reuso de todas nuestras hojas de trabajo y, finalmente, la historia de datos que puede usar tanto cuadros de mandos como hojas de trabajo creadas previamente. Por lo tanto, vamos a saltar a crear nuestro primer análisis. Déjame explicaros un poco lo que vamos a hacer y luego iremos paso a paso ya con el objeto final creado. No tenemos gran idea, porque nuestro usuario de negocio nos ha dicho, "no sé qué contiene este conjunto de datos", y tenemos que conocerlo un poco antes de empezar a analizarlo. Vamos a empezar la exploración del dato. Imaginemos que intentamos comprender qué pasa por los diferentes coches que hay por marca y cómo se han vendido. ¿Cómo hacemos ese primer análisis? Tan fácil como, lo que haríamos es considerar "Car Brand", que representa a las diferentes marcas de coches que tenemos, y al número de registros que contiene nuestro conjunto de autos. Y lo que vamos a hacer es arrastrarlos al área de trabajo, tanto por columnas o filas, o hacerlo directamente a esa área de trabajo, y luego haremos el ajuste del gráfico en la forma que sea necesaria para facilitar la comprensión, ya sea porque sea de un tamaño grande, ya sea porque tenemos que reordenarlo, lo que sea. Vayamos a eso. Este es el gráfico final del resultado de nuestro análisis, ¿qué hemos hecho? Dejádme describiros paso por paso lo que hemos realizado. Primero, hemos arrastrado el número de registros a las columnas. Si os fijáis, automáticamente, decido una métrica, la métrica de la suma. Si pulsamos sobre ese registro de color verde, podremos cambiar el tipo de métrica, en nuestro caso, la suma, el agregado, ya es el correcto. La segunda cosa que hemos hecho, hemos arrastrado "Car brand", la marca del coche, a las filas y, automáticamente, ya nos ha generado un gráfico de barras. Por defecto, el sistema escoge el gráfico que es óptimo, esto facilita mucho el hecho de evitar los errores. Nosotros siempre podemos ir a la sección de "Show Me" y cambiar si queremos otro tipo de visualización. Pero, si os fijáis en esta primera carga, ha estado desordenado. ¿Qué hacemos? Debemos de reordenar y lo hacemos de mayor a menor en función de la métrica que estamos usando. También podríamos reordenar por el nombre, alfabéticamente, por el tipo de marca. Pero, en este caso, es mucho mejor reordenar simplemente por la métrica. Y no es suficiente, tenemos que hacer un poco del ajuste al gráfico, si os fijáis, en vuestro momento, en este paso parte del gráfico no se ve. ¿Qué hacemos? Lo ajustamos a "entire view", a visión completa y, de esa manera, encaja todo dentro del área de trabajo, con lo cual hemos facilitado ver claramente que la principal marca, en este caso, es Ford. Y para acabar de detallar y para reconocer qué estamos haciendo, lo que hacemos es renombrar, botón derecho, renombramos el nombre del título de la hoja en la parte inferior y tenemos nuestro primer objeto de trabajo. ¿Qué hemos reconocido? Hemos identificado claramente qué marcas se han vendido más en los concesionarios de este negocio a lo largo del último periodo. Es una visión muy clara que nos permite ver, claramente, quiénes son los coches más vendidos. Hemos hecho un primer análisis exploratorio pero, como os podéis imaginar, es necesario hacerlo para el resto de atributos y combinar con otras métricas y otras dimensiones de análisis para ver si descubrimos algún conocimiento interesante para nuestro usuario de negocio. Lo que hemos hecho es seleccionar algunos de ellos para crear un cuadro de mando. Dejádme presentaros el siguiente, que es qué pasa con los coches por años. Entonces, vamos a ir paso a paso de nuevo, como la otra vez, con este gráfico sutilmente diferente porque también tiene una codificación por colores. Lo primero que hemos hecho es seleccionar, arrastrar el registro del número de coches por año por las columnas. Segundo, hemos hecho lo mismo pero por marcas para las filas, automáticamente, se ha generado ese primer gráfico propuesto por Tableau que es un gráfico de barras. Queda desordenado, lo ordenamos de nuevo, otra vez de mayor a menor para, así, poder ver claramente cuáles son las marcas más relevantes por año. Pero, ahora, empezamos a hacer esos pequeños ajustes interesantes como, por ejemplo, mostrarlo completamente a toda la pantalla para que así quepa dentro de nuestra área de trabajo. Y, luego, ya veremos, también, siguiendo el mismo proceso de antes, cambiar el título. ¿Qué es lo que cambia esta vez? Lo que cambia esta vez, hacemos uso de una caja, de la caja de marcas donde tenemos la posibilidad de extender nuestras capacidades de análisis. Si os fijáis, estamos trabajando con un gráfico de dos dimensiones. Claro, un análisis de dos dimensiones es un análisis bastante limitado, nos gustaría hacer más. ¿Cómo podemos ampliar las capacidades? Jugando con el tamaño, jugando con el tamaño de las barras, jugando con los colores. En este caso, lo que hacemos es añadir el país de origen del coche y lo arrastramos a la marca de color y, de esa manera, automáticamente, descubrimos que, no solamente hay unas marcas que se venden más, sino que además provienen de un determinado país que es Estados Unidos. Es decir, en nuestros concesionarios, las preferencias de nuestros clientes están vinculadas a un país particular que, frecuentemente, es Estados Unidos, un detalle muy interesante que ciontiene este conjunto de datos que, hasta ahora, no habíamos descubierto. Otro análisis que puede ser muy interesante también es, ya que hemos descubierto que los coches americanos son los que prefieren nuestros usuarios, es si puede ser que sea algo vinculado con la potencia y con la aceleración. Vayamos a investigar esta relación. Esta relación que, como estamos comparando dos métricas, lo que nos va a generar es lo que se conoce como un "scatter plot" que compara la relación entre estas dos variables. Paso a paso, ¿qué hemos hecho? Siendo un proceso muy similar como el anterior, hemos arrastrado por ejemplo la potencia en caballos a las columnas y como nos interesa más comparar, no el total sino la media, hemos cambiado a la métrica media desplegando las opciones de este campo. Eso mismo hemos hecho pero, también, con aceleración. Es decir, lo hemos arrastrado a filas y hemos cambiado el tipo de agregación. Llegados a este punto, os fijaréis que solamente genera un punto en todo el gráfico. Sí, genera un "scatter plot" pero no está separado. Debemos hacer el siguiente paso que es ver qué ha pasado por marcas, entonces, lo que hacemos es arrastramos las diferentes marcas a nuestro campo y, de repente, se disgregará en los diferentes eventos, empezamos a tener un poco de visibilidad de lo que sucede. No es suficiente, necesitamos mayor información. No sabemos a qué marcas se refiere, no tenemos clara esa información. ¿Cómo aumentamos nuestra capacidad de comprensión? Lo que hacemos es, arrastramos el nombre de la marca a las etiquetas, de esa manera saldrán las etiquetas para cada uno de los puntos que estamos visualizando. De repente, ya tenemos más claro qué está pasando para cada marca, de manera similar a lo que pasaba cuando nosotros estábamos trabajando con un gráfico de barras que intentamos dotar de mayor comprensión al gráfico. ¿Es suficiente? No, estábamos trabajando por países, queremos continuar trabajando por países. Lo que hacemos es arrastrar los países a los colores, el "Country of origin" a la marca de color y, de repente, podremos ver exactamente qué es lo que ha pasado. Resulta que los coches americanos tienen más potencia caballos, pero no necesariamente se traduce en una mayor aceleración. Es un detalle bastante interesante, significa que no es la potencia lo que están buscando sino que, realmente, parece que hay una tirada mucho más fuerte por el tipo de origen del coche que no, simplemente, por sus características primordiales. Y, finalmente, para acabar de completar el gráfico, lo que hacemos es cambiamos el título para reflejar lo que estamos analizando, que es aceleración versus la potencia. Teniendo en cuenta el gráfico que hicimos para explorar y los dos nuevos gráficos que hemos hecho ese análisis más visual de la información y esos ajustes, ya contamos con tres elementos, ya podríamos crear un cuadro de mando. Eso es lo que vamos a hacer ahora mismo, crear nuestro primer cuadro de mando. Como en anteriores situaciones, tenemos que entender un poco la interfaz que tiene Tableau para crear cuadro de mandos. Es una interfaz bastante sencilla y siguiendo el criterio de arrastrar como en la parte de exploración visual del dato, ¿cuáles son sus áreas? Primera, es el tamaño del cuadro de mando que puede ser ajustado a ciertos tamaños muy concretos, si es algo que se va a proyectar, por ejemplo, en una pantalla específica, o puede ser automático para que detecte de forma automática si estamos trabajando con una tablet, con un smartphone, o con nuestro ordenador, o con cualquier tipo de ordenador que puede tener una pantalla mucho más pequeña que otras, y se ajuste de manera automática para que el usuario no tenga que hacer el reajuste él mismo. Dos, ¿cuáles son los análisis ya creados que están disponibles para reusar dentro del cuadro de mando? Claro, lo que os podéis imaginar ahora mismo y es una referencia obvia, es decir, para crear un cuadro de mando necesitemos anteriormente tener elementos de análisis, sino será imposible crear un cuadro de mando. Otro aspecto primordial son aquellos elementos de contexto, como el título, como particiones, como espacios en blanco, como texto, que sean referentes. Y, atención, cualquier elemento, sean los elementos de análisis como los elementos de contexto, pueden ser fijos o pueden ser flotantes. Fijos significa que, veréis, lo que pasa es que Tableau os propone una disposición donde colocarlos y, "floating", flotantes significa que vosotros podéis escoger cómo los vais a colocar, cuál es el tamaño, completamente. Es decir, nos da la máxima libertad de crear un cuadro de mando tal como queramos. En este primer cuadro, vamos a seguir un poco la línea de que no sean flotantes sino que nos proponga la configuración. Finalmente, tenemos el área de trabajo donde vamos a arrastrar los elementos uno a uno para crear nuestro cuadro de mando. Analicemos el resultado de lo que hemos conseguido. Este es nuestro cuadro de mando donde hemos añadido múltiples elementos. No solamente hemos añadido elementos que ya teníamos, que son los tres gráficos creados y un título, sino que además hay un elemento nuevo. Si os fijáis en el lateral, hemos creado filtros. Es decir, un cuadro de mando no está completo si no le damos un cierto grado de interacción, para que le demos la versatilidad al usuario para ir mucho más allá. Imagínate que queremos filtrarlo por la potencia, o queremos filtrarlo por la aceleración, o queremos filtrar por una zona, o queremos filtrar por un tipo de marca. Esto es lo que nos da la potencia de tener una herramienta, no solamente de consulta, sino de investigación, de exploración, que es lo que al final queremos dotar a nuestro manager. Este trabajo, obviamente, se tiene que identificar de manera previa siempre y cuando hayamos podido conseguir esos requisitos por parte del usuario, sino se recomienda proponer a nuestro usuario final este tipo de elementos. ¿Cómo los hemos hecho? Primero, hemos arrastrado el elemento "car per brand" al área central, en la parte izquierda, luego hemos arrastrado el siguiente elemento a la parte de la derecha, luego hemos arrastrado el tercer elemento. Entonces, veis que ofrecen diferentes opciones y una opción es colocarlo a la parte de la derecha en la parte inferior, que es donde lo hemos colocado. Hemos ajustado un poco el tamaño, podéis ajustar las cajas de cada uno de estos gráficos y, con eso, ya tenemos un primer cuadro de mando sin los filtros. Luego, nos hemos dado cuenta que no se ve todo bien, hemos hecho un ajuste del tamaño automático para que sea adecuado a nuestra pantalla, a vuestra pantalla y a la de cualquier otro potencial usuario futuro. Y luego, nos hemos puesto a crearle un título, y ese título es "Car Analysis Dashboard". Automáticamente, si lo hemos renombrado en la parte inferior, saldrá el título en la parte superior. Eso se podía cambiar y añadir el título que nosotros queramos que sea independiente del nombre de la hoja, esto, a veces, es importante. Y, finalmente, hemos añadido los filtros, los filtros son característicos y, dejadme que entre en la siguiente "slide" de cómo hemos creado esos filtros para poder describirlos en detalle. Cada uno de los elementos que hemos añadido, cuando los seleccionamos, tiene un menú y, en ese menú tenemos múltiples opciones, quitar o no el título, añadir una explicación, añadir un filtro, mostrar, cambiar si son flotantes o no son flotantes, es decir, todas opciones. Si seleccionamos filtro, las variables que están presentes en ese gráfico saldrán como potenciales ejemplos, opciones de filtros, y podemos seleccionar, cuando las seleccionamos, automáticamente, va a ser el filtro. Por defecto, el filtro solamente aplica a un gráfico. Ese es el comportamiento por defecto, pero cuando hacemos un cuadro mando, ¿qué nos interesa? Que aplique a todos, por lo tanto, cerremos el filtro, iremos al menú desplegable y lo que haremos es ir a la sección que permite seleccionar cuáles son los diferentes elementos a los cuales aplica el gráfico. Como veis, nos saldrá un menú similar, entonces, en este caso, simplemente se va aplicando a uno, a la aceleración versus potencia, y lo que hacemos es seleccionar a los otros dos para que así, de esa manera, cuando hagamos un filtro aplique a todos y por lo tanto tengamos una interacción completa del cuadro de mando. Como os podéis imaginar, y sé que lo estáis pensando, a veces, no nos interesa que haya una integración en todos los ámbitos, sino en alguno de ellos. Como podéis ver, aquí, podemos seleccionar exactamente a cuál se aplica pero, si no aplica a todos, tendremos que añadir un elemento de texto explicándole al usuario por qué solamente un filtro aplica a unos o a otros, para no confundirlo en el comportamiento del cuadro de mando. Finalmente, el cuadro de mando completo, podemos entrar en modalidad de pantalla completa, y esto sería cómo un usuario final vería el cuadro de mando en su correspondiente escritorio, su pantalla web, etcétera. Como veis, sería simplemente una herramienta que podría empezar a manipular, trabajar, clicar, filtrar y así poder entender mucho más que es lo que está pasando. Resumiendo, en este video, lo que hemos descubierto es cómo crear diferentes elementos de análisis, desde empezando la exploración del dato, no sabíamos cuál era el valor, hemos empezado a crear un primer elemento para descubrir que resulta que Ford es la marca más vendida. Luego, hemos pasado a crear más elementos visuales con el objetivo final de crear un cuadro de mando, por lo tanto, hemos creado el análisis del coche por año y, luego, la comparativa de dos de las métricas, dos de las magnitudes que definen los diferentes coches que tenemos en este ejemplo, hemos visto que hemos creado dos diferentes tipos de gráficos, gráfico de barra o gráficos de "scatter plot". Y, finalmente, lo que hemos hecho es una composición para crear un cuadro de mando que lo que buscaba era mostrar un pequeño análisis, qué ha pasado por las marcas, qué ha pasado en los diferentes años, qué pasa, también, en los diferentes países de origen, en este caso, Estados Unidos, Japón y Europa. Y luego, finalmente, hemos añadido unos filtros para poder dar a conocer esa versatilidad, esa interacción que es relevante para los cuadros de mando.