População e valor médio do custo da habitação: uma análise visual com o Power BI
O Power BI utiliza informação geográfica para conceber mapas interativos. Esta é uma visualização muito interessante da aplicação que permite ajudar a responder a questões como:
- Onde estão localizados os melhores clientes?
- Como têm evoluído os preços de mercado por região?
- Como se compara a população de uma determinada cidade com o seu volume negócios?
- Que países têm apresentado taxas de crescimento maiores em termos demográficos?
Entre muitas outras… de facto, a informação geográfica tem sido bastante negligenciada em muitos relatórios financeiros e estratégicos de todo o tipo de organizações, mas ela é mais relevante do que nunca, principalmente em setores como o imobiliário, a banca, o grande consumo, etc.
O Power BI dispõe dois tipos de mapas:
- Os mapas básicos que afixam pontos (ou círculos) sobre o gráfico cujo tamanho depende do valor em questão (quanto maior o valor, maior o ponto). É possível segmentar os círculos em formato de gráfico tipo “pie” usando uma segunda variável;
- Os mapas de manchas que preenchem o espaço geográfico de uma determinada região com uma cor que varia em função do valor.
A escolha do tipo de mapa depende da informação que se dispõe e do tipo de análise a realizar. Se a informação geográfica é importante, como é o caso quando estamos a analisar a população de uma determinada região, por exemplo, então será mais apropriado usar-se um mapa de manchas. Deste modo, comparamos a área geográfica com variáveis demográficas. Mas quando pretendemos analisar informação quantitativa que não depende da área geográfica, o mapa a escolher será o básico.
Para exemplificar a utilização de mapas, vamos aceder a um novo conjunto de dados a partir do ficheiro “Densidade.xlsx” em anexo. Estes dados foram obtidos a partir do Instituto Nacional de Estatística para o ano 2014 e contêm informação demográfica e económica detalhada por município.
Antes de importar os dados repare que o ficheiro contém duas tabelas em dois separadores distintos. E repare que a coluna B contém o nome do município acrescido de um separador e do texto “Portugal”.
Na verdade, o Power BI não é sempre capaz de georreferenciar a localização a partir do nome de um município e é frequente confundir-se. Por exemplo, o município “Santa Cruz” pode ser confundido com a cidade californiana com o mesmo nome. Por isso, acrescentamos o nome “Portugal” a todos eles.
Outra alteração que efetuámos aos dados para ajudar na georreferenciação foi a alteração do nome do campo de “Município” para “City”.
Também convém referir que as visualizações de mapas utilizam a API do Bing Map pelo que para que funcionem corretamente, terá de estar ligado à Internet.
Depois de importar os dados do ficheiro, poderá ver os nomes das duas tabelas:
- DemografiaEmpresas
- População
Vamos criar uma visualização de mapa básico usando a segunda tabela e arrastar o campo “City” para a “Localização”. Como poderá verificar o mapa é criado e demorará algum tempo até que os círculos se posicionem sobre cada um dos municípios.
Quando dispomos de nomes (textos) com as localizações, este é o campo a utilizar. Mas, caso dispuséssemos de latitudes e longitudes específicas para cada local, teríamos de arrastar os valores das mesmas para o Painel de edição de campos. A georreferenciação seria obviamente mais precisa.
Como se tratam de dados referentes a população, também podemos arrastar esse campo para a zona “Tamanho” de modo a que o tamanho de cada círculo reflita a população de cada município:
Tendo em que os municípios ocupam áreas geográficas com dimensões diferentes e que nem sempre os maiores são os mais povoados, podemos analisar a informação recorrendo a um mapa de manchas:
Dado que dispomos de informação com a população por município segmentada por faixa etária, é interessante visualizar não só o total dessa população, mas também decomposta por segmentos. Para isso, podemos arrasta o campo “Segmento” para a área Legenda e obter gráficos circulares para cada município:
Gráfico de dispersão (X Y)
Utilizando o mesmo conjunto de dados, mas desta vez os contidos na tabela “DemografiaEmpresas”, vamos criar um gráfico de dispersão, também conhecido como X Y. Este gráfico é ideal para comparar duas variáveis relacionadas, como por exemplo a densidade populacional e o valor médio dos prédios urbanos.
O processo de criação da visualização é idêntico a todos os que vimos anteriormente, pelo que vamos apenas fornecer as coordenadas dos campos:
- Nos detalhes, temos o campo “Município”
- No Eixo X, o campo “Densidade Populacional (Nº/Km2)
- No Eixo Y, o campo “Valor médio dos prédios urbanos (Euros)
- No tamanho, o campo “População”.
Esta visualização será agora a seguinte:
Como podemos ver, o gráfico demonstra a relação entre duas variáveis (densidade populacional e valor médio dos prédios urbanos) e simultaneamente representa a população total por município através da dimensão dos círculos.
Desta forma, é imediatamente visível que o município do país com maior densidade populacional é a Amadora e que existe um “outlier” que é a Azambuja. Por “outlier” entendemos um valor que se destaca positiva ou negativamente em relação a um valor esperado, como a média.
Como não conseguimos identificar neste momento uma razão para o valor tão elevado dos prédios urbanos da Azambuja - que tem simultaneamente uma densidade populacional muito baixa – vamos retirar este município do gráfico através de um filtro.
Se quisermos excluir o ruído do gráfico eliminando os municípios cuja população é inferior a 100.000, o gráfico será agora mais conclusivo quanto à tendência entre densidade populacional e valor médio dos prédios urbanos e com a capacidade para identificar os municípios que se destacam aquém ou além dessa tendência:
Se o objetivo for comparar o valor médio dos prédios urbanos com a área geográfica que cada município ocupa, podemos recorrer novamente ao mapa de manchas, que nos mostrará mais saturação de cor para os municípios onde viver é mais caro. Neste mapa é claramente visível o “efeito Algarve” entre outras zonas turísticas no preço dos imóveis:
Este é um exemplo do tipo de análise que se pode fazer com o Power BI em apenas 5 minutos! Pesquisando fontes de informação pública ou analisando os dados que a sua empresa produz internamente nos seus sistemas de informação, folhas de cálculo, redes sociais, etc. verá que há muito por descobrir!