O Excel é uma ferramenta poderosa que possui algumas funções e funcionalidades incríveis ao trabalhar com estatísticas.
Encontrar uma correlação entre duas séries de dados é um dos cálculos estatísticos mais comuns ao trabalhar com grandes conjuntos de dados,
Eu trabalhava como analista financeiro há alguns anos e, embora não estivéssemos muito envolvidos com dados estatísticos, encontrar correlação era algo que ainda tínhamos que fazer com frequência.
Neste tutorial, vou mostrar duas maneiras realmente fáceis de calcular coeficiente de correlação no Excel. Já existe uma função incorporada para fazer isso e você também pode usar o Data Analysis Toolpak.
Então vamos começar!
Qual é o coeficiente de correlação?
Como esta não é uma aula de estatística, deixe-me explicar brevemente o que é o coeficiente de correlação e, em seguida, passaremos para a seção onde calculamos o coeficiente de correlação no Excel.
Um coeficiente de correlação é um valor que informa a proximidade de duas séries de dados.
Um exemplo comumente usado é o peso e a altura de 10 pessoas em um grupo. Se calcularmos o coeficiente de correlação para os dados de altura e peso dessas pessoas, obteremos um valor entre -1 e 1.
Um valor menor que zero indica uma correlação negativa, o que significa que se a altura aumenta, o peso diminui, ou se o peso aumenta na altura, a altura diminui.
E um valor maior que zero indica uma correlação positiva, o que significa que se a altura aumenta, o peso aumenta, e se a altura diminui, o peso diminui.
Quanto mais próximo o valor estiver de 1, mais forte será a correlação positiva. Portanto, um valor de 0,8 indicaria que os dados de altura e peso estão fortemente correlacionados.
Nota: Existem diferentes tipos de coeficientes de correlação e estatísticas, mas neste tutorial, veremos o mais comum que é o coeficiente de correlação de PearsonAgora, vamos ver como calcular esse coeficiente de correlação no Excel.
Cálculo do coeficiente de correlação no Excel
Como mencionei, existem algumas maneiras de calcular o coeficiente de correlação no Excel.
Usando a Fórmula CORREL
CORREL é uma função estatística introduzida no Excel 2007.
Suponha que você tenha um conjunto de dados conforme mostrado abaixo, onde deseja calcular o coeficiente de correlação entre a altura e o peso de 10 pessoas.
Abaixo está a fórmula que faria isso:
= CORREL (B2: B12, C2: C12)
A função CORREL acima aceita dois argumentos - a série com os pontos de dados de altura e a série com os pontos de dados de peso.
E é isso!
Assim que você pressiona Enter, o Excel faz todos os cálculos no back-end e fornece um único número de coeficiente de correlação de Pearson.
Em nosso exemplo, esse valor está um pouco acima de 0,5, o que indica que há uma correlação positiva bastante forte.
Este método é melhor usado se você tiver duas séries e tudo o que você deseja é o coeficiente de correlação.
Mas se você tiver várias séries e quiser descobrir o coeficiente de correlação de todas essas séries, também pode considerar o uso do pacote de ferramentas de análise de dados no Excel (abordado a seguir)
Usando o Data Analysis Toolpak
O Excel possui um Data Analysis Toolpak que pode ser usado para calcular rapidamente vários valores estatísticos (incluindo a obtenção do coeficiente de correlação).
Mas o Data Analysis Toolpak está desabilitado por padrão no Excel. Portanto, a primeira etapa seria habilitar a ferramenta de análise de dados novamente e usá-la para calcular o coeficiente de correlação de Pearson no Excel.
Habilitando o Data Analysis Toolpak
Abaixo estão as etapas para habilitar o Data Analysis Toolpak no Excel:
- Clique na guia Arquivo
- Clique em Opções
- Na caixa de diálogo Opções do Excel que se abre, clique na opção Suplementos no painel da barra lateral
- No menu suspenso Gerenciar, selecione Suplementos do Excel
- Clique em Go. Isso abrirá a caixa de diálogo de suplementos
- Verifique a opção Analysis Toolpak
- Clique em Ok
As etapas acima adicionariam um novo grupo na guia Dados na faixa de opções do Excel, denominado Análise. Dentro deste grupo, você teria a opção de Análise de Dados
Calculando o coeficiente de correlação usando ferramentas de análise de dados
Agora que você tem a ferramenta de análise de volta disponível na faixa de opções, vamos ver como calcular o coeficiente de correlação usando-a.
Suponha que você tenha um conjunto de dados conforme mostrado abaixo e deseja descobrir a correlação entre as três séries (altura e peso, altura e renda e peso e renda)
Abaixo estão as etapas para fazer isso:
- Clique na guia Dados
- No grupo Análise, clique na opção Análise de Dados
- Na caixa de diálogo de Análise de Dados que se abre, clique em ‘Correlação’
- Clique OK. Isso abrirá a caixa de diálogo Correlação
- Para faixa de entrada, selecione as três séries - incluindo os cabeçalhos
- Para ‘Agrupado por’, certifique-se de que ‘Colunas’ esteja selecionado
- Selecione a opção - ‘Etiqueta na primeira linha’. Isso garantirá que os dados resultantes tenham os mesmos cabeçalhos e será muito mais fácil de entender os resultados
- Nas opções de saída, escolha onde deseja a tabela resultante. Vou com a célula G1 na mesma planilha. Você também pode optar por obter seus resultados em uma nova planilha ou em uma nova pasta de trabalho
- Clique OK
Assim que você fizer isso, o Excel calculará o coeficiente de correlação para todas as séries e fornecerá uma tabela conforme mostrado abaixo:
Observe que a tabela resultante é estática e não seria atualizada caso algum dos pontos de dados em sua tabela mudasse. Em caso de alteração, você terá que repetir as etapas acima novamente para gerar uma nova tabela de coeficientes de correlação.
Portanto, esses são dois métodos rápidos e fáceis de calcular o coeficiente de correlação no Excel.
Espero que você tenha achado este tutorial útil!