A análise exploratória de dados diz respeito à descrição de dados e é de
grande utilidade para resumir e apresentar os dados coletados em tabelas,
quadros, gráficos, etc que permitem que relações e padrões não-analisados sejam
discernidos. As principais técnicas que podem ser usadas são: 1) apresentação
de frequências; 2) medição de localização (tendência central); 3) medição de
dispersão (amplitude); 4) medição da mudança.
Um importante passo para analisar
os dados quantitativos é o exame da distribuição de frequência para cada
variável. A ideia é agrupar certos valores de dados brutos em categorias ou
classes e em seguida contar as frequências para cada um. Isso pode ser feito,
conforme a quantidade de variáveis adotada, de diversas maneiras: uso de
tabelas de distribuição de frequência, tabulações cruzadas, quadros gráficos,
diagramas – variando conforme a variável e a aplicabilidade do estudo.
A medida de localização/tendência central é forma de se descrever
uma grande distribuição de frequência por meio de um único valor. As principais
medidas são: a média, a mediana e a moda.
A medição da dispersão ajuda a descrever a disseminação de valores
em uma distribuição de dados. Para essa medida temos o intervalo e intervalo
interquartil, diagrama de caixa e o desvio-padrão.
A medição da mudança pode ser considerada como um número de
índice, ou seja, uma medida estatística que mostra a mudança percentual em uma
variável, como custos ou preços, de algum ponto fixo no passado. Existe aqui um
período escolhido para ser a base com que os outros períodos serão comparados. Os
principais são: números de índice simples (mostra cada item em uma série relativa
a algum valor escolhido de período-base; dados sobre deflação (deflaciona uma
série de dados usando um índice, removendo, assim o efeito da inflação dos
dados) e número de índice ponderados (formado por meio do cálculo da média
ponderada de alguns grupos de valores, no qual os pesos mostram a importância
relativa de cada item no conjunto de dados.
Na análise confirmatória de dados as principais estatísticas usadas para
inferência são: 1) estimativas a partir de amostras; 2) medição de associações;
3) medição de diferenças; 4) previsão. Nas estimativas a partir de amostras
podemos dividir em intervalos de confiança e intervalos de confiança de uma
percentagem. Nas medidas de associação podemos utilizar a técnica de
coeficiente de correlação de produto – momento de Pearson (técnica paramétrica
que fornece uma medida da força de associação entre duas variáveis); e a
técnica do coeficiente de correlação de Spearman (técnica não paramétrica usada
para obter uma medida de associação não linear entre duas variáveis que não é
possível ou é difícil de mensurar de maneira acurada, mas é possível
categorizar). Nas medidas de diferenças temos o teste qui-quadrado
(técnica não-paramétrica usada para avaliar a significância estatística de uma
descoberta) e o teste t para alunos que consiste em uma técnica paramétrica que
pode ser usada para amostras independentes ou relacionadas. O uso da análise de
série de tempos pode transformar os dados coletados em previsões para
acontecimentos futuros. O principal uso da análise de série de tempo é para
prever tendências (previsão de tendências) que depois de calculada, passa-se ao
processo de eliminar alguma variação sazonal que permaneceu na série de tempo
(eliminação de variações sazonais). Por fim, para avaliar a variação cíclica é
preciso obter as séries sem tendência e sem sazonalidade.
Esses temas e assuntos são indispensáveis para o uso na pesquisa,
principalmente para o pesquisador que necessitará de técnicas estatísticas para
analisar os dados coletados.
Referência
COLLIS, Jill; HUSSEY, Roger. Pesquisa em administração: um guia
prático para alunos de graduação e pós-graduação. 2 ed. Porto Alegre: Bookman,
2005.
Nenhum comentário:
Postar um comentário