sexta-feira, 20 de junho de 2008

SEGUNDO TESTE_FINAL DO 2º SEMESTRE


























































REVISÕES 2

SPSS_GRÁFICO DE DISPERSÃO:


















SPSS_IMAGEM DO OUTPUT:

















REVISÕES 2:





















REVISÕES 2_ GRÁFICO EXCEL:

terça-feira, 13 de maio de 2008

PRIMEIRO TESTE_13 DE MAIO

TESTE:


















GRÁFICO:


TESTE MODELO_PARTE TEÓRICA

1. As medidas de dispersão são o Desvio (absoluto) médio, a Variância e o Desvio Padrão.

1.1. Qual a vantagem do desvio padrão relativamente ao desvio médio?

R: A vantagem é que o desvio médio matemáticamente é muito complicado de fazer, por causa dos módulos.

1.2. Qual a vantagem do desvio padrão relativamente à variância?

R: A vantagem do desvio padrão em relação à variância, é encontar-se expresso na unidade em que os dados foram medidos.

1.3. Define intervalo de variação.

R: É a diferença entre os valores máximo e mínimo da variável.
1.4. Define intervalo inter-quartis

R: É a diferença entre o terceiro e o primeiro quartis. Correspondendo a 50% das observações centrais.

1.5. Define coeficiente de variação.

R: É a medida relativa de dispersão, útil para a compreensão em termos relativos do grau de concentração em torno das médias, de distribuição de frequências distintas. É dado pela relação entre desvio-padrão e média da distribuição, em termo percentuais.

2. Imagine que à variável x foi adicionado o valor de uma constante, k. Indique o que sucedeu:

a) ao desvio médio; R: O desvio médio não sofreu alteração.

b) à variância; R: A variância não sofreu alteração.

c) ao desvio-padrão; R: O desvio-padrão não sofreu alteração.

d) ao intervalo de variação; R: Manteve

e) ao intervalo inter-quartis; R: Manteve

f) ao coeficiente de variação. R: Manteve

3. Imagine que a variável x foi multiplicada pelo valor de uma constante, k. Indique o que sucedeu:

a) ao desvio médio; R: Aumentou 20x o valor

b) à variância; R: Aumentou 40x o valor

c) ao desvio-padrão; R: Aumentou 20x o valor

d) ao intervalo de variaão; R: Manteve

e) ao intervalo inter-quartis; R: Aumentou 20x o valor

f) ao coeficiente de variação. R: Aumentou 20x

Sugestão: Construa uma folha de cálculo para visualizar as alterações propostas no ponto 2. e no ponto 3.


terça-feira, 29 de abril de 2008

sexta-feira, 18 de abril de 2008

IDH (HDI)

O Índice de Desenvolvimento Humano (Human Development Index) é certamente dos indicadores mais frequentemente utilizados nas comparações internacionais. Descarregue os dados mais recentes disponíveis em folhas de Excel, no endereço http://hdr.undp.org/en/statistics/data/.
1) Utilizando apenas os países de desenvolvimento humano elevado (os primeiros 70), calcula uma matriz de correlações entre as diversas variáveis:



















2) Comenta os coeficientes de correlação mais significativos.
3) Justifica a opção por trabalhar apenas com os países de desenvolvimento elevado.
R: Pelo facto destes 70 países pertencerem ao grupo com maoir índice de desenvolvimento humano, e por apresentarem valores mais homogéneos.
4) Investigue outras variáveis susceptíveis de explicar o desenvolvimento humano, explorando os indicadores contidos no Relatório do Desenvolvimento Humano (ficheiro hdr_20072008_tables.zip).

quinta-feira, 17 de abril de 2008

COEFICIENTE DE CORRELAÇÃO DE PEARSON - r

Quando tomamos as variáveis duas a duas podemos verificar o que sucede a uma variável, x, quando outra variável, y, varia. São então possíveis três situações particularmente interessantes: a) Quando a variável x toma valores maiores (menores) a variável y também toma valores maiores (menores); b) Quando a variável x toma valores maiores (menores) a variável y toma valores menores(maiores); c) A variável x toma valores maiores (menores) independentemente dos que a variável y apresenta. No primeiro caso diremos que as variáveis estão positivamente (ou directamente) correlacionadas. No limite, isto é, se a correlação for "perfeita" - como é o caso se considerarmos a correlação da variável x consigo própria - o coeficiente de correlação será igual a 1. No segundo caso diremos que as variáveis estão negativamente (ou inversamente) correlacionadas. No limite, isto é, se a correlação for "perfeita" o coeficiente de correlação será igual a -1. No terceiro caso diremos que as variáveis não estão correlacionadas. No limite, isto é, em caso de "absoluta independência" o coeficiente de correlação será igual a 0. Na prática os valores acima indicados nunca se encontram, mas são estes que deverão tomar-se como referência na interpretação dos parâmetros obtidos.




EXERCÍCIOS:



0) - Indique uma justificação para a redução da base de dados acima solicitada.




R: O motivo de se selecionarem apenas 100 registos, é pela simplificação da representação gráfica.




3) - Verifique que a disciplina de Biologia é aquela que evidencia maior correlação. Simultâneamente estes professores seriam os primeiros a ser "crucificados" pela diferença CIF-CE! Tente explicar esta aparente contradição.
R: Significa que os alunos que têm melhores notas no exame, já tinha tido ainda notas melhores em CFI'S.


2) GRÁFICOS DE DISPERSÃO:






































QUADRO SÍNTESE:




terça-feira, 1 de abril de 2008

MÉDIA E DESVIO PADRÃO - EFEITO DA ADIÇÃO E DA MULTIPLICAÇÃO DE UMA CONSTANTE





















1. Calcule a média utilizando a fórmula do Excel, MEDIA.

2. Calcule o desvio padrão utilizando a fórmula do Excel, DESVPADP.

3. Atribua mais 2 valores a cada um dos alunos, e recalcule a média e o desvio padrão.

4. Regressando à distribuição inicial, multiplique cada um dos valores por 3, e recalcule a média e o desvio padrão.

5. Comente os resultados que obteve.

Verifico que após adição de 2 valores, não houve alteração no que diz respeito ao desvio padrão, em relação a média, verifico que o valor também aumenta 2 valores. Os resultados apresentados após a multiplicação por 3 valores, tanto no desvio padrão como na média triplicaram os valores.

MEDIDAS DE ASSIMETRIA E DE ACHATAMENTO

As medidas de assimetria permitem distinguir as distribuições simétricas (Média = Moda = Mediana) das assimétricas. No caso das distribuições assimétricas estas podem ter assimetria positiva (Moda <= Mediana <= Média) ou assimetria negativa (Média <= Mediana <= Moda).

Para qualquer dos indicadores, uma distribuição simétrica resultará num valor igual a 0 (zero);Se a distribuição for assimétrica positiva resultará num valor superior a 0 (zero); Se a distribuição for assimétrica negativa resultará num valor inferior a 0 (zero).O achatamento ou curtose mede o grau de afilamento da curva relativamente à normal.


1) Continuando a utilizar os dados referentes ao Exames Nacionais de 2003, calcula os indicadores de assimetria (G, G1 e G2) e de achatamento (K) da distribuição das CIF e da distribuição das CE, em:





RANKING DE ESCOLAS

Verifica se são verdadeiras as seguintes afirmações:
1) média CE é menor que a média CIF em todas as disciplinas -Verdadeiro

2) desvio padrão das CE é maior que o desvio padrão das CIF em todas as disciplinas - Verdadeiro

3) médias CE são mais baixas no grupo Matemática e Ciências que em Português e Literárias - Verdadeiro

4) desvios padrão dos CE são maiores no grupo Matemática e Ciências que em Português e Literárias - Verdadeiro

5) diferença média CIF – média CE é maior no grupo Matemática e Ciências que em Português e Literárias - Verdadeiro


Rankings de Escolas - Quadro Síntese







terça-feira, 4 de março de 2008

MEDIDAS DE DISPERSÃO

As medidas de dispersão são o Desvio (absoluto) médio, a Variância e o Desvio Padrão; o Intervalo de Variação e o Intervalo Inter-Quartis, que são medidas de distância costumam apresentar-se conjuntamente com as primeiras; o Coeficiente de Variação permite concluir da representatividade da média.


Intervalo de Variação
Calcula-se o Intervalo de Variação fazendo a diferença entre os valores máximo e mínimo da variável. Se os dados estiverem agrupados será o limite superior da última classe menos o limite inferior da primeira.EX:Como por definição: IV = Ponto MAX – Ponto MINEntão, IV = 210 – 180 = 30Portanto a maior diferença que será possível encontrar entre dois jogadores é de 30 cm.


Intervalo Inter-Quartis


O Intervalo Inter-Quartis compreende 50% das observações centrais, excluindo 25% de cada extremo.Recordando a imagem utilizada na definição dos quartis:Define-se o Intervalo Inter-QuartisIQ = Q3/4 – Q1/4Evidentemente que é necessário calcular os 1º e 3º quartis. Para o efeito, parte-se das frequências relativas acumuladas.


Desvio (absoluto) Médio


Calcula-se somando as diferenças, em valor absoluto, entre os valores observados da variável e a sua média, ponderadas pelo número das observações.
Variância e Desvio Padrão


Estas duas medidas apresentam-se juntas porque o Desvio Padrão é a raiz quadrada positiva da Variância.Como os módulos são difíceis de trabalhar matematicamente - na desvio médio - substitui-se essa operação pelo quadrado dos desvios, obtendo a Variância. Depois calcula-se o Desvio Padrão para regressar a um indicador expresso nas mesmas unidades.


Coeficiente de variação


Expressa a relação percentual entre o desvio padrão e a média. O valor deste indicador é independente das unidades utilizadas na distribuição de frequências. Exactamente por esse motivo é particularmente útil para comparar diferentes distribuições. Um coeficiente de variação superior a 50% indica muito elevada dispersão dos valores relativamente à média, e consequentemente será reduzida a sua representatividade como medida estatística.


EXERCÍCIOS:

1) Confere os cálculos apresentados construindo um ficheiro do Excel semelhante ao modelo.













2) Recalcula as medidas de dispersão considerando os novos dados:
a)














b)











3 - O que é que concluis das alterações verificadas nos indicadores das medidas de dispersão?

Resposta_Em relação ao desvio padrão não se verificou alteração com a soma de mais 2. No caso da média verificou-se que o valor é igual a +2. No que diz respeito à multiplicação quer o desvio padrão quer a média ficaram alterados.

4 - Confira os cálculos que efectuou para as três distribuições, utilizando agora as seguintes funções do Excel: QUARTIL; DESV.MEDIO e DESVPADP.




















5 - Escreva a Fórmula de King para o cálculo da moda, partindo do ficheiro de ajuda.

25 - Portal do INE

sexta-feira, 18 de janeiro de 2008

terça-feira, 15 de janeiro de 2008

sexta-feira, 11 de janeiro de 2008

segunda-feira, 7 de janeiro de 2008

21 - Revisões






















Gráfico de Barras














Polígono de frequências











sexta-feira, 4 de janeiro de 2008

20 - Dados agrupados - Média, mediana e moda

3)

Média_1.93
Mediana_1.94
Classe modal_[1.91;1.99[


2)


Média_65
Mediana_65.43
Classe modal_[65-75[


1)


Média_62.24
Mediana_61.77
Classe modal_[55-65[












19 - Dados não agrupados - Média, mediana e moda

1. Considera os seguintes dados:10, 11, 17, 15, 14, 13, 12, 12, 12, 14, 15

Calcula a média(calcula-se somando as classificações, dividindo este total pelo seu número)
A média é (10+11+17+15+14+13+12+12+12+14+15)/11=13 .

Indica a moda(é o valor com maior frequência)
A moda é 12.

Determina a mediana(é a observação que separa 50% dos valores mais baixos dos 50% mais altos)
A mediana é 13.

2. Considera os seguintes dados:8, 9, 18, 16, 14, 13, 11, 7, 12, 14, 15

Calcula a média(calcula-se somando as classificações, dividindo este total pelo seu número)
A média é (8+9+18+16+14+13+11+7+12+14+15)/11=12.

Indica a moda(é o valor com maior frequência)
A moda é 14.

Determina a mediana(é a observação que separa 50% dos valores mais baixos dos 50% mais altos)
A mediana é 13.

18 - População empregada e remunerações médias por sectores de actividades