Introdução à Probabilidade e à Estatística - CTEC

Report
1
Introdução à Probabilidade e à
Estatística
Aula 01
Prof. Christopher Freire Souza
Centro de Tecnologia
Universidade Federal de Alagoas
www.ctec.ufal.br/professor/cfs
2
Introdução à Probabilidade e à
Estatística
•
•
•
•
Termos básicos
Hidrologia estatística
Tipos de dados
Pensamento crítico
3
Termos básicos
• Dados
▫ Observações coletadas
• Evento
▫ Qualquer conjunto de resultados ou conseqüências de
um experimento/estudo que caracterizem um
fenômeno
• Amostra
▫ Subconjunto de Informações
• População
▫ Todo o grupo de informações
• Censo
▫ Conjunto de dados obtidos de todo o grupo
4
Termos básicos
• Estatística - origem no latim ‘status’=estado;
▫ medida numérica que descreve alguma característica de um
subconjunto de informações (amostra);
▫ conjunto de métodos para o planejamento de estudos e
experimentos, obtenção de dados e conseqüente
organização, resumo, apresentação, análise, interpretação e
elaboração de conclusões básicas dos dados.
• Parâmetro – origem no grego ‘par(a)+metro’=quasemedição
▫ Medida numérica que descreve alguma característica de
uma população
• Probabilidade
▫ “grau de crença” ou chance de ocorrência de um evento
particular
5
Hidrologia Estatística
•
•
•
•
Conceitos Fundamentais
Variáveis
Séries
Dados
6
Conceitos Fundamentais
• Hidrologia - geociência que investiga os fenômenos que
determinam a distribuição espaço-temporal da água.
• Fenômenos – Ocorrências que definem os mecanismos
de armazenamento e transporte entre as diversas fases
do ciclo da água. Ex.: precipitação
• Processos - funções do tempo, ou do espaço, que
descrevem a intensidade de fenômenos hidrológicos. Ex.:
hidrograma típico.
▫ Existe forte influência da ação do sol nos processos
hidrológicos. Informações com discretização menor que um
ano apresentam tendência a uma periodicidade de um ano
na ocorrência de eventos hidrológicos.
7
Conceitos Fundamentais
• Processos Determinísticos - resultam da aplicação de leis
da física, química e/ou biologia.
• Processos Estocásticos - governados por leis de
probabilidade por conterem variáveis aleatórias.
• Modelos Mecanísticos – a forma da função é construída
a partir do mecanismo físico básico, que relaciona
variáveis.
• Modelos Empíricos - conhece-se as variáveis interrelacionadas, mas não a forma como estas se relacionam.
Observações são agrupadas para sua elaboração.
▫ Ex.: Q = f(A)
8
Variáveis Hidrológicas - Conceitos
• Variável - símbolo que representa uma característica de
fenômeno, cujo valor pode variar ao longo da análise a
depender da dimensão (tempo, espaço) em consideração.
• Variável Hidrológica – símbolo cujo valor descreve a variação
temporal ou espacial dos fenômenos hidrológicos.
▫ Ex.: P→Precipitação
• Variável Univariada - associa-se a ela apenas um atributo de
quantidade ou qualidade de águas.
▫ Ex.: vazão em uma seção.
• Variável Multivariada - mais de um atributo está associado a
ela.
▫ Ex.: índice de risco de inundação
9
Séries Hidrológicas - Conceitos
• Séries de dados medidos ou observados, registrados em
intervalos discretos, em função da limitação do processo
de monitoramento.
• Séries Completas - contém registros sem falhas.
▫ Ex.: séries de dados diários
• Séries Reduzidas - contém apenas alguns valores da série
completa.
▫ Em função do objetivo do estudo e visando a minimizar
distorções nas estimativas, utiliza-se de intervalos menos
discretos, sendo eles uniformes (e.g., séries mensais,
anuais, decadais) ou não (séries de durações parciais).
▫ Ex.: séries de mínimas anuais, i.e., séries consistidas dos
menores dados diários por ano
10
Séries Hidrológicas - Conceitos
• Estacionariedade - estatística não se altera de forma
significativa.
• Homogeneidade - padrão de variabilidade é mantido.
• Representatividade - valores da série representam a
variabilidade de valores do fenômeno.
11
Séries Hidrológicas
• Para séries anuais, recomenda-se identificar a janela de
doze meses que melhor enquadre os eventos
hidrológicos sob análise (também denominada ano
hidrológico).
• Esta consideração objetiva diminuir o risco de ter um
mesmo evento hidrológico de interesse influenciando
duas informações na série de dados, em favor da
independência da série de dados.
12
Séries Hidrológicas (Ano hidrológico)
• Estudos em engenharia e
ecologia têm interesse em
períodos com magnitudes
extremas de vazão, para
os quais se define:
Hidrogramas do posto 18850000
88-89
99-00
00-01
01-02
2.5
2
Q(m³/s)
▫ Ano hidrológico de cheia –
Inicia no mês com maior
freqüência de ocorrência de
vazões mínimas anuais.
 Ex.: Em Xingó, o ano
hidrológico de cheia vai
de setembro a setembro.
4
x 10
1.5
1
0.5
0
O
N
D
J
F
M
A
M
J
J
A
S
Rio Xingú em Altamira,
próximo à UHE Belo Monte
O
13
Séries Hidrológicas (Ano hidrológico)
Hidrogramas do posto B.ESPERANCA
05-06
2500
98-99
2000
89-90
Q(m³/s)
▫ Ano hidrológico de seca –
período de doze meses que
compreende a estiagem.
Emprega-se (Gordon et al.
2004) seis meses de
defasagem em relação ao
ano hidrológico de cheia.
 Ex.: Para Xingó, o ano
hidrológico de seca seria
definido de março a
março.
1500
80-81
1000
71-72
500
0
M
62-63
A M
J
J
A
S O
N D
Rio Jaguaribe na
UHE Boa Esperança
J
F
F
14
Séries Hidrológicas (parciais)
• Para séries de valores extremos anuais, considera-se um
intervalo regular de um ano entre informações consecutivas.
Esta consideração pode acarretar em tendenciosidade no
estudo de eventos mais freqüentes que um ano.
• Para minimizar essa tendenciosidade, trabalha-se séries com
intervalos menos discretos e não-uniformemente espaçados,
ao aliar aos dados de magnitude de eventos de interesse a
informação de espaçamento entre dados escolhidos (séries de
durações parciais). Para tanto, considera-se todos os eventos
que atendem um critério pré-estabelecido.
▫ Ex.:Superação de uma magnitude específica quando do estudo de
cheias, onde apenas o dado mais extremo de cada evento de
superação do valor pré-definido passa a fazer parte da nova série
de dados.
15
Dados Hidrológicos
• Tipos: climatológicos, pluviométricos, fluviométricos,
evaporimétricos, sedimentométricos e de indicadores de
qualidade de água.
• Validade – Grau com que os dados representam o que foi
medido.
▫ Ex.: Comparar o resultado de aplicação de procedimentos
diferentes a mesma amostra e obter resultados similares
• Confiabilidade do modelo – Consistência.
▫ Ex.: Comparar o valor do teste de QI executado numa data com
outro executado em outra data
• Atualização dos dados – Mudanças nos processos
demandam alteração dos dados. Necessidade de revisar
parâmetros de modelos.
16
Dados Hidrológicos (erros)
• Ausência de dados – Razão aleatória ou sistemática.
Falha sistemática demanda por modificação do sistema
de coleta de dados.
• Erros de dados: aleatórios, sistemáticos e grosseiros
▫ Aleatórios - inerentes à medição/observação.
▫ Sistemáticos - Exigem mudança de técnica de medição, calibração
ou na coleta, transmissão ou processamento
▫ Grosseiros - falhas anormais e falta de cuidado na
medição/observação/transcrição
• Erros de Amostragem- diferenças entre estatística e
parâmetro
17
Tipos de dados
• Quanto à forma:
▫ Quantitativos: discretos (número anterior de dias sem
chuva) e contínuos (total precipitado num período)
▫ Qualitativos (presença de metais pesados)
• Quanto à mensuração
▫ Nominais (cor da água)
▫ Ordinais (classificação da qualidade)
▫ Intervalares (temperatura)
▫ Razão (vazões)
18
Pensamento Crítico
• Mais importante que
▫ saber usar as técnicas de análise estatística
• É
▫ saber analisar quando se pode usar a técnica ou mesmo
▫ saber analisar a aplicação da técnica
19
Pensamento Crítico
• Para isto, sugere-se observar:
▫ A técnica e o tamanho da amostragem
 Amostras a partir de resposta voluntária, como envio de
questionários pela internet, normalmente apresentam resposta
de quem tem opinião mais forte
 Não-resposta tem o mesmo aspecto do anterior e deve ser
considerada
 Pequenas amostras podem não representar a variabilidade do
fenômeno em análise
 Dados ausentes: Falhas sempre nas cheias por dificuldade de
leitura
20
Pensamento Crítico
• Sugere-se observar ainda:
▫ A representação dos
resultados
 Gráficos: eixo-y
21
Pensamento Crítico
• Sugere-se observar ainda:
▫ A representação dos
resultados
 Gráficos: eixo-y
 Pictogramas
22
Pensamento Crítico
• Sugere-se observar ainda:
▫ A representação dos
resultados
 Gráficos: eixo-y
 Pictogramas
 Porcentagens
• 75% = 150000/200000
• 75%=3/4
23
Pensamento Crítico
• Sugere-se observar ainda:
▫ A representação dos
resultados




Gráficos: eixo-y
Pictogramas
Porcentagens
Precisão na apresentação
de números
• Estima-se que há agora
103.215.027 famílias nos
Estados Unidos
24
Pensamento Crítico
• Sugere-se observar também:
▫ A formulação de questões
 Direcionamento de questões
 Ex.: Taxas reais de resposta sim:
 97%: O presidente deve ter poder de veto para eliminar
desperdícios?
 57%: O presidente deve ter poder de veto, ou não?
 Ordem de opções em questões
 Você diria que o tráfego (45%) contribui mais ou menos
do que a indústria (27%) para a poluição do ar?
 Você diria que a indústria (24%) contribui mais ou
menos do que o tráfego (57%) para a poluição do ar?
25
Pensamento Crítico
▫ Quem está realizando/bancando os estudos
 Estudo de interesse próprio
 Empresa de graxa de sapato, Kiwi Brands, encomenda pesquisa
para saber se sapatos gastos eram a razão mais comum para
candidato ao emprego não causar boa impressão
 Cenários Parciais
 “90% de todos os nossos carros vendidos neste país nos últimos
10 anos ainda estão rodando”. A maioria dos carros foi
produzida nos últimos 3 anos.
 Distorções deliberadas
 Revista Corporate Travel publicou resultados mostrando que a
Avis era a vencedora em pesquisa com pessoas que alugavam
carros. Hertz pediu informação detalhada. Respostas
desapareceram e na justiça revista e Avis (propaganda
enganosa) entraram em acordo com a Hertz.
26
Pensamento Crítico
▫ Correlação e causalidade
 Haver correlação não significa que exista uma
relação de causa e efeito
 Ex: Homicidas podem se alimentar sempre de pão, mas
não necessariamente o pão leva alguém a ser homicida
(a não ser que o padeiro mereça)

similar documents