Documente Academic
Documente Profesional
Documente Cultură
Name:
Rules:
• If you have questions, you may ask me or whoever is proctoring the exam. No aids in any
form from any others are allowed. Honor code applies to both helpers and seekers.
• What’s allowed to use: pens/pencils, a 4-page summary and the text book by Weisberg (or
a 4-page summary and the Lecture notes and handouts)
• Write your answers in the space provided under each problem. Use the back of a sheet if
necessary. Hand in the exam paper and the summary.
Problems:
1. What is multicollinearity and why can it be a bad thing in a regression analysis? Name at
least two remedies you should suggest if you were presented with such a situation in a data
analysis.
2. What is your rough estimated value of the R2 for the data set in Figure 1? What is a good
model to fit the data in Figure 1 (give a one-line formula).
3. A scientist is interested in investigating the relationship between quality of life (QoL) and
other constructs, such as, self-efficacy, social support, and depression-anxiety level. He
1
A scatter plot
••
•• ••
2.5
• ••
•
••
2.0
•
•
•
y
•
• ••
•
1.5
•
••
•
•
• •
1.0
••
• •
•
used linear regression to fit his data and found that only one construct, the depression-
anxiety level was significant while he thought that all constructs should have affected the
QoL. Explain what could have happened? What one can do to analyze the data and draw
sensible conclusions about the relationship?
4. What is ACE? Describe its model using a one-line formula. How can it be used to check if
a parametric model is reasonable fit to a data set?
5. A new method of teaching science to grade school students was evaluated in a pilot study.
2
First, a sample of students were randomly assigned to each of two groups. Then the first
group was taught by the standard method, while the second group was taught the same
material using the new method. Finally, both groups were tested and their scores recorded.
(a) What test/procedure(s) might be appropriate to see if the new method is better than
the standard? How, specifically, would you proceed in order to determine which of the
above procedures to apply?
(b) Now, suppose that the student in both of the groups above performed better, on the
average, than a third group of students who were not part of the study. What might
account for this?
3
6. Can Southern California’s water supply in future years be predicted from past data? One
factor affecting water availability is stream runoff. If runoff could be predicted, engineers,
planners and policy makers could do their jobs more efficiently.
The following dataset contains 43 years worth of precipitation measurements (in inches)
taken at six sights in the Owens Valley labeled APMAM (Mammoth Lake), APSAB (Lake
Sabrina), APSLAKE (South Lake), OPBPC (Big Pine Creek), OPRC (Rock Creek), and
OPSLAKE, and stream runoff volume (measured in acre-feet) at a sight near Bishop, Cali-
fornia (labeled BSAAM).
Use all you have learned to “analyze” this data set, as a good data analysist should do.
Due to the limited time, you do not have to actually conduct the analyses, but be sure
to provide the procedures/steps with appropriate one-line formulae that you’d use in your
analyses and discuss possible features in the data or cautions you need to note.
4
1975 7.90 4.42 6.78 11.50 9.55 12.56 77306
1976 9.38 8.30 9.70 6.80 5.25 4.73 44756
1977 7.08 4.40 3.90 4.05 4.35 4.60 41785
1978 11.92 5.78 6.70 25.30 20.55 21.94 112653
1979 3.88 2.26 3.10 15.97 11.83 13.88 79975
1980 5.80 3.10 3.34 24.40 19.15 23.78 106821
1981 2.70 2.22 2.48 8.99 9.45 12.14 69177
1982 18.08 11.96 13.02 18.55 18.40 19.45 120463
1983 8.20 4.98 5.76 19.25 22.90 23.86 135043
1984 7.65 5.30 5.74 14.45 13.15 14.42 102001
1985 5.22 4.42 4.04 11.45 10.16 13.06 77790
1986 4.93 3.26 4.58 26.47 15.33 26.46 118144
1987 5.99 2.76 3.98 4.80 6.85 6.36 61229
1988 6.83 6.82 5.18 7.20 9.01 9.88 58942
1989 8.80 5.06 4.92 8.05 9.60 9.58 53965
1990 7.10 5.06 6.05 5.80 6.50 8.41 49774
A pairwise plot and some simple summary statistics are provided below for your reference.
> summary(x)
Year APMAM APSAB APSLAKE
Min.:1948 Min.: 2.700 Min.: 1.4500 Min.: 1.7700
1st Qu.:1958 1st Qu.: 4.975 1st Qu.: 3.3900 1st Qu.: 3.3600
Median:1969 Median: 7.080 Median: 4.4600 Median: 4.6200
Mean:1969 Mean: 7.323 Mean: 4.6523 Mean: 4.9305
3rd Qu.:1980 3rd Qu.: 9.115 3rd Qu.: 5.6850 3rd Qu.: 5.8300
Max.:1990 Max.:18.080 Max.:11.9600 Max.:13.0200
5
5 10 15 2 4 6 8 12 5 10 15 20 25 40000 100000
• •• ••• •• •••• • • •• •• • •• • • •• ••
•• • • • •• • • • • • • • • • • •• •
1980
• • • •• • •• • •• • • • •• • • •• • •• •• • •• • • •
• •
• ••• • • •• • • • • • •• •• • • •• •• ••
••• • • •• • •• • •
•
• • • • • • • • • •• •• • • • •
Year •• • • • •
•
• •• • • •
• • •• •• ••• • • • • •• • • • • • • • • • •
• • •• • • •• • • ••
• • ••• • • • •• •• • • • • •• • • • ••• •• ••• • • •
• • •••• • •• • • • • •
• • • •
•• • • • •• • • •• • • • •• • •• • • ••• •
1950
•
•• • • •• •• •• •• • • • •• • •• • •
• ••
•
• •••
•
• • • • • • •
10 15
• • • • •• • •• • • •• • • • • • • •
• • APMAM • • • •• • • • • • • • • • •
• • ••• • • • • •• ••••••• • • •• •• •• • • • •••••• • • • • ••• •• • • ••••• • •• • • •• •
•• • • • •• • • • •• • • • •• ••• ••••••• • •• • •••• ••• • • • • • • • ••• • • • •• • • •••••• •• •• •
••• • • • •••• • • ••• •
••••••••• ••• • ••• •••••••• • •• • •• •• • •• • •
•• • • • • • • • •• • • • •
5
10
• • •• • • • •
• • • •• •
• • ••••
• •
••• • • •• • • •• •
•
•• • • • • • • •••••••• • •
• APSAB • • •• •••• ••• ••• • •• • •
•••••••• • •• ••• • •• • ••
6
• • • • • • • •
• •• • • • • • • • • •• • • • •• ••••••••••• •• • • •••••• ••• • • •• • • •••••• •• ••• • •
•• • • •• •••••••• •••• • •
•
•••• •• • • • • • •• • •• •• • •
•• ••• •• • ••••• • • •••••• • • • • • •• • • •• ••• • • • •• • •• • • • •
• • • • •• • •
• • • • • • •• • • • • •• •
2
• • • • •
• • • • • • •
Figure 2: Scatter Plot.
10
• • • • •• • • • • • • • •
•
•• • • •
•• ••• • • • ••
• •••• • •• • APSLAKE •••
• •
• • • • • •• • •
• • • •• • •• •
• •• • •• •
•
•• •
•
• •• •• • • • • ••• ••••••••• •• • •
6
• • •••
• •• • • •••• • • • •••• ••• • • • •••••• • • • • • ••••••• • • •
•
• •• •• • • • ••• •
••• • • • •
• •
••• • •• • •••• •• • • • •
• •• •• • • •• • • •• • • • • •• •• • • •
• •• ••• • •••••••• •• ••••• ••• • • • ••• •• • •• • • • • •
• • • •• • •• • • • •• • • ••• • • • •• •
2
• • • • • • •
30
•• • •• • •• •• •• • •• OPBPC • •• •• • ••
• • • • • •• • • • •
• • • •• • • •• •• • • •• • • •• • ••• • • • •• • •• • • •• • •• • • • • • •••• • •• •• ••• •• • • •
• •• • • • •• • • •• • • • • • •• • •
• • ••••••• •• •• ••••• • •••••••••••• • • • •••••••••••••• • ••••• ••••• •••
10
• •
•• • • • ••• •• • ••• • • •••• •• •• •• • ••• • • •• •• •• • •• •
• • • •• •
• • • • •• • • • • • •• • • • •••••• •• • •• ••••• •
25
• • • • • • •
• • • • • • •
• • •• • • • • • •• • • • • • •• • •
• • • • • • • • • • •• • •• ••
•• •• • • • • •• • • • • • • •
15
• • • •
• • •• • • • •• •• • • • OPRC • •• • • •• •
• • • • •• • • •• • • • •• • ••• • • •• • • ••••• • •• • •
•• •• • •• • • • • ••• •• • • ••••• •• • •• • ••• ••••• •••
• • • • • • • • • ••• •• •• • • • • • •
• • • ••• •• •• •
•• •• ••••
• • ••• • • • • • •• • • • •
• • •• • • • •• • •• • • • •• • • ••••••••• • •
• •••• ••••• ••
• • • • •• •• ••
5
• • •
• • • • • • •
• • • • • • •
25
• • •• • • •• •• • •• • • • • • •• • • ••• • • •• • •• •• •
• • •• •
•
• • • • •
• • •• •
•
• •• • • •
•••• • • • • • •
• OPSLAKE • ••• • •
15
• • • •
• •• • • ••••••••• •• • • •••• • •• • • •• • • ••• • • • • • •••• • ••••••••• • • ••••• ••• •
••
• • •• •• • •
•• • •• • •••• • ••••••••• •
• • • • • • • •• •• • • • ••• • •••••• • • ••• • ••• • • • • • • •• • • • ••
••••••• ••
••••••••••• •••••••••• ••
• • • • • • ••• • •• ••
5
• • • • • • •
120000
• • • • • • •
• •
• ••• • •
• •• • •• • •
• •• •
• • • ••
• • ••
•
•
• • ••
•
• •• •
••
• •• •
••
• •• •• • •
• • •
• • •• • •
••
• •
• • •• • • • ••• • • •• • • • • • •• •
• ••
BSAAM
••• ••• •
• • •••••••••• • •••
• •• • • • •• • •• • • ••
••••••• •
••
••• • • • •
•
• • • • • • •• ••• • • • • • • ••••• •••• •• ••••••••• • •• • • • ••••••
•• ••• • •• • ••• • •• •••••••••• • •• •• •• •
40000
• • •• • •• • ••
• •• • • • • • • • • • •• • • • •• •• •
• • • •••
1950 1970 1990 2 4 6 8 10 10 20 30 40 5 15 25