Sunteți pe pagina 1din 6

STAT 325/425, Final Examination

12:30-3:30 PM on Tuesday, December 9, 2008

Name:
Rules:

• If you have questions, you may ask me or whoever is proctoring the exam. No aids in any
form from any others are allowed. Honor code applies to both helpers and seekers.

• What’s allowed to use: pens/pencils, a 4-page summary and the text book by Weisberg (or
a 4-page summary and the Lecture notes and handouts)

• Write your answers in the space provided under each problem. Use the back of a sheet if
necessary. Hand in the exam paper and the summary.

Problems:

1. What is multicollinearity and why can it be a bad thing in a regression analysis? Name at
least two remedies you should suggest if you were presented with such a situation in a data
analysis.

2. What is your rough estimated value of the R2 for the data set in Figure 1? What is a good
model to fit the data in Figure 1 (give a one-line formula).

3. A scientist is interested in investigating the relationship between quality of life (QoL) and
other constructs, such as, self-efficacy, social support, and depression-anxiety level. He

1
A scatter plot

••

•• ••

2.5
• ••

••

2.0



y

• ••

1.5

••


• •
1.0

••
• •

−1.5 −1.0 −0.5 0.0 0.5 1.0

Figure 1: Scatter Plot.

used linear regression to fit his data and found that only one construct, the depression-
anxiety level was significant while he thought that all constructs should have affected the
QoL. Explain what could have happened? What one can do to analyze the data and draw
sensible conclusions about the relationship?

4. What is ACE? Describe its model using a one-line formula. How can it be used to check if
a parametric model is reasonable fit to a data set?

5. A new method of teaching science to grade school students was evaluated in a pilot study.

2
First, a sample of students were randomly assigned to each of two groups. Then the first
group was taught by the standard method, while the second group was taught the same
material using the new method. Finally, both groups were tested and their scores recorded.

(a) What test/procedure(s) might be appropriate to see if the new method is better than
the standard? How, specifically, would you proceed in order to determine which of the
above procedures to apply?

(b) Now, suppose that the student in both of the groups above performed better, on the
average, than a third group of students who were not part of the study. What might
account for this?

3
6. Can Southern California’s water supply in future years be predicted from past data? One
factor affecting water availability is stream runoff. If runoff could be predicted, engineers,
planners and policy makers could do their jobs more efficiently.
The following dataset contains 43 years worth of precipitation measurements (in inches)
taken at six sights in the Owens Valley labeled APMAM (Mammoth Lake), APSAB (Lake
Sabrina), APSLAKE (South Lake), OPBPC (Big Pine Creek), OPRC (Rock Creek), and
OPSLAKE, and stream runoff volume (measured in acre-feet) at a sight near Bishop, Cali-
fornia (labeled BSAAM).
Use all you have learned to “analyze” this data set, as a good data analysist should do.
Due to the limited time, you do not have to actually conduct the analyses, but be sure
to provide the procedures/steps with appropriate one-line formulae that you’d use in your
analyses and discuss possible features in the data or cautions you need to note.

The DWP Data

Year APMAM APSAB APSLAKE OPBPC OPRC OPSLAKE BSAAM


1948 9.13 3.58 3.91 4.10 7.43 6.47 54235
1949 5.28 4.82 5.20 7.55 11.11 10.26 67567
1950 4.20 3.77 3.67 9.52 12.20 11.35 66161
1951 4.60 4.46 3.93 11.14 15.15 11.13 68094
1952 7.15 4.99 4.88 16.34 20.05 22.81 107080
1953 9.70 5.65 4.91 8.88 8.15 7.41 67594
1954 5.02 1.45 1.77 13.57 12.45 13.32 65356
1955 6.70 7.44 6.51 9.28 9.65 9.80 67909
1956 10.50 5.85 3.38 21.20 18.55 17.42 92715
1957 9.10 6.13 4.08 9.55 9.20 8.25 70024
1958 8.75 5.23 5.90 15.25 14.80 17.48 99216
1959 8.10 3.77 4.56 9.05 6.85 9.56 55786
1960 3.75 1.47 1.78 4.57 6.10 7.65 46153
1961 10.15 5.09 4.86 8.90 7.15 9.00 47947
1962 6.15 3.52 3.30 16.90 14.75 17.68 76877
1963 12.75 8.17 10.16 16.75 11.55 15.53 88443
1964 7.35 4.33 4.85 5.25 7.45 8.20 54634
1965 11.25 6.56 7.60 8.40 13.20 13.29 78806
1966 4.05 1.90 2.00 10.85 8.25 12.56 56542
1967 12.65 6.62 7.14 23.25 17.00 23.66 116244
1968 4.65 3.84 3.34 7.10 6.80 8.28 60857
1969 5.35 3.62 4.62 43.37 24.85 33.07 146345
1970 4.05 1.98 2.94 8.95 11.25 11.00 73726
1971 5.90 5.72 5.42 8.45 10.90 10.82 65530
1972 9.45 4.82 6.79 7.90 7.60 8.06 60772
1973 3.45 2.63 2.88 14.80 14.70 15.86 91696
1974 4.25 2.54 2.36 18.05 16.90 16.42 87377

4
1975 7.90 4.42 6.78 11.50 9.55 12.56 77306
1976 9.38 8.30 9.70 6.80 5.25 4.73 44756
1977 7.08 4.40 3.90 4.05 4.35 4.60 41785
1978 11.92 5.78 6.70 25.30 20.55 21.94 112653
1979 3.88 2.26 3.10 15.97 11.83 13.88 79975
1980 5.80 3.10 3.34 24.40 19.15 23.78 106821
1981 2.70 2.22 2.48 8.99 9.45 12.14 69177
1982 18.08 11.96 13.02 18.55 18.40 19.45 120463
1983 8.20 4.98 5.76 19.25 22.90 23.86 135043
1984 7.65 5.30 5.74 14.45 13.15 14.42 102001
1985 5.22 4.42 4.04 11.45 10.16 13.06 77790
1986 4.93 3.26 4.58 26.47 15.33 26.46 118144
1987 5.99 2.76 3.98 4.80 6.85 6.36 61229
1988 6.83 6.82 5.18 7.20 9.01 9.88 58942
1989 8.80 5.06 4.92 8.05 9.60 9.58 53965
1990 7.10 5.06 6.05 5.80 6.50 8.41 49774

A pairwise plot and some simple summary statistics are provided below for your reference.

> summary(x)
Year APMAM APSAB APSLAKE
Min.:1948 Min.: 2.700 Min.: 1.4500 Min.: 1.7700
1st Qu.:1958 1st Qu.: 4.975 1st Qu.: 3.3900 1st Qu.: 3.3600
Median:1969 Median: 7.080 Median: 4.4600 Median: 4.6200
Mean:1969 Mean: 7.323 Mean: 4.6523 Mean: 4.9305
3rd Qu.:1980 3rd Qu.: 9.115 3rd Qu.: 5.6850 3rd Qu.: 5.8300
Max.:1990 Max.:18.080 Max.:11.9600 Max.:13.0200

OPBPC OPRC OPSLAKE BSAAM


Min.: 4.050 Min.: 4.350 Min.: 4.600 Min.: 41785.0
1st Qu.: 7.975 1st Qu.: 7.875 1st Qu.: 8.705 1st Qu.: 59857.0
Median: 9.550 Median:11.110 Median:12.140 Median: 69177.0
Mean:12.836 Mean:12.002 Mean:13.522 Mean: 77756.0
3rd Qu.:16.545 3rd Qu.:14.975 3rd Qu.:16.920 3rd Qu.: 92205.5
Max.:43.370 Max.:24.850 Max.:33.070 Max.:146345.0

5
5 10 15 2 4 6 8 12 5 10 15 20 25 40000 100000
• •• ••• •• •••• • • •• •• • •• • • •• ••
•• • • • •• • • • • • • • • • • •• •

1980
• • • •• • •• • •• • • • •• • • •• • •• •• • •• • • •
• •
• ••• • • •• • • • • • •• •• • • •• •• ••
••• • • •• • •• • •

• • • • • • • • • •• •• • • • •
Year •• • • • •

• •• • • •
• • •• •• ••• • • • • •• • • • • • • • • • •
• • •• • • •• • • ••
• • ••• • • • •• •• • • • • •• • • • ••• •• ••• • • •
• • •••• • •• • • • • •
• • • •
•• • • • •• • • •• • • • •• • •• • • ••• •

1950

•• • • •• •• •• •• • • • •• • •• • •
• ••

• •••

• • • • • • •
10 15

• • • • •• • •• • • •• • • • • • • •
• • APMAM • • • •• • • • • • • • • • •
• • ••• • • • • •• ••••••• • • •• •• •• • • • •••••• • • • • ••• •• • • ••••• • •• • • •• •
•• • • • •• • • • •• • • • •• ••• ••••••• • •• • •••• ••• • • • • • • • ••• • • • •• • • •••••• •• •• •
••• • • • •••• • • ••• •
••••••••• ••• • ••• •••••••• • •• • •• •• • •• • •
•• • • • • • • • •• • • • •
5

• • •• • •• • •• • • ••••• •• • •• • • ••• • •• •••• • •• • •• ••• • • ••


• • • • • • •

10
• • •• • • • •
• • • •• •
• • ••••
• •
••• • • •• • • •• •

•• • • • • • • •••••••• • •
• APSAB • • •• •••• ••• ••• • •• • •
•••••••• • •• ••• • •• • ••

6
• • • • • • • •
• •• • • • • • • • • •• • • • •• ••••••••••• •• • • •••••• ••• • • •• • • •••••• •• ••• • •
•• • • •• •••••••• •••• • •

•••• •• • • • • • •• • •• •• • •
•• ••• •• • ••••• • • •••••• • • • • • •• • • •• ••• • • • •• • •• • • • •
• • • • •• • •
• • • • • • •• • • • • •• •

2
• • • • •
• • • • • • •
Figure 2: Scatter Plot.

10

• • • • •• • • • • • • • •


•• • • •
•• ••• • • • ••
• •••• • •• • APSLAKE •••
• •
• • • • • •• • •
• • • •• • •• •
• •• • •• •

•• •

• •• •• • • • • ••• ••••••••• •• • •
6

• • •••
• •• • • •••• • • • •••• ••• • • • •••••• • • • • • ••••••• • • •

• •• •• • • • ••• •
••• • • • •
• •
••• • •• • •••• •• • • • •
• •• •• • • •• • • •• • • • • •• •• • • •
• •• ••• • •••••••• •• ••••• ••• • • • ••• •• • •• • • • • •
• • • •• • •• • • • •• • • ••• • • • •• •
2

• • • • • • •

30
•• • •• • •• •• •• • •• OPBPC • •• •• • ••
• • • • • •• • • • •
• • • •• • • •• •• • • •• • • •• • ••• • • • •• • •• • • •• • •• • • • • • •••• • •• •• ••• •• • • •
• •• • • • •• • • •• • • • • • •• • •
• • ••••••• •• •• ••••• • •••••••••••• • • • •••••••••••••• • ••••• ••••• •••

10
• •
•• • • • ••• •• • ••• • • •••• •• •• •• • ••• • • •• •• •• • •• •
• • • •• •
• • • • •• • • • • • •• • • • •••••• •• • •• ••••• •
25

• • • • • • •
• • • • • • •
• • •• • • • • • •• • • • • • •• • •
• • • • • • • • • • •• • •• ••
•• •• • • • • •• • • • • • • •
15

• • • •
• • •• • • • •• •• • • • OPRC • •• • • •• •
• • • • •• • • •• • • • •• • ••• • • •• • • ••••• • •• • •
•• •• • •• • • • • ••• •• • • ••••• •• • •• • ••• ••••• •••
• • • • • • • • • ••• •• •• • • • • • •
• • • ••• •• •• •
•• •• ••••
• • ••• • • • • • •• • • • •
• • •• • • • •• • •• • • • •• • • ••••••••• • •
• •••• ••••• ••
• • • • •• •• ••
5

• • •
• • • • • • •
• • • • • • •

25
• • •• • • •• •• • •• • • • • • •• • • ••• • • •• • •• •• •
• • •• •

• • • • •
• • •• •

• •• • • •
•••• • • • • • •
• OPSLAKE • ••• • •

15
• • • •
• •• • • ••••••••• •• • • •••• • •• • • •• • • ••• • • • • • •••• • ••••••••• • • ••••• ••• •
••
• • •• •• • •
•• • •• • •••• • ••••••••• •
• • • • • • • •• •• • • • ••• • •••••• • • ••• • ••• • • • • • • •• • • • ••
••••••• ••
••••••••••• •••••••••• ••
• • • • • • ••• • •• ••

5
• • • • • • •
120000

• • • • • • •
• •
• ••• • •
• •• • •• • •
• •• •
• • • ••
• • ••


• • ••

• •• •
••
• •• •
••
• •• •• • •
• • •
• • •• • •
••
• •
• • •• • • • ••• • • •• • • • • • •• •
• ••
BSAAM
••• ••• •
• • •••••••••• • •••
• •• • • • •• • •• • • ••
••••••• •
••
••• • • • •

• • • • • • •• ••• • • • • • • ••••• •••• •• ••••••••• • •• • • • ••••••
•• ••• • •• • ••• • •• •••••••••• • •• •• •• •
40000

• • •• • •• • ••
• •• • • • • • • • • • •• • • • •• •• •
• • • •••
1950 1970 1990 2 4 6 8 10 10 20 30 40 5 15 25

S-ar putea să vă placă și