Sunteți pe pagina 1din 30

PROBLEMAS TEMA 1 1.

- En un estudio aleatorizado se ha investigado los efectos de una dieta baja en grasas saturadas y colesterol sobre las concentraciones lpidas sricas y el crecimiento en 1062 nios sanos de 7 meses de edad. Entre los 7 y los 13 meses de edad en los nios del grupo sometido a intervencin no se modificaron significativamente las concentraciones sricas del colesterol total y colesterol unido a lipoproteinas . Clasifica el tipo de estudio. Describe la poblacin. Define las variables de ms inters y los parmetros asociados. 2.- Del estudio que se describe en el artculo "Prevalence and Trends in Obesity Among US Adults" comenta: el tipo de estudio, la poblacin, las variables de ms inters y los parmetros asociados. 3.- Del estudio que se describe en el artculo "Depresion in Older People: Visual Impairment and Subjective Ratings of Health" comenta: el tipo de estudio, la poblacin, las variables de ms inters y los parmetros asociados. 4.- The most common treatment for breast cancer was once removal of the breast. It is now usual to remove only the tumor and nearby lymph nodes, followed by radiation. The change in policy was due to a large medical experiment that compared the two treatments. Each treatment was given to a separate group of breast cancer patients, chosen at random. The patients were closely followed to see how long they lived following surgery. What are the explanatory and response variables? Are they categorical or quantitative variables? 5.- A large study used records from Canada's national health care system to compare the effectiveness of two ways to treat a disease. The two treatments are traditional surgery and a new method that does not require surgery. The records described many patients whose doctors had chosen each method. The study found that patients treated by the new method were significantly more likely to die within 8 years. a) Further study of the data showed that this conclusion was wrong. The extra deaths among patients who got the new method could be explained by lurking variables. What lurking variables might be confounded with a doctor's choice of surgical or nonsurgical treatment? b) You have 300 prostate patients who are willing to serve as subjects in an experiment to compare the two methods. Outline the design of a randomized comparative experiment. 6.- Case study: Effect of Dietary Magnesium Supplementation in the Prevention of Coronary Heart Disease and Sudden Cardiac Death Magnesium may be important in the pathogenesis of coronary heart disease and sudden death. To study the role of magnesium, 400 high risk individuals were asked to volunteer either for a magnesium-rich diet (group A, 206) or for our usual diet (group B, 194) for 10 years in a randomized fashion. The age groups were between 25 and 63 years and the majority (374) of them were males. The study dietitian recruited urbanized adults with major or minor risk factors, with or

without cardiovascular disease, by advertisements in the local clubs and newspapers. Respondents having cancer, chronic renal failure, chronic diarrhea and dysentery or who felt unable to participate were excluded from this study. Clinical, electrocardiographic, radiologic and laboratory data were obtained in all the participants during 2 weeks of surveillance before admission to the study. Exercise electrocardiograms were done to confirm the presence or absence of ischemic heart disease (IHD) in all the participants. Hypertension was diagnosed in the presence of blood pressures above 150/95 mm Hg, diabetes by a positive glucose tolerance test, smoking by consumption of more than 10 cigarettes/day, obesity by 10 % more weight than normal for that age and sex. Hypercholesterolemia was diagnosed in the presence of fasting serum cholesterol of more than 250 mg/dl. Laboratory data included blood urea, sugar, total cholesterol, low- and high-density lipoprotein cholesterol, total blood leukocytes, hemoglobin, serum sodium potassium [29], magnesium [8], calcium [17] and albumin. The criteria of sudden cardiac death SCD was death occurring within 1 h either due to IHD or without any apparent cause. The study dietitian divided all the participants into two groups alternately in a randomized fashion after informed consent and the physician responsible was blinded to dietary regimens. Group A included persons on a magnesium-rich dietary protocol and group B included persons on our usual diet. Participants who discontinued the trial during follow-up were excluded. Only those participants who completed a minimum of 10 years have been included in the analysis of the data. Clasifica el tipo de estudio. Describe la poblacin. Define las variables de ms inters y los parmetros asociados. Clasifica todas las variables que se miden en el estudio

TEMA 2 1.-Los siguientes datos corresponden a una encuesta realizada en un colegio de Estados Unidos, a 20 nias. pas edad hermanos Ranking Puntuacin CI Sbp Peso Color vacuna 2 10 3 16 70 91 114 67 2 1965 1 10 1 8 79 121 90 69 1 1965 3 10 4 1 76 111 88 85 1 1964 1 11 2 3 85 103 96 83 2 1965 1 11 3 7 82 104 113 74 3 1964 1 11 2 9 81 99 92 81 2 1965 1 11 3 25 64 87 103 97 1 1964 3 11 2 10 72 121 123 92 1 1964 1 12 4 47 25 70 125 114 2 1964 1 12 2 17 88 105 83 85 3 1964 1 12 1 31 47 96 110 94 2 1968 2 12 3 14 85 107 101 95 1 1964 4 13 4 3 88 103 127 106 3 1963 1 13 5 34 34 79 94 93 1 1963 1 13 3 26 63 91 119 108 2 1963 1 13 2 20 71 108 105 104 2 1964 4 13 3 15 74 132 97 99 2 1962 1 14 3 32 54 105 109 105 1 1962 1 14 4 37 52 93 102 112 1 1962 1 14 3 22 67 101 115 91 2 1961 Pas: 1 = U.S.A., 2 = Mxico; 3 = Canad; 4 = Inglaterra Hermanos: nmero de hermanos de cada una de las nias muestreada. Ranking: Haciendo uso de un baremo propio clasifican a la nia . Puntuacin: En un examen de lgebra. CI: Coeficiente de inteligencia SBP: Presin sistlica de la sangre. Color (de los ojos): 1= negro; 2 = marrn; 3 = azul Vacunacin: Ao en que la nia fue vacunada. a) Clasificar las variables. Calcular la distribucin de frecuencias de la variable color, hacer un diagrama de barras. b) Calcular la mediana de la Puntuacin y del CI y categorizar cada variable en dos clases: ALTA, BAJA. (En la primera clase de cada variable estarn las nias con valores de dicha variable correspondiente superiores iguales a la mediana y en la segunda clase el resto). Calcula la tabla 2x2, tabla de contingencia, resultante de cruzar las variables que has creado en. Calcula las tablas de frecuencias relativas. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 2.- A continuacin se recogen datos del pesos de recin nacidos en gramos: 2985 3065 2964 3007 2927 2943 3120 3087 3042 3101 2890 3020 2993 2947 3040 2987 3121 3005 2949 3128 3054 3015 3021 3007 3095 2905 3032 3014 3049 3056 3109 3091 a) Haz una diagrama en cajas para representar la distribucin del peso Te parece adecuada la hiptesis de que la distribucin es normal?. b) Calcula con estos datos la media y la desviacin tpica (DT) e interpreta el intervalo

(Media2*DT). c) Cmo cambian los anlisis si el valor mnimo resulto ser 2215 en vez de 2890. 3.- Se tienen datos sobre los percentiles de la distribucin del colesterol total en la poblacin de mujeres espaolas en tres grupos de edad: Percentiles Edad en aos 5 10 25 50 75 90 95 30-39 139 151 169 186 211 234 249 40-49 146 161 181 202 231 259 271 50-59 168 181 204 230 259 284 304 Construye en el mismo grfico los polgonos de frecuencias relativas acumuladas para los 3 grupos de edad. 4.- Se llev a cabo un estudio sobre la hipertensin en una poblacin urbana obtenindose valores de la presin diastlica en 1500 hombres de edades entre 30 y 69 aos: Presin Diastlica (mmHg) frecuencia porcentaje < 74 330 22% 75-84 540 36% 85-94 420 28% 95-104 150 10% 105-114 45 3% > 114 15 1% a) Haz una representacin grfica de la distribucin. b) Calcular las frecuencias relativas acumuladas en cada clase. c) Un individuo es considerado hipertenso con una presin diastlica de 95 mayor. Comenta la siguiente afirmacin: Son considerados hipertensos aquellos individuos que estn en un percentil mayor igual al P95. 5.- En un hospital infantil se realiz un estudio para comprobar la eficacia de la aspirina en la reduccin de la temperatura, las mediciones se hicieron en 12 nios de ms de 5 aos, antes de darles la aspirina (X1) y 1 hora despus (X2). Observndose los valores que se representan en la tabla. Nio X1 X2 1 38.4 37.7 2 39.3 38.2 3 39.6 37.8 4 39.2 38.3 5 39.5 37.8 6 7 8 9 10 11 12 39.1 38.6 39.0 39.5 39.1 38.2 38.8 38.4 37.9 37.9 38.0 37.6 37.9 38.5

a) Cul es la variable que tiene inters estudiar?. Calcula sus valores en la muestra. b) Da una medida de la reduccin en la temperatura. c) Dar medidas que sirvan para responder a las siguientes cuestiones: (c1) La reduccin en la temperatura es similar en todos los nios? (c2) La reduccin en la temperatura es similar para los nios con temperaturas iniciales menores iguales a 39.0 que para los nios con temperaturas iniciales mayores de 39.0? d) Haz una representacin grfica de las variables: temperatura inicial y reduccin de la temperatura. 6.- Del artculo "Prevalence and Trends in Obesity Among US Adults" a) Comenta la figura 1, que se representa y en que se parecen y se diferencian las

distribuciones del ndice de masa corporal en los hombres y en las mujeres y en los dos perodos de tiempo. b) Calcula la tabla de contingencia con las frecuencias absolutas observadas para la edad (<40 aos, >=40 aos) y el sexo asociada a la muestra recogida. Calcula la tabla de frecuencias relativas. 7.- A continuacin se recogen algunos de los resultados recogidos en una encuesta sobre Datos antropomtricos de la poblacin laboral espaola. (diciembre 1996 - corregidos octubre 1999).
Designacin Masa corporal (peso, kg) Estatura (altura del cuerpo) Longitud de la mano Masa corporal (peso, kg) Estatura (altura del cuerpo) Longitud de la mano sexo M M M H H H Percentiles Tama. Desv. Media muest. tpica P 1 P 5 P 50 P 95 P 99 586 60,45 9,18 44,2 48,1 59,0 77,0 90,5

593 1595,37 62,97 1439 1494 1596 1701 1744 593 1125 172,99 8,72 152 159 173 188 194 75,67 11,05 52,9 58,6 75,0 95,8 104,9

1130 1698,84 70,49 1537 1583 1698 1820 1864 1126 188,18 9,79 162 172 188 204 210

Interpreta todas las medidas obtenidas, Cul de los tres parmetros observados es ms disperso y cual crees que diferencia mejor los dos sexos?. 8.- En un estudio se han medido varias variables entre ellas la edad. Observndose individuos con edades entre 16 y 60 aos. El resumen de los datos es el grfico siguiente. te parece correcto?

9.- Los datos siguientes corresponden a los valores asociados a un parmetro biolgico en un grupo de individuos: (Datos reales New England Journal of Medicine 2000) 79725, 12862, 18022, 76712, 256440, 14013, 46083, 6808, 85781, 1251, 6081, 50397, 11020, 13633, 1064, 496433, 25308, 6616, 11210, 13900. Haz una representacin de la distribucin y resume los datos utilizando medidas. Utiliza

una transformacin que d lugar a unos datos ms manejables desde un punto de vista estadstico y haz la representacin de la distribucin en la nueva escala y calcula de nuevo las medidas. 10.- Se lleva a cabo un estudio para evaluar la relacin entre el stress en el trabajo y las enfermedades coronarias, para ello se siguen durante 10 aos a 2013 individuos lo que permiti detectar la enfermedad: Stress \ Enfermedad Si No Si 97 307 No 200 1409 Dar distintas medidas del grado de asociacin entre las variables. 11. - Se ha realizado un estudio sobre la edad de la madre en el momento del nacimiento de su hijo como factor de riesgo en el desarrollo del sndrome de muerte infantil repentina (SIDS). Se seleccionaron para el estudio un total de 7330 mujeres que estaban por debajo de los 25 aos en el momento del nacimiento del nio, de ellas, 29 tuvieron nios afectados de SIDS. De las 11256 mujeres seleccionadas para el estudio que tenan 25 aos ms en el momento del nacimiento de sus hijos, 15 tuvieron nios con SIDS. Dar e interpretar una medida de asociacin. 12.- Del artculo :Depression in Older People: Visual Impairment and Subjective Ratings of Health.Clasifica las variables que aparecen en la tabla 1. 13.- Los siguientes datos representan el nivel de astigmatismo en 18 pacientes antes y despus de una operacin realizada en un determinado hospital: (se supone que el nivel de astigmatismo es Normal) n Antes Despus n Antes Despus 1 1.5 1.1 10 1.9 0.7 2 0.8 0.9 11 1.3 1.1 3 0.4 0.0 12 0.2 0.3 4 2.3 2.0 13 2.0 1.9 5 1.1 1.7 14 2.3 1.3 6 0.5 0.2 15 1.3 1.1 7 1.4 0.5 16 1.4 0.6 8 1.9 1.5 17 1.1 0.4 9 3.0 1.9 18 1.5 0.8 a) Calcula las medias y desviaciones tpicas para las dos variables y el coeficiente de correlacin. b) Construye un histograma para la variable nivel de astigmatismo Antes de la operacin. 14.- Six healthy three year old female Suffolk sheep were injected with the antibiotic Gentamicin, at a dosage of 10 mg/kg body weight. Their blood serum concentrations of Gentamicin 1.5 hours after injection were: 33; 26; 34; 31; 23; 25. a) What is the population that these values represent, and which quantity or quantities from this population are you interested in? b) Summary statistics from these data are : n mean sd se(mean) Which of the quantities are related to quantities in the population that you might be interested in estimating?. Which of the quantities would you expect to increase or decrease if the experiment was extended to include more sheep?

15.- The distribution of the ages of a nation's population has a strong influence on

economic and social conditions. The table below shows the age distribution of U.S. residents in 1950 and 2075, in millions of persons. The 1950 data come from that year's census. The 2075 data are projections made by the Census Bureau. Because the total population in 2075 is much larger than the 1950 population, comparing percents in each age group is clearer than comparing counts. Make a table of the percent of the total population in each age group for both 1950 and 2075. a) Make a histogram of the 1950 age distribution (in percents). Then describe the main features of the distribution. In particular, look at the percent of children relative to the rest of the population. b) Make a histogram of the projected age distribution for the year 2075. Use the same scales as in a). for easy comparison. What are the most important changes in the U.S. age distribution projected for the 125-year period between 1950 and 2075? Age-group 1950 2075 Under 10 years 29.3 34.9 10 to 19 years 21.8 35.7 20 to 29 years 24.0 36.8 30 to 39 years 22.8 38.1 40 to 49 years 19.3 37.8 50 to 59 years 15.5 37.5 60 to 69 years 11.0 34.5 70 to 79 years 5.5 27.2 80 to 89 years 1.6 18.8 90 to 99 years 0.1 7.7 100 to 109 years 0.0 1.7 Total 151.1 310.6
16.- Here are the scores of 18 First-year college women on the Survey of Study Habits

and Attitudes (SSHA): 154 109 137 115 152 140 154 178 101 103 126 126 137 165 165 129 200 148 a) Find the mean score, draw a Box plot and find an outlier. b) Find the mean for the 17 observations that remain when you drop the outlier. How does the outlier change the mean?
17.- Do women study more than men? We asked the students how many minutes they

studied on a typical weeknight. Here are the responses of random samples of 30 women and 30 men from the class: Women Men 180 120 180 360 240 90 120 30 90 200 120 180 120 240 170 90 45 30 120 75 150 120 180 180 150 150 120 60 240 300 200 150 180 150 180 240 60 120 60 30 120 60 120 180 180 30 230 120 95 150 90 240 180 115 120 - 200 120 120 180 a) Examine the data. Why are you not surprised that most responses are multiples of 10 minutes? We eliminated one student who claimed to study 30,000 minutes per night. Are there any other responses you consider suspicious? b) Make a back-to-back stemplot of these data. Does it appear that women study more than men? Give numerical summaries that back up your conclusion.

18.- There is some evidence that drinking moderate amounts of wine helps prevent heart attacks. The table on the next page gives data on yearly wine consumption (liters of alcohol from drinking wine, per person) and yearly deaths from heart disease (deaths per 100,000 people) in 19 developed nations. Australia 2.5 211 Netherlands 1.8 167 Austria 3.9 167 New Zealand 1.9 266 Belgium 2.9 131 Norway 0.8 227 Canada 2.4 191 Spain 6.5 86 Denmark 2.9 220 Sweden 1.6 207 Finland 0.8 297 Switzerland 5.8 115 France 9.1 71 United Kingdom 1.3 285 Iceland 0.8 211 United States 1.2 199 Ireland 0.7 300 West Germany 2.7 172 Italy 7.9 107 a) Make a scatterplot that shows how national wine consumption helps explain heart disease death rates. Calculate the correlation coefficient. b) Describe the form of the relationship. Is there a linear pattern? How strong is the relationship? c) Is the direction of the association positive or negative? what this says about wine and heart disease. 19.- Data analysts often look for a transformation of data that simplifies the overall pattern. Here is an example of how transforming the response variable can simplify the pattern of a scatterplot. The data show the growth of Europe between 1750 and 1950. Year 1750 1800 1850 1900 1950 Population (millions) 125 187 274 423 594 a) Make a scatterplot of population against year. Briefly describe the pattern of Europe's growth. b) Now take the logarithm of the population in each year (use the log button on your calculator). Plot the logarithms against year. What is the overall pattern on this plot?
20.- Here are data from eight high schools on smoking among students and among their

parents:

Neither parent One parent Both parents smokes smokes smoke Student does not smoke 1168 1823 1380 Student smokes 188 416 400 a) How many students do these data describe? b) What percent of these students smoke? c) Calculate and compare percents to show how parents' smoking influences students' smoking. Briefly state your conclusions about the relationship.
21.- Case study: In the mid-1970s, a medical study contacted randomly chosen people

in a district in England. Here are data on the 1314 women contacted who were either current smokers or who had never smoked. Two numbers are given for each age at the time of the survey and whether they were still alive 20 years later: the number of smokers women and the number of not smokers. Age 18 to 44 Age 45 to 64 Age 65+ Dead 19 13 Dead 78 52 Dead 42 165 Alive 269 327 Alive 167 147 Alive 7 28 a) Make from these data a two-way table of smoking (yes or no) by dead or alive. What percent of the smokers stayed alive for 20 years? What percent of the nonsmokers survived? It seems surprising that a higher percent of smokers stayed alive. b) The age of the women at the time of the study is a lurking variable. Show that within each of the three age groups in the data, a higher percent of non-smokers remained alive 20 years later. This is an example of Simpson's paradox.

c) The study authors give this explanation: "Few of the older women (over 65 at the original survey) were smokers, but many of them had died by the time of follow-up." Compare the percent of smokers in the three age groups to verify the explanation.

TEMA 3 1.- En un estudio sobre sensibilidad se practican necropsias en cerebros de pacientes. Se informa que el 35% tiene alteraciones asociadas con la demencia senil, el 45% tiene alteraciones asociadas con la degeneracin arteriosclertica cerebral y el 10% muestra evidencia de ambas. Basndose en esta informacin, cul es la probabilidad de que un paciente con el cerebro daado a consecuencia de una degeneracin arteriosclertica tenga tambin alteraciones cerebrales caractersticas de la demencia senil?. Cul es la probabilidad de que un paciente que no tienen alteraciones debidas a la demencia senil padezca de degeneracin arteriosclertica cerebral?. 2.- En un estudio sobre 200 enfermos en un centro hematolgico, se encontraron 89 con Rh+, 59 de grupo sanguneo A y 29 hemoflicos. Adems se encontraron 40 individuos del grupo A y Rh+, 18 hemoflicos y Rh+ y 16 hemoflicos del grupo A. (a) Probabilidad de encontrar individuos no hemoflicos del grupo A . (b) Probabilidad de encontrar hemoflicos con Rh-. (c) Probabilidad de encontrar no hemoflicos con Rh+. (d) Probabilidad de encontrar individuos no hemoflicos con Rh-. (e) Probabilidad de encontrar individuos del grupo A y Rh-. 3.- En un estudio sobre una poblacin se sabe que el 10% tiene 65 mas aos y que el 1% padece deficiencia cardaca moderada. Adems el 10.4% tiene 65 mas aos padece deficiencia cardaca moderada. Son independientes los sucesos ; {65 mas aos} y {D.C.M}. 4.- Expresar matemticamente la siguiente afirmacin : Entre los nios de 5 aos se sabe que el 4% padece una enfermedad. 5. - El 2% de una determinada poblacin padece diabetes, de ellos, solamente la mitad lo saben. Si se selecciona aleatoriamente a un individuo. Cual es la probabilidad de que padezca diabetes pero no sea consciente de padecerla ? 6.- En una poblacin de donantes de sangre se sabe que el 5% tienen lesin hepatocelular . Se realiza una prueba con el fin de detectar a los donantes-enfermos basada en el nivel de transaminasas. la prueba da (+) en el 7% de los sanos y en el 78% de los enfermos. (a) Calcular la tabla de probabilidad conjunta. (b) Calcular la especificidad y sensitividad de la prueba . (c) Si la prueba da (+) calcular la probabilidad de error en el diagnstico. (Igual si da (-) (d) Calcular el riesgo relativo de tener lesin con respecto a la prueba de transaminasas y la odds ratio. 7.- De 2000 enfermos de una poblacin 140 padecen hepatitis, 48 anemia y el resto otras enfermedades. La ictericia se presenta en el 76% de los enfermos de hepatitis, en un 27% de los enfermos de anemia y en un 20% en el resto de los enfermos. Por otra parte, se sabe que estas enfermedades no se presentaron juntas en ningn otro enfermo. (a) Determinar la probabilidad de que un enfermo que presente ictericia padezca hepatitis.

(b) Determinar la probabilidad de que un enfermo ictrico no tenga anemia. (c) Calcular el riesgo relativo de tener hepatitis o anemia respecto la presencia o no presencia de icteria. 8.- Supongamos que se dispone de un test-diagnstico para detectar el virus del SIDA con una sensitividad del 100% y una especificidad del 99.5% y que se aplica rutinariamente a una poblacin de mujeres donantes, entre las que la prevalencia del virus es de 0.01% y a la poblacin de homosexuales de San Francisco, entre los que la prevalencia ha sido estimada del 50%. Qu proporcin de los que clasifica el test como afectados tienen realmente el virus en cada una de las poblaciones?. 9.- Se estima que el 15% de la poblacin adulta padece hipertensin, pero el 75% de todos los adultos creen no tener este problema. Se estima que el 6% de la poblacin tiene hipertensin pero no es consciente de ello. Si un paciente adulto piensa que no tiene hipertensin, cul es la probabilidad de que la enfermedad de hecho exista?. Si un paciente padece hipertensin, cul es la probabilidad de que lo sospeche?. 10.- En la siguiente tabla se recogen datos sobre un grupo de individuos , sus hbitos de fumar y la presencia/ausencia de tos crnica. No fumador Fumador ocasional 266 395 1037 977 Fumador regular 80 92

TOS si TOS no

10.1.Estima con estos datos la tabla de probabilidad conjunta y la tabla de probabilidades condicionada que te parezca que tiene ms inters en este estudio 10.2.- Estima el Riesgo Relativo de tener tos crnica entre los fumadores en relacin a los no fumadores e interpreta el valor obtenido . 11.- We examine the reliability of a test for a severe disease. For an infected person the test gives a positive indication with probability 99% (sensitivity). If a healthy person is tested, the test is negative with probability 99% (specificity). Furthermore it is known that one out of 2000 persons in the population is infected (prevalence). What is the probability (positive predictive value) that a person is infected, if the test is positive?. 12.- A study reported the use of peritoneal washing cytology in gynecologic cancers (Zuna and Behrens,1996). One part of the report was a comparison of peritoneal washing cytology and peritonea histology in terms of detecting cancer of the ovary, endometrium, and cervix. Using the histology determination as the gold standard, and the washing cytology as the new test procedure, determine the sensitivity, specificity, and positive and negative predictive values of the washing cytology procedure. Outcomes are given in the Table: Diagnostic Test Disease (D+) No Disease (D) Total Positive (T+) 116 4 120 Negative (T) 24 211 235 Total 140 215 355

TEMAS 4/5 1.- La densidad de la variable aleatoria, X= nmero de personas por da que buscaron tratamiento innecesario en un servicio de urgencias, viene dada por : x 0 1 2 3 4 5 -------------------------------------------------------------------f(x) 0.01 0.1 0.3 0.4 0.1 0.09 a) Demostrar que es una funcin de densidad. b) Calcular la funcin de distribucin. c) Hallar P [ 2 <X< 4 ]. d) Cul es la probabilidad de que alguien recurriera innecesariamente al servicio?. 2.- Una bacteria determinada produce un sntoma en el 2% de las personas infectadas. En un picnic 20 personas comieron alimentos contaminados y se infectaron con dicho organismo. Cual es la probabilidad de que tengan sntomas?: a) 10 personas menos. b) Ninguno. c) Ms de 4. d) Exactamente 4. e) Calcular el valor medio esperado. 3.- Un laboratorio afirma que una droga causa efectos secundarios en una proporcin de 3 de cada 100 pacientes. Para contrastar esta afirmacin, otro laboratorio elige al azar a 5 pacientes a los que aplica la droga. a) Cul es la probabilidad de los siguientes sucesos: "ningn paciente tenga efectos secundarios", "al menos dos tengan efectos secundarios"?. b) Cul es el nmero medio de pacientes que espera el laboratorio que sufra efectos secundarios si elige 100 pacientes al azar y les aplica la droga?. 4.- Se supone que la probabilidad de nacer varn es 0.55. Calcular la probabilidad de que en una familia de 5 hijos: (a) Todos sean varones. (b) Al menos dos sean varones. (c) Tres sean mujeres. 5.- En una poblacin el tiempo de coagulacin del plasma sanguneo (X), sigue una distribucin N(10.5,1). Calcular : a) Probabilidad de que una persona elegida al azar en dicha poblacin tenga el tiempo de coagulacin menor que 10.5. Lo mismo para el intervalo (11, 11.5) y para el tiempo de coagulacin superior a 10.1. b) Calcular un intervalo centrado en la media en el que se encuentra 0.9 que tenga probabilidad 0.9. c) Se clasifica a los individuos de dicha poblacin de la siguiente forma: Bajo: X<P25 Normal: P25 < X < P75 Alto: X > P75 Hallar los lmites de dichas categoras.

6.- Se observ que la cantidad de agente anestesiante general rectal necesario para provocar una anestesia quirrgica se distribua aproximadamente de forma normal, entre diversos pacientes, con = 50 mg y =10 mg. La dosis en la cual se presentan efectos secundarios graves sigue otra distribucin normal con = 110 mg y =20 mg. Si se utiliza una dosis tal que se consigue anestesiar con ella al 80% de los pacientes, Qu porcentaje presentar efectos secundarios graves a causa de esta dosis?. 7.- Una regla muy usada para predecir que individuos pueden sufrir una trombosis postoperatoria consiste en una medida numrica que sigue, en los individuos que no sufren tal proceso, una N(3,1) mientras que entre los que si que la sufren la distribucin es una N(9,2). Normalmente se toma como punto de corte para decidir que un paciente corre el riesgo de sufrir trombosis el valor 5. Qu porcentaje de individuos que no sufran trombosis son catalogados como que si sufran?. Qu porcentaje de individuos que si sufran trombosis son catalogados como libres de tal riesgo?. Sabiendo que el 46% de individuos sufren trombosis y usando el punto de corte anteriormente citado, calcular el valor predictivo positivo y el valor predictivo negativo de la regla. 8.- Judy's doctor is concerned that she may suffer from hypokalemia (low potassium in the blood). There is variation both in the actual potassium level and in the blood test that measures the level. Judy's measured potassium level varies according to the Normal distribution with mean= 3.8 and s = 0.2. A patient is classified as hypokalemic if the potassium level is below 3.5. a) If a single potassium measurement is made, what is the probability that Judy is diagnosed as hypokalemic? b) If measurements are made instead on 4 separate days and the mean result is compared with the criterion 3.5, what is the probability that Judy is diagnosed as hypokalemic?. 9.- A study of education followed a large group of first grade children to see how many years of school they eventually completed. Let X be the highest year of school that a randomly chosen grader completes. (Students who go on to college are included in the outcome X = 12.) The study found this probability distribution for X: Years 4 5 6 7 8 9 10 11 12 Probability 0.010 0.007 0.007 0.013 0.032 0.068 0.070 0.041 0.752 a) What percent of graders eventually finished twelfth grade? b) Check that this is a legitimate probability distribution.

TEMA 6 1.- Se ha medido la tasa de recuperacin cardaca (TRC) medida en minutos en 40 hombres de 40 a 49 aos y se ha obtenido una media de 11.93 minutos y una desviacin tpica de 0.75 minutos Calcula un I.C. para la media de la TRC en la poblacin. 2.- Al realizar un recuento de glbulos blancos se encontraron 125 neutrfilos de los 200 glbulos blancos contabilizados. Dar una estimacin de la proporcin poblacional con una confianza del 90%. Calcular el tamao de la muestra para que el error cometido en la estimacin sea menor igual que 0.02 con una probabilidad de 0.95. 3.-Un investigador desea evaluar el porcentaje de habitantes de una ciudad que estn inoculados contra la polio. Para ello planifica un muestreo de la poblacin deseando obtener resultados correctos dentro del 3% con una probabilidad del 99%. 4.- En el laboratorio de un hospital se realizan una serie de pruebas para determinar las caractersticas de una muestra de sangre de 500 individuos elegidos al azar en una poblacin. El nivel de hemoglobina es una variable (X) N(,0.4). a) Si en la muestra se obtuvo una media de 15.46 calcular un Intervalo de Confianza para la media al nivel 0.99. b) Calcular el tamao muestral necesario si se quiere obtener un I.C. al mismo nivel de longitud 0.2. c) Decir que variacin se produce en la amplitud del intervalo si el nivel de confianza aumenta. Calcular el intervalo para la media con un nivel de confianza de 0.995 con la muestra anterior y compararlo con el resultado obtenido para 0.99. d)Calcular un I.C. para la media suponiendo que la varianza de X es desconocida, utilizar la misma muestra anterior teniendo en cuenta que la varianza muestral es 0.1. 5.- Se admite que la edad de defuncin de mujeres con Cncer de tero sigue una distribucin Normal con desviacin tpica 9 aos. A partir de las historias clnicas de un hospital obtenemos la siguiente muestra de edades: 65 54 51 67 49 47 64 44 49 a) Calcular un I.C. de nivel 0.9 y otro de nivel 0.99 para la edad media de defuncin. b) Con que tamao muestral el I.C. de nivel 0.99 tendra una amplitud menor de 5 aos?. c) A partir de un estudio similar en otro hospital un compaero nos dice que ha calculado tambin los I.C. al 80% y al 99% y nos los da, pero sin sealar cual es cual: I1 = [ 52.3 , 67.7] I2 = [56.2 , 63.8] Podras indicar cul es el de nivel 0.8 y cul el de nivel 0.99 ?. Se puede deducir la media muestral que ha obtenido nuestro colega ?. 6.- Del artculo "Prevalence and Trends in Obesity Among US Adults". Comenta los resultados: Results In 2007-2008, the age-adjusted prevalence of obesity was 33.8% (95% confidence interval [CI], 31.6%-36.0%) overall, 32.2% (95% CI, 29.5%-35.0%) among men, and 35.5% (95% CI, 33.2%-37.7%) among women. The corresponding prevalence estimates for overweight and obesity combined (BMI _25) were 68.0% (95% CI, 66.3%-69.8%), 72.3% (95% CI, 70.4%-74.1%), and 64.1% (95% CI, 61.3%66.9%). Obesity prevalence varied by age group and by racial and ethnic group for both men and women.

7.- Biologists studying the levels of several compounds in shrimp embryos reported their results with means and Standard Error of the Mean.(SEM) . The table entry for the compound ATP was 0.84(0.01). Readers are supposed to understand that the numbers are based on n = 3 measurements What was the sample standard deviation for these measurements? 8.- A test for the level of potassium in the blood is not perfectly precise. Moreover, the actual level of potassium in a person's blood varies slightly from day to day. Suppose that repeated measurements for the same person on different days vary Normally with sd = 0.2. a) Julie's potassium level is measured once. The result is 3.2. Give a 90% confidence interval for her mean potassium level. b) If three measurements were taken on different days and the mean result is 3.2, what is a 90% confidence interval for Julie's mean blood potassium level? 9.-. Researchers studying iron deficiency in infants examined infants who were following different feeding patterns. One group of 26 infants was being breast-fed. At 6 months of age, these children had mean hemoglobin level equal to 12.9 grams per 100 milliliters of blood. Assume that the population standard deviation is equal to 1.6. Give a 95% confidence interval for the mean hemoglobin level of breast-fed infants. What assumptions (other than the unrealistic assumption that we know the sd) does the method you used to get the confidence interval require? 10..- The distribution of blood cholesterol levelin the population of young men aged 20 to 34 years is close to Normal, with mean 188 milligrams per deciliter (mg/dl) and standard deviation 41 mg/dl. You measure the cholesterol level of 100 young men chosen at random and calculate the mean. a) If you did this many times, what would be the mean and standard deviation of the distribution of all the mean values? b) What is the probability that your sample has mean less than 180?

TEMA 7 1.- Como parte de un experimento se decide inyectar a cada uno de los ratones de una m.a.s. de n = 25 con un frmaco a un nivel de dosificacin equivalente a 0.004 mg/gr de peso. Se sabe que el peso se distribuye N(19gr,4 gr). a) Si como media muestral de los pesos despus de sucesivas y controladas dosis se obtuvo 21.5 gr, puede admitirse que el peso medio ha cambiado . Tomar = 0.01 y calcular el p-valor. ( Se supone que la varianza no ha cambiado) b) Qu tamao muestral ser necesario para obtener una potencia mayor que 0.9 en = 22?. 2.- Tenemos datos sobre el Cieficiente intelecttual CI de 31 nias: 114 100 104 89 102 91 114 114 103 105 108 130 120 132 111 128 118 119 86 72 111 103 74 112 107 103 98 96 112 112 93 Supongamos que la desviacin tpca del CI en esta poblacin es 15. a) Da un intervalo de confianza al 95% para la media del IQ en la poblacin. b) Difiere significativamente la media del valor 100, a nivel 5%?. Responde utilizando el Intervalo de Confianza. 3.- A student group claims that first-year students at a university must study 2.5 hours per night during the school week. A skeptic suspects that they study less than that on the average. A class survey finds that the average study time claimed by 269 students is 137 minutes. Regard these students as a random sample of all first-year students and suppose we know that study times follow a Normal distribution with standard deviation 65 minutes. Carry out a test of H0: mean = 150 against Ha: mean < 150. What do you conclude? 4.- Bottles of a popular cola are supposed to contain 300 milliliters (ml) of cola. There is some variation from bottle to bottle because the filling machinery is not perfectly precise. The distribution of the contents is Normal with standard deviation equal to 3 ml. An inspector who suspects that the bottler is under filling measures the contents of six bottles. The results are 299.4 297.7 301.0 298.9 300.2 297.0 Is this convincing evidence that the mean content of cola bottles is less than the advertised 300 ml? a) State the hypotheses that you will test. b) Calculate the test statistic. c) Find the P-value and state your conclusion. 5.- To determine whether the mean nicotine content of a brand of cigarettes is greater than the advertised value of 1.4 milligrams, a health advocacy group tests H0: mean = 1.4; Ha: mean > 1.4 The calculated value of the test statistic is z = 2:42. a) Is the result significant at the 5% level? b) Is the result significant at the 1% level? 6.- Weekly sales of regular ground coffee at a supermarket have in the recent past varied according to a Normal distribution with mean equal to 354 units per week and standard deviation equal to 33 units. The store reduces the price by 5%. Sales in the next three weeks are 405, 378, and 411 units. Is this good evidence that average sales are now

higher?. Assume that the standard deviation of the population of weekly sales remains equal to 33. a) Find the sample mean and the value of the one-sample z test statistic. b) Calculate the P-value. c) Is the result statistically significant at the 0.05 level? Is it significant at the 0.01 level?. Do you think there is convincing evidence that mean sales are higher?. 7.- Cobra Cheese Company buys milk from several suppliers. Cobra suspects that some producers are adding water to their milk to increase their profits. Excess water can be detected by measuring the freezing point of the milk. The freezing temperature of natural milk varies Normally, with mean equal to -0.545 Celsius (C) and standard deviation equal to 0.008 C. Added water aises the freezing temperature toward 0.0 C, the freezing point of water. Cobra's laboratory manager measures the freezing temperature of five consecutive lots of milk from one producer. The mean measurement is equal to 0:538 C. Is this good evidence that the producer is adding water to the milk? State hypotheses, carry out the test, give the P-value, and state your conclusion.

TEMA 8

1.- Para estudiar los efectos de un determinado frmaco sobre los tiempos de protombina se midieron stos en 10 individuos, antes y despus de la administracin del frmaco. Los resultados obtenidos fueron: INDIVIDUO ANTES DESPUS 1 12.3 12 2 12 12.3 3 13 12 4 12.5 12.5 5 11.3 10.3 6 11.8 11.3 7 11.5 11.5 8 11.5 11.5 9 11 11 10 11.5 11.5

a) Puedes concluir que el frmaco influye en el tiempo de protombina a un nivel = 0.05?. (Normalidad) b) Para comparar los efectos de ese frmaco con los de otro similar se administr este ltimo a 10 nuevos individuos obtenindose un tiempo medio de protombina de 13.5 y una varianza de 2.25. Qu puedes concluir ahora al nivel 0.05? (Normalidad) 2.- Con los datos del ejercicio 13 del tema 2 calcula un IC al 99% para la diferencia del nivel de astigmatismo Antes-Despus de la operacin y comenta el resultado.

3.- The Lancet (vol 27, n1, 1995). " Ensayo prospectivo aleatorizado en 1062 lactantes alimentados con una dieta baja en grasas saturadas y colesterol ". "En un estudio aleatorizado hemos investigado los efectos de una dieta baja en grasas saturadas y colesterol sobre las concentraciones lpidas sricas y el crecimiento en 1062 nios sanos de 7 meses de edad. Entre los 7 y los 13 meses de edad en los nios del grupo sometido a intervencin no se modificaron significativamente las concentraciones sricas del colesterol total y colesterol unido a lipoproteinas (variacin media -0.03 [DE 0.72] mmol/l y 0.01 [0.67] mmol/l) mientras que aumentaron notablemente en los del grupo control (0.24 [0.64] y 0.23 [0.60] mmol/l; p para la diferencia de variaciones medias entre los grupos < 0.001)." a) Qu variables se han medido en el estudio y de que tipo son?. Define los parmetros de inters en el estudio. b) Plantea los contrastes que han realizado los autores y comenta el resultado de dichos contrastes.

4.-The Lancet (Vol 27, n1, 1995). "Comparacin a doble ciego de Lamotrigina y Carbamazepina en la epilepsia de nuevo diagnstico". "...Un total de 151 (131 con tratamiento de Lamotrigina y 129 con tratamiento de carbamazepina) completaron el ensayo...La somnolencia fue menos frecuente en los pacientes tratados con Lamotrigina que en los del grupo de Carbamazepina, (un 12% en comparacin con un 22%; p<0.05)". Plantear y realizar el contraste al que aluden los autores del artculo. (Variables y parmetros de inters, hiptesis, estadstico-test) . Qu tipo de estudio es?. 5.- The financial aid office of a university asks a sample of students about their employment and earnings. The report says that \for academic year earnings, a significant difference (P = 0:038) was found between the sexes, with men earning more

on the average. No difference (P = 0:476) was found between the earnings of black and white students." Explain both of these conclusions, for the effects of sex and of race on mean earnings, in language understandable to someone who knows no statistics. 6.- Efectos inmunolgicos, hematolgicos y de glucemia en la complementacin de la dieta con Agaricus sylvaticus en pacientes con cncer colorectal. Se llev a cabo un estudio aleatorizado y controlado con placebo para evaluar los efectos de una dieta en pacientes sometidos a una intervencin quirrgica de cncer colorectal. El ensayo clnico dur 6 meses. 67 pacientes con cncer colorectar del Hospital General de Brasil, se dividieron en 2 grupos que recibieron la nueva dieta(32) y placebo (35). Los niveles de glucemia fueron en el grupo placebo: a los 6 meses, 98.52 6.03 mg/dl (mediaDT). Los niveles de Glucemia en el grupo tratado fueron a los 6 meses, 92.86 6.32 mg/dl...... Conclusin: El estudio sugiere que la nueva dieta puede reducir los niveles de glucemia en los pacientes con cncer colorectal. Plantea las hiptesis nula y alternativa ms razonables con los datos disponibles para llegar a la misma conclusin de los autores. Calcula el p-valor asociado al contraste anterior. 7.- Does eating more fiber reduce the blood cholesterol level of patients with diabetes? A randomized clinical trial compared normal and high-fiber diets. Here is part of the researchers' conclusion: The high-fiber diet reduced plasma total cholesterol concentrations by 6.7 percent (P = 0.02), triglyceride concentrations by 10.2 percent (P = 0.02), and very-low-density lipoprotein cholesterol concentrations by 12.5 percent (P = 0.01). A doctor who knows no statistics says that a drop of 6.7% in cholesterol isn't a lot | maybe it's just an accident due to the chance assignment of patients to the two diets. Explain in simple language how P = 0.02 answers this objection. 8.- Europe and the United States differ considerably in their attitudes toward food made from crops that have been genetically modified (GM) to, for example, resist pests or contain more protein. A random sample of 12,178 European adults found that 63% thought such foods were risky. In the United States, a random sample of 863 adults who were asked the same questions found that 46% considered GM foods risky.72 a) What are the counts of people in each sample who thought GM foods were risky? b) Give a 95% confidence interval to compare Europe and the United States. 9.- A study of \adverse symptoms" in users of over-the-counter pain relief medications assigned subjects at random to one of two common pain relievers: acetaminophen and ibuprofen. (Both of these pain relievers are sold under various brand names, sometimes combined with other ingredients.) In all, 650 subjects took acetaminophen, and 44 experienced some adverse symptom. Of the 347 subjects who took ibuprofen, 49 had an adverse symptom. How strong is the evidence that the two pain relievers differ in the proportion of people who experience an adverse symptom? a) State hypotheses and check that you can use the z test. b) Find the P-value of the test and give your conclusion.

TEMA 9 1.- Se sospecha que cuanto mayor es la estancia preoperatoria en un hospital mayor es la probabilidad de una infeccin intrahospitalaria en la posterior intervencin para ello se tomaron dos muestras de individuos de menos de 10 das de estancia preoperatoria y de ms de 10 das de estancia: Estancia \ infeccin si no -10 69 611 +10 65 171 a) Cmo se han elegido las observaciones? (alguna de las distribuciones es fija?). b) Qu hiptesis tiene inters contrastar en este estudio?. Qu procedimiento estadstico utilizaras?. c) Estima la asociacin utilizando una medida adecuada y un IC e interpreta el resultado. 2.- Se lleva a cabo un estudio para evaluar la relacin entre el stress en el trabajo y las enfermedades coronarias, para ello se siguen durante 10 aos a 2013 individuos lo que permiti detectar la enfermedad: Stress \ Enfermedad Si No Si 97 307 No 200 1409 a) Dar distintas medidas del grado de asociacin entre las variables. b) Con estos datos se calcula un I.C al 95% para la OR = (1.70, 2.92). Interprtalo. c) El valor de la O.R en la tabla coincide con el punto medio del intervalo de confianza?. d) Si se cambia el orden de las filas de las columnas cambia el valor de la OR ?. Interpreta la OR que resulta de cambiar las filas en la tabla del ejemplo. e) En otro estudio se examino a un grupo de 100 pacientes con enfermedad coronaria y a otro grupo de 100 controles y se le calculo una tabla del mismo tipo. Que medida de asociacin te parece ms adecuada para comparar los resultados de ambos estudios ?. 3.- Se lleva a cabo un estudio con objeto de constatar si la infeccin por Helicobacter Pylori (HP) es un factor de riesgo para el desarrollo de gastritis atrfica y metaplasia intestinal. Se estudian de forma prospectiva 125 sujetos negativos para HP y otros 145 positivos. La aparicin de gastritis atrfica y metaplasia intestinal tuvo lugar en 5 de los sujetos no infectados y en 40 de los infectados. La presencia de gastritis atrfica se asoci de forma significativa con la infeccin de HP (Odds Ratio 9.143, IC 95% [3.480,24.023]). a) Obtener e interpretar el IC para la Odds Ratio. b) Se puede estimar alguna otra medida de asociacin en este estudio? 4.- Se ha realizado un estudio sobre la edad de la madre en el momento del nacimiento de su hijo como factor de riesgo en el desarrollo del sndrome de muerte infantil repentina (SIDS). Se seleccionaron para el estudio un total de 7330 mujeres que estaban por debajo de los 25 aos en el momento del nacimiento del nio, de ellas, 29 tuvieron nios afectados de SIDS. De las 11256 mujeres seleccionadas para el estudio que tenan 25 aos ms en el momento del nacimiento de sus hijos, 15 tuvieron nios con SIDS. a) Qu tipo de muestreo se ha realizado?. Sealar alguna probabilidad que no se pueda estimar con este tipo de muestreo. b) Calcular la Odds Ratio asociada. c) Contrastar estadsticamente la asociacin entre las dos variables. Calcular el p-valor.

5- Se quiere estudiar la relacin entre la tasa de filtracin glomerular (TFG) y la concentracin de creatinina en plasma. Se tienen datos de 31 hombres. Se lleva a cabo una regresin lineal para modelizar la relacin utilizando TFG como variable dependiente. Los datos y los resultados obtenidos vienen dados en las tablas siguientes: a) Haz un diagrama de dispersin. b) Comenta cada uno de los valores que aparecen en las tablas. c) Te parece que existe una relacin lineal entre las variables ? d) Qu significa R-Squared = 53.17 percent ?. TFG CR TFG CR TFG CR TFG CR 90 0.85 45 0.99 103 1.13 100 1.13 93 1.13 90 1.13 70 1.13 77 1.27 47 1.41 45 1.47 60 1.47 53 1.56 35 1.56 63 1.70 55 1.75 35 1.75 38 1.83 47 1.98 45 2.03 40 2.09 27 2.77 37 2.96 25 3.11 15 3.96 15 4.69 20 4.80 10 5.93 5 5.93 5 5.93 10 7.97 12 11.0
-------------------------------------------------------------------------------------------------Parameter Estimate Standard Error T.value Prob. Intercept 0.906 5.7206 12.3949 .0000 Slope -8.891 1.5496 -5.7379 .0000 -------------------------------------------------------------------------------------------------Analysis of variance -------------------------------------------------------------------------------------------------Source Sum of Squares DF Mean Square F-Ratio Prob Model 13467.357 1 13467.357 32.92 .0000 Residual 11862.321 29 409.046 --------------------------------------------------------------------------------------------------Total 25329.677 30 Correlation Coefficient = -0.729166 R-Squared=53.17 percent

6- En el estudio anterior utilizando como variable independiente 1/CREATININA se obtuvieron los siguientes resultados :
-------------------------------------------------------------------------------------------------Parameter Estimate Standard Error T.value Prob. Intercept -2.37387 5.2129 -0.4554 .6522 Slope 87.8268 8.4422 10.4033 .0000 --------------------------------------------------------------------------------------------------

Correlation Coefficient = 0.888072 R-Squared=78.87 percent (a) Haz una representacin de los datos y de la recta de regresin. (b) Comenta los resultados de la tabla 7.- La ecuacin y = 15 + 0.4x corresponde a la recta de regresin entre la talla (x) y el permetro craneal (y) calculada en una muestra de recin nacidos. Supongamos que se verifican las condiciones de aplicacin del mtodo. Las siguientes afirmaciones son ciertas falsas ?: - Los nios de 50cm de sta poblacin tienen, en media, un permetro craneal de 35 cm. - La mayor parte de los nios de 50cm de sta poblacin tienen un permetro craneal de 35 cm. - La prediccin sobre el permetro craneal de un nio de talla 50cm es de 35 cm. - A cada aumento de 1cm de permetro craneal le corresponde, en promedio, un incremento de 0.4 cm de talla. - El coeficiente de correlacin es 0.4. 8.- A food industry group asked 3368 people to guess the number of calories in each of several common foods. The data below give the averages of their guesses and the correct number of calories. a) We think that how many calories a food actually has helps explain people's guesses of how many calories it has. With this in mind, make a scatterplot of these data.

b) Find the correlation r (use your calculator). Explain why your r is reasonable based on the scatterplot. c) The guesses are all higher than the true calorie counts. Does this fact influence the correlation in any way? How would r change if every guess were 100 calories higher? d) The guesses are much too high for spaghetti and snack cake. Circle these points on your scatterplot. Calculate r for the other eight foods, leaving out these two points. Explain why r changed in the direction that it did. Guessed calories and true calories 8 oz. whole milk 196 159 5 oz. spaghetti with tomato sauce 394 163 5 oz. macaroni with cheese 350 269 One slice wheat bread 117 61 One slice white bread 136 76 2-oz. candy bar 364 260 Saltine cracker 74 12 Medium-size apple 107 80 Medium-size potato 160 88 Cream snack cake 419 160 9.- Data on the smoking habits of students and of their parents. Student smokes Student does not smoke Both parents smoke 400 1380 One parent smokes 416 1823 Neither parent smokes 188 1168 a) Find the percent of students who smoke in each of the three parent groups. Make a graph to compare these percents. Describe the association between parent smoking and student smoking. b) Explain in words what the null hypothesis for the chi-square test says about student smoking. c) Find the expected counts if H0 is true, and display them in a two-way table similar to the table of observed counts. d) Compare the tables of observed and expected counts. Explain how the comparison expresses the same association you saw in (a). e) Give the chi-square statistic and its P-value. Examine the terms of chi-square to confirm the pattern you saw in (a) and (d). What is your overall conclusion? 10.- Measurements on the lengths in centimeters of the femur and the humerus for the five fossil specimens of the extinct beast Archaeopteryx that preserve both bones: Femur 38 56 59 64 74 Humerus 41 63 70 72 84 The strong linear relationship between the lengths of the two bones helped persuade scientists that all five specimens belong to the same species. a) Examine the data. Make a scatterplot with femur length as the explanatory variable. b) Obtain the correlation r and the equation of the least-squares regression line. Do you think that femur length will allow good prediction of humerus length?.
R-Square 0.9197 Variable Intercept x Dependent Mean 69.00000 Parameter DF Estimate 1 24.64839 1 0.76206 Coeff Var Standard Error 7.72237 0.13004 4.97482 t Value 3.19 5.86 Pr > |t| 0.0496 0.0099

c) Explain the results below.

GENERALES 1.- El colesterol srico (C.S.) en una poblacin A sigue una distribucin Normal de media 2.260 gr/l y desviacin tpica 0.354 gr/l. En otra poblacin B sigue una distribucin Normal con la misma media y menor desviacin tpica. a) Haz una representacin grfica de las funciones de densidad del C.S. en las dos poblaciones b) Calcula, en la poblacin A, el valor del C.S. correspondiente al percentil 15. El percentil 15 en la poblacin B ser un valor mayor menor que el que acabas de calcular? c) Se elige una muestra de tamao 40 en la poblacin A y se mide el C.S. Es probable que el valor del C.S. medio observado esa muestra sea mayor de 2.4 gr/l ?. d) Se quiere estimar, en la poblacin B, la proporcin de individuos con C.S. menor de 2.0 gr/l. Qu tamao muestral necesitaramos para obtener una estimacin con una precisin de 0.03 y una confianza de 0.9? [intenta utilizar toda la informacin que te da el problema] 2.- La revista The Lancet (Volumen 24, nmero 4) publica un artculo sobre la enfermedad de Cronh en el que se dice: 78 pacientes fueron aleatoriamente asignados a corticoides(38) y dieta(40). No se produjeron cambios significativos en el peso durante el estudio en el grupo tratado con dieta (57.6 [DT 8.8] Kg) al inicio y 60.3 [7.4] kg a los tres meses; ni en el tratado con corticoides (59.3 [11.4] kg y 63.8 [12.2] kg) a) Clasifica el tipo de estudio. Con qu objeto se divide "aleatoriamente" a los individuos?.Clasifica las variables. b) Calcular el peso medio del total de pacientes al inicio c)Qu contraste/s de hiptesis realizan los autores del articulo? (Definir TODAS las variables aleatorias y parmetros que intervienen, plantear la hiptesis nula, el estadstico-test y su distribucin) d) Qu puedes decir sobre el resultado del contraste (calcula el p-valor si tienes datos suficientes)?. 3.- Es generalmente aceptado que existen diferencias ligadas al sexo relacionadas con la respuesta a la tensin producida por el calor. Se someti a un grupo de 10 hombres y 8 mujeres a un programa de ejercicios diarios. El medio era caluroso y se dispona de una cantidad mnima de agua para los individuos. La variable de inters es el porcentaje de peso corporal perdido. Se obtuvieron los datos siguientes: Varones Mujeres 2.9 3.7 3.0 3.8 3.5 3.8 2.5 4.1 3.9 4.0 3.7 3.6 3.8 3.6 3.3 4.0 3.6 3.7 a) De qu carcter es la variable objeto de estudio? b) Es un estudio experimental u observacional?. c) Sealar un parmetro de inters en el estudio. d) Qu estadstico se debe utilizar para estimar dicho parmetro?. qu otros estdisticos de inters podras calcular con estos datos?. e) Realizar un contraste de hiptesis que sea adecuado para el problema. Sealar claramente las hiptesis, las variables y parmetros que intervienen, el estadstico-test y las condiciones que es necesario suponer para realizar dicho contraste.

4.- Estudios de laboratorio sugieren que altas concentraciones de Betacaroteno protege de la cardiopata isqumica. Para comprobarlo se realiz un estudio de casos y controles. Se tomaron 683 pacientes con infarto y 727 controles y se obtuvieron los siguientes datos sobre la concentracin de Betacarotenos: CASOS: media =0.35 desviacin tpica =0.25 CONTROLES: media = 0.42 desviacin tpica =0.26 a) Calcula la media del total de la muestra. Y da una medida/s para comparar las dispersiones en las dos muestras. b) Calcula un intervalo de confianza al 90% para la diferencia de las concentraciones medias de Betacaroteno poblacionales suponiendo que las desviaciones tpicas poblacionales son iguales. Interpreta el resultado. c) Se conocen adems los quintiles de la distribucin en la muestra de controles: min=0 P20=0.21 P40=0.37 P60=0.53 P80=0.82 max=1.20 con estos datos haz una representacin aproximada, histograma polgono de frecuencias relativas, de la distribucin. Te parece que puede suponerse que la distribucin es normal?. 5.- Se realiza un estudio de tiempos de reaccin en una poblacin para los que se toma una muestra al azar de tamao 23 de individuos de dicha poblacin. Se supone que la variable tiempo de reaccin sigue una distribucin normal. Los datos expresados en milsimas de segundo son los siguientes: 76 94 105 104 90 109 79 122 95 104 106 113 85 119 82 111 78 98 116 100 88 91 120 a) Haz una descripcin mediante grficos y medidas numrica de la variable. b) Se puede aceptar la hiptesis de que el tiempo medio de reaccin es mayor de 93ms?. 6.- Sobre el resumen del artculo del tema 1 : El peso elevado al nacer como factor de riesgo para obesidad infantil. Describe la(s) poblaciones , las variables , los parmetros de inters. Calcula alguna tabla de contingencia de inters en el problema. Interpreta los resultados de los IC y comenta las conclusiones . 7.- Se realiz un ensayo de campo para ver la eficacia de una vacuna contra la gripe en ancianos en residencias. De entre un total de 1875 ancianos que estaban viviendo en 20 residencias en la provincia, se eligieron al azar 370. De estos, hubo 7 que no dieron su consentimiento para participar en el estudio y 13 que fueron excluidos por otros motivos. Los restantes fueron divididos en dos grupos del mismo tamao, la primera mitad recibi la vacuna y la segunda un placebo. El porcentaje de ancianos que padeci la gripe fue del 15% y del 25%, en vacunados y no vacunados respectivamente. Define el tipo de estudio. Se te ocurre alguna idea para mejorar el diseo?. Define las poblaciones, variables y parmetros. Representa los datos del estudio en una tabla de contingencia. Realiza un contraste de hiptesis (hiptesis, estadstico-test y p-valor) y llega a una conclusin.

8.- La tasa de colesterol en cierta poblacin sigue una distribucin N(235,46). A los individuos con una tasa de colesterol superior a la del 90% de la poblacin se les considera a riesgo de desarrollar cierta enfermedad. 8.1.- Que porcentaje de la poblacin est a riesgo? Haz un grfico en el que se represente la distribucin y ese porcentaje. 8.2.- Un individuo con una tasa de colesterol de 315 Se le considerar a riesgo ?. 8.3.- Cual es la probabilidad de que el valor medio del colesterol de 20 individuos elegidos al azar de la poblacin sea mayor de 240? 8.4.- Si la probabilidad de no desarrollar la enfermedad condicionado a tener el factor de riesgo es 0.68 y la probabilidad de no desarrollar la enfermedad condicionado a no tener el factor de riesgo es 0.96 . Calcular la especificidad y sensitividad asociadas a este factor de riesgo. 8.5.- Calcular e interpretar una medida de asociacin entre el factor de riesgo y la enfermedad 9.- Case Study: En el artculo "Base Curve Influence on the Fitting an Comfort of the Senofilcon A Contact Lens" se puede leer lo siguiente: Purpose:To determine the influence of the base curve on the movement, on the corneal surface mechanical alterations and on the subjective comfort of Senofilcon A contact lens for corneas having central curve radius flatter than 7.80 mm. Methods: In this prospective, double-masked, contralateral, randomized study, 40 eyes of 20 participants, with keratometric readings above 7.80 mm, were randomly fitted with Senofilcon A contact lenses: one having an 8.80 mm base curve in one eye and another one having 8.40 mm base curve in the other eye. Lens movement, corneal surface mechanical alterations and comfort were assessed in both eyes 15 days after contact lens fitting. Comfort was recorded using a scale from 1 to 5 (1 extremely uncomfortable, 2 uncomfortable, 3 comfortable, 4 very comfortable and 5 extremely comfortable). Comparisons regarding lens comfor were all carried out by means of the chi-square test. Differences were considered to be statistically significant when the P value was <0.01. Results: Forty eyes of 20 participants were included in this trial. Table 3 shows the participants demographics. There was a statistically significant difference on comfort rate between the two groups. the mean comfort score for the 8.80 mm base curve lens group was 3.50.92, whereas for the 8.40 mm base curve group it was 4.390.5 (P<0.001). 55.6% of the participants gave a score of 4 or 5 (i.e; very comfortable or extremely comfortable) to the 8.80 mm base curve lens, while 100% of the participants gave a score of 4 or 5 to the 8.40 mm base curve lens, with (P<0.001) (see Figure 1).
Table 3 Demographics of patients. Age, sex, flatter keratometric reading, and contact lens power shown as means and standard deviation (SD)

Eyes (n) Age (years) Sex (Male/Female)

Patients Demographics 40 27.53 6.10 9/11

Figure 1. Comfort scores given to the 8.40 mm and to the 8.8 mm base curve Senofilcon A.

Comenta sobre: El diseo, las variables y los mtodos estadsticos utilizados y si cambiaras algo respecto de lo que han hecho los autores de este informe.

10.- Se lleva a cabo un estudio sobre el sexo y el glaucoma en una poblacin y se obtiene que el 1.8% son hombres glaucomatosos y el 0.4% son mujeres glaucomatosas, adems se sabe que el 63.2% son hombres. a) Cul es la probabilidad de que un hombre de dicha poblacin tenga glaucoma ?. b) Se eligen al azar 8 hombres de la poblacin, calcular la probabilidad de que ninguno tenga glaucoma. c) Se eligen al azar 10 hombres de la poblacin, calcular la probabilidad de que como mucho 2 tengan glaucoma.

PRACTICAS 1.-Con los datos de los estudiantes de primero de medicina del ao pasado se ha hecho la siguiente representacin grfica. Te parece apropiada?. Justifica la respuesta.
200 24

150

24

100

77 118

133 36 68 47

50

Peso en Kg

Altura en cm

2.- En una encuesta realizada en una clase se apuntaron las calificaciones medias del bachillerato. Se han comparado las de los alumnos procedentes de centros pblicos y privados, mostrndose los resultados en la siguiente salida de SPSS. D si el anlisis te parece el adecuado y porqu. Se puede asumir que las varianzas son iguales?
Prueba de muestras independientes Prueba de Levene para la igualdad de varianzas

F Nota _ Se han asumido varianzas iguales No se han asumido varianzas iguales

Sig.

gl

Prueba T para la igualdad de medias Sig. Diferenci Error tp. 95% Intervalo de (bilater a de de la confianza para la al) medias diferencia diferencia Superior Inferior ,06337

5,157

,025

-1,356

129

,178

-,13793

,10174

-,33923

-1,405 111,781

,163

-,13793

,09819

-,33248

,05662

3.- En un hospital de campaa de Mdicos Sin Fronteras cerca del desierto en Mauritania se trata a un nmero elevado de pacientes con conjuntivitis. Se dispone de dos colirios (A y B) y se quiere comparar su eficacia a la hora de reducir la superficie enrojecida del ojo. Se elige a 12 personas al azar con conjuntivitis y se les aplica el colirio A en el ojo derecho y el B en el izquierdo, y al cabo de dos das se mide la reduccin de la superficie enrojecida. Se han realizado dos anlisis con el SPSS, elige el apropiado y d si hay diferencias entre los dos colirios a nivel 0,05 (justifica tu respuesta).
Estadsticos de grupo Desviacin tp. 3,47994 3,97915 Error tp. de la media 1,00457 1,14868

REDUCCIO

COLIRIO A B

N 12 12

Media 70,2500 72,7500

Prueba de muestras relacionadas

Media COLIRIO_A COLIRIO_B -2,50000

Diferencias relacionadas 95% Intervalo de confianza para la Desviacin Error tp. diferencia tp. de la media Inferior Superior 2,87876 ,83103 -4,32908 -,67092

gl

Sig. (bilateral)

-3,008

11

,012

Prueba de muestras independientes Prueba T para la igualdad de medias Sig. bilateral Diferenci a de medias Error tp. de la diferencia 95% Intervalo de confianza para la diferencia Inferior REDUCCIO Se han asumido varianzas iguales -1,638 22 ,116 -2,50000 1,52599 -5,66470 Superior ,66470

gl

4.- En un puesto de salud de Mdicos Sin Fronteras en Darfur (Sudn) se est llevando a cabo un programa de nutricin infantil de emergencia. A 24 nios elegidos al azar se les ha administrado esta dieta durante dos semanas apuntando al final el aumento de peso experimentado por los nios. Ayudndote de las salidas de SPSS responde a las siguientes cuestiones: a).- Se puede afirmar que el aumento medio de peso ha sido superior a 2 kilos?. b).- Da un intervalo de confianza de nivel 90% para el aumento medio de peso.
Estadsticos para una muestra Error tp. de la media ,16629

N AUMENTO 24

Media 2,5333

Desviacin tp. ,81464

Prueba para una muestra

Valor de prueba = 2 90% Intervalo de confianza para la diferencia t 3,207 gl 23 Sig. (bilateral) ,004 Diferencia de medias ,53333 Inferior ,2483 Superior ,8183

AUMENTO

5.- En un artculo aparecido en Journal of the American Medical Association se examinaba la relacin entre la Presin (medida en latidos por minuto) y el Sexo (1=varones, 2=mujeres). Con los datos de dicho estudio se han obtenido las siguientes salidas de SPSS. Qu presiones se pueden considerar anormales en una mujer
Descriptivos presion sexo 1 Media Intervalo de confianza para la media al 95% Estadstico 73,3692 71,9134 74,8250 73,4060 73,0000 5,87518 28,00 8,00 74,1538 72,1455 76,1622 74,2778 76,0000 8,10523 32,00 12,00 Error tp. ,72873

Lmite inferior Lmite superior

Media recortada al 5% Mediana Desv. tp. Rango Amplitud intercuartil Media Intervalo de Lmite inferior confianza para la Lmite superior media al 95% Media recortada al 5% Mediana Desv. tp. Rango Amplitud intercuartil

1,00533

6.- En un artculo aparecido en Journal of the American Medical Association se examinaba la relacin entre la Presin (medida en latidos por minuto) y el Sexo (1=varones, 2=mujeres). Con los datos de dicho estudio se han obtenido las siguientes salidas de SPSS. Responde a las siguientes cuestiones: a) Suponiendo que la distribucin de la presin es normal haz una representacin grfica aproximada y conjunta de la variable en ambos sexos. b) Qu presin se puede considerar anormal en una mujer?. c) Interpreta los intervalos de confianza.
Descriptivos sexo 1 Estadstico 73,3692 71,9134 74,8250 73,4060 73,0000 5,87518 28,00 8,00 74,1538 72,1455 76,1622 74,2778 76,0000 8,10523 32,00 12,00 Error tp. ,72873

presion

Media Intervalo de confianza para la media al 95%

Lmite inferior Lmite superior

Media recortada al 5% Mediana Desv. tp. Rango Amplitud intercuartil Media Intervalo de Lmite inferior confianza para la Lmite superior media al 95% Media recortada al 5% Mediana Desv. tp. Rango Amplitud intercuartil

1,00533

S-ar putea să vă placă și