Sunteți pe pagina 1din 90

Metodologia cercetării ştiinţifice

Colectarea datelor
Tipuri de variabile
Strategii de măsurare

Corin Badiu, 2012


Obiective
• Stabilirea tipurilor de variabile
 Surse IT de date
 Identifica si localizează seturile corecte de date
• In instituţie
• In afara instituţiei

• Strategii de măsurare

• Analiza, interpretarea si raportarea rezultatelor


 Selectează programul adecvat: Excel, SPSS
 Foloseşte programele pentru analize statistice simple
si prezentarea grafica a rezultatelor
 Interpretează rezultatele
Tipuri de variabile
Variabile de
confuzie*

Predictor* Rezultat

Modificatori ai efectului*

*Considerate general ca expunere la factori de risc


Tipuri de studii clinice
• Studii fără variabile
 Studii de caz, serii de cazuri, editoriale,
opinii / comentarii, rapoarte review
• Studii cu o singura variabila
 Studii descriptive
• Studii cu ≥2 variabile
 Experimente
 Studii observaţionale
 Meta-analize si review-uri sistematice
Ierarhia tipurilor de studii clinice

Studii clinice

Descriptive Analitice

Experimentale Observationale

Cohorta Caz-control Cross-sectional


Variabile

Variabila predictor Variabila rezultat


(independenta) (dependenta)
Evidence Based Medicine

• Metode de tratament susţinute de dovezi clinice si de


cercetare.
• Necesita integrarea celor mai bune dovezi din cercetare
pentru diagnostic si tratament cu experienţa clinica.
• Ia in considerare ce este optim pentru fiecare pacient
precum şi preferinţele acestuia.
Realitatea

• Cercetarea asupra eficientei de tratament face subiectul unui


număr mic de articole.

• Evidence based medicine este considerat un concept ce


foloseşte baze de date inclusiv studii sistematice de caz
pentru a ghida intervenţii terapeutice.

• Dovezile trebuie evaluate intr-un context terapeutic efectiv, “Ce


tip de intervenţie capătă sens pentru mine ca practician?”
Întrebări clinice

• Care este cea mai bună alegere terapeutică pentru pacientul meu?

• Este acest program suficient de bine documentat teoretic?

• Funcţionează acest program terapeutic?

• Cât timp durează acest program?

• Ce urmează după aceea?


Utilitatea clinicii!

Clinicienii
 Sunt în linia I a asistentei medicale
 Au expertiza clinica necesara
 Îşi cunosc bine pacienţii
 Sunt formaţi pentru gândire ştiinţifica
 Sunt obişnuiţi cu colectarea datelor
 Ştiu sa identifice rezultate
Măsurători de bază

• Linia de bază este o măsurătoare a ratei de


răspuns in absenţa tratamentului

• Linia de bază
 Stabileşte necesitatea tratamentului
 Permite îmbunătăţirea documentaţiei
 Ne permite să îmbunătăţim studiul
Date de bază

• Se creează un set de exemplare ale ţintelor


studiului
• Pregătim o fişă de înregistrare
• Folosim măsurători conform criteriilor de referinţă
Strategii de Colectare a Datelor

• Întotdeauna alegeţi mai mult decât o măsurătoare

• Verifică acurateţea datelor de bază

• Selectează designul cercetării clinice


Design de Cercetare Clinică
• ABA design
 Test, tratament, test

• ABAB design
 Test, tratament, test, tratament

• Design serial în timp


 Stabileşte o linie de bază

 Începe tratamentul

 Măsoară rezultatele tratamentului

• Design cu linii de bază multiple


 Obţine un număr de linii de bază diferite

 Fiecare linie de bază trebuie să fie independentă de altele

 Tratează doar o variabilă odată


Instrumente de colectare a datelor

Cerinţe

• Fiabilitate
• Valide
• Sensibilitate
• Universale
• Fără erori
Instrumente de colectare a datelor

Ce inseamnă fiabilitate?
Instrumentul va putea măsura cu aceeaşi acurateţe:

• În situaţii diferite de testare?


Testează - retestează fiabilitatea

• Experimentatori diferiţi?
Fiablitate Inter - operator
Instrumente de colectare a datelor
Este valid?

• Instrumentul care
va fi folosit poate
măsura datele pe
care le dorim?
Instrumente de colectare a datelor

Este Sensibil?
• Instrumentul ar trebui sa fie la fel de sensibil indiferent
de prezenta sau nu a variabilei măsurate şi de cantitatea
acesteia (linearitate).
Trebuie sa se caracterizeze valorile:
• Fals-pozitivi:
Subiectii sanatosi, prezentati ca bolnavi.

• Fals-negativi:
Subiecţii bolnavi, prezentaţi ca sanatosi.
Instrumente de colectare a datelor

Este universal?

Investigatorul ar trebui sa folosească un


instrument larg aplicat care sa ajute la
compararea datelor şi diminuarea erorilor
de raportare, pentru a face posibila
compararea cu date din literatura.
Instrumente de colectare a datelor

Este fara erori?


• Ar trebui sa nu existe diferenţe intre valoarea reala şi valoarea pe
care un investigator o obţine prin măsurare – altele decât
diferente date de variabilitatea de eşantionare.
Metode de colectare

1. Colectare Randomizata (Simpla)

2. Colectare Sistematica

3. Colectare Stratificata

4. Colectare pe grupe / segmente

5. Colectare pe alte criterii

6. Alte tipuri de colectare


Variabile Calitative şi Cantitative

Exemple de variabile calitative sunt ocupatia, sexul, status


marital, etc.

Variabilele care permit cuantificarea şi care pot fi măsurate


sunt considerate variabile cantitative. Exemple de variabile
cantitative sunt greutatea, înaltimea, vârsta.
 
Variabilele cantitative pot fi clasificate ca discrete sau continue
Tipuri de variabile

1. Variabile de tip categorii (e.g., Sex, Status Marital,


religie, naţionalitate, profesie)
2. Variabile de tip continuu (e.g., vârsta, venit,
greutate, inaltime)
3. Variabile discrete (e.g., Numar de copii)
4. Variabile Binare sau Dihotomice (e.g., întrebări la
care se da raspuns prin Da sau Nu)
Scale de Date

1. Nominale: Aceste date nu reprezintă o cantitate (e.g., Status Marital,


Sex)

2. Ordinale: Aceste date reprezintă o serie ordonata de elemente


inter-relaţionate (e.g., nivelul de educatie)

3. Interval: Aceste date reprezintă o cantitate măsurata pe un scala de


interval având un număr egal de unităţi şi un punct zero arbitrar.
(e.g.: Temperatura in Celsius)

4. Raport : Variabile, cum este greutatea pentru care putem compara


semnificatia uneia fata de cealalta (, 100 Kg este dublul a 50 Kg)
Variabile din protocol

• TIPURI de VARIABLE
 independente
 dependente
 intermediare
 de confuzie
Variabila Independentă

• O caracteristica pentru care se face o


măsurătoare şi/sau observaţie, care influenţează
un eveniment sau rezultat (variabila dependenta).

• NOTA
 Variabila independenta nu este influenţată de

eveniment sau rezultat, dar o poate determina


sau contribui la variaţia sa.
Variabila Dependentă

• O variabilă a cărei valoare este dependentă de


efectul altor variabile (“variabila independenta”)
in raportul de cauzalitate studiat.

Sinonime: variabila rezultat sau răspuns.


Variabile Intermediare

• O variabila care apare intr-o relaţie de cauzalitate de la o


variabila independenta la o variabila dependenta.
Sinonime: intervenţie, mediere

• NOTE
 Produce variaţii in variabila dependenta şi variază

datorita variabilei independente.

 O asemenea variabila este “asociata” atât cu variabila


dependenta cat şi cu variabila independenta.
Variabile de confuzie

• Un factor (care este el insusi determinant al


rezultatului), care perturba efectul aparent al unei
variabile de studiu asupra rezultatului.

• NOTA
 Un asemenea factor poate fi distribuit inegal intre

cei expuşi şi neexpuşi şi astfel influenţează


magnitudinea aparenta şi chiar direcţia efectului.
Organizarea Datelor

1. Tabel de frecventa
2. Histograma de frecventa
3. Histograma de frecventa relativa
4. Histograma
5. Poligon de frecventa
6. Poligon de frecventa relativa
7. Grafic cu coloane
8. Grafic “placinta”
9. Tabel “ Trunchi cu ramuri”
10.Box plot
Tabel de frecventa

Să presupunem că suntem interesați în studierea numărului


de copii în familiile care trăiesc într-o comunitate.
Următoarele date au fost colectate pe baza unui eșantion
aleatoriu de n = 30 de familii din comunitate.
2, 2, 5, 3, 0, 1, 3, 2, 3, 4, 1, 3, 4, 5, 7, 3, 2, 4, 1, 0, 5, 8, 6,
5, 4 , 2, 4, 4, 7, 6
Organizați aceste date într-un tabel de frecvențe!
Tabel de frecventa

X=Nr. de copii Frecventa Frecventa relativa


0 2 2/30=0.067
1 3 3/30=0.100
2 5 5/30=0.167
3 5 5/30=0.167
4 6 6/30=0.200
5 4 4/30=0.133
6 2 2/30=0.067
7 2 2/30=0.067
8 1 1/30=0.033
Grafic de frecventa

3
Freq.
2

0
0 1 2 3 4 5 6 7 8
Tabel de frecventa

Acum, să presupunem că avem nevoie să construim un tabel de


frecvență similară pentru vârsta pacienților cu probleme cardiace intr-o
clinica.

Următoarele date au fost colectate pe baza unui eșantion aleatoriu de n =


30 pacienți care au mers la camera de gardă a clinicii pentru probleme
cardiace.

Masuratorile sunt: 42, 38, 51, 53, 40, 68, 62, 36, 32, 45, 51, 67, 53, 59,
47, 63, 52, 64, 61, 43, 56, 58, 66, 54, 56, 52, 40, 55, 72, 69.
Tabel de frecventa

Grupe de varsta Frecventa Frecventa Relativa


32 -36.99 2 2/30=0.067
37- 41.99 3 3/30=0.100
42-46.99 4 4/30=0.134
47-51.99 3 3/30=0.100
52-56.99 8 8/30=0.267
57-61.99 3 3/30=0.100
62-66.99 4 4/30=0.134
67-72 3 3/30=0.100
Total n=30 1.00
Măsurarea tendinţei centrale
Empiric

Pentru o distribuție normală de aproximativ

a) 68% din măsurători se încadrează în jurul valorii de o


deviație standard fața de medie

b) 95% din măsurători se încadrează în termen de două deviații


standard în jurul mediei

c) 99,7% din măsurători se încadrează în termen de trei abateri


standard în jurul mediei
Distribuţie, Tendinţa centrala…
Mean
Concepte necesare
• Scale de măsura
• Distribuţie, tendinţa centrala, variabilitate,
probabilitate
• Prevalenta şi incidenta bolilor
• Rezultate ale bolilor (mortalitate, morbiditate)
• Asocieri (corelaţie sau covarianţa)
• Impact asupra sanatatii (diferenţe de risc şi rapoarte)
• Sensibilitate, specificitate, valoare predictiva
Scale
• Nominală - clasificarea calitativă de valoare egală:
sex, rasă, culoare, oraș

Ordinal - clasificarea calitativă, care poate fi ordonata


dupa rang: statutul socio-economic al familiilor

• Interval - date numerice sau cantitative: pot fi


ordonate dupa rang și comparate: temperatura

• Interval cu o valoare de referinta: de timp sau spațiu


Interval de încredere
Prevalenţa şi Incidenţa

• Prevalenta = probabilitatea bolii in


intreaga populatie, in orice moment
2% din populatie are diabet zaharat

• Incidența=probabilitatea ca un subiect sa
dezvolte boala pe parcursul intervalului

0,2% sau 2 la 1000 de cazuri noi pe an


Sensibilitate, Specificitate
• sensibilitate Pacienti Pacienti fara
cu boala boala
= a / (a+c)

Test

• specificitate
pozitiv
a b
= d / (b+d) Test
negativ
c d
Valoare Predictiva
Pacienti Pacienti fara
• Valoare predictiva cu boala boala
Pozitiva = a / ( a+b)
Test
pozitiv
a b
Test
• Valoare predictiva negativ
Negativa = d / (c+d)
c d
Eroarea în trialuri clinice
Domeniile în care poate apărea eroare

Eroare sistematică în. . .


alocare
răspuns
evaluare
Eroarea în trialuri clinice
Eroarea de alocare sau susceptibilitate

Poate aparea atunci cand alocarea unui pacient la un grup de


studiu este influențata de cunoașterea de catre investigator a
tratamentului care urmează să fie primit.

Poate duce la grupuri de tratament cu prognostic diferit.


Eroarea în trialuri clinice

Eroarea de alocare sau susceptibilitate

Grupurile de tratament trebuie să aibă prognostic similar,


care se realizează prin:
• Randomizarea pacienților

• Evaluarea prospectivă a pacienților

• Definirea clara a criteriilor de includere și excludere


Randomizarea în trialuri clinice

Apare atunci cand pacientii sunt atribuiti pentru tratamente


prin intermediul unui mecanism care impiedica atât
pacienții cat și cercetătorul de la cunoașterea tratamentului
care se atribuie.
Beneficiile Randomizarii
• Previne introducerea sistematică a erorii.

• Diminuează posibilitatea de eroare de alocare.

• Echilibreaza factori de prognostic pentru grupurile


de tratament.
• Îmbunătățește validitatea testelor statistice utilizate
pentru a compara tratamentele.
Eroarea în trialuri clinice
Eroarea de răspuns și evaluare / Eroarea de inregistrare

Poate aparea atunci cand un pacient raporteaza un raspuns


de tratament sau atunci când un anchetator evaluează
acest răspuns; fiecare persoană poate fi influențată de
cunoașterea tratamentului.

Un pacient sau un anchetator poate avea o idee


preconcepută despre care tratament este mai bun.
Eroarea în trialuri clinice
Mascarea
Pentru a minimiza eroarea de raspuns si de evaluare /
de înregistrare
• Single Blind (patient blinded): protejeaza pentru eroarea
de raspuns.

• Double Blind (patient and investigator blinded): protejeaza


pentru eroarea de raspuns si de evaluare / de înregistrare.
Eroarea în trialuri clinice

• Transfer bias
 Occurs when patients are lost to follow-up.

 Must be minimized.

• Performance bias
 Can occur with a single surgeon or with

multiple surgeons.
Confuzia - factori

• Relationship between coffee and


pancreatic cancer, BUT
• Smoking is a known risk factor for
pancreatic cancer
• Smoking is associated with coffee
drinking but it is not a result of coffee
drinking.
Detectarea confuziei

• If an association is observed between


coffee drinking and pancreatic cancer
 Coffee actually causes pancreatic cancer,
or
 The coffee drinking and pancreatic cancer
association is the result of confounding by
cigarette smoking.
Evaluarea confuziei

• If you know something is a possible


confounder, in the data analysis use
 Stratification, or
 Adjustment
• Fear the unknown!
Taxonomia designului de studii

• Treatment vs. Observational


• Prospective vs. Retrospective
• Longitudinal vs. Cross-sectional

• Randomized vs. Non-Randomized


• Blinded/Masked or Not
• Single-blind, Double blind, Unblinded
Randomizarea

• Random allocation
 known chance receiving a treatment
 cannot predict the treatment to be given
• Eliminate selection bias
• Similar treatment groups
Tipuri de randomizare
• Standard ways:
 Random number tables

 Computer programs

• NOT legitimate
 Birth date

 Last digit of the medical record number

 Odd/even room number


Tipuri de randomizare

• Simple
• Blocked Randomization
• Stratified Randomization
Randomizare simpla

• Randomize each patient to a treatment


with a known probability
 Corresponds to flipping a coin
• Could have imbalance in # / group or
trends in group assignment
• Could have different distributions of a
trait like gender in the two arms
Randomizare în bloc

• Insure the # of patients assigned to


each treatment is not far out of balance
• Variable block size
 An additional layer of blindness
• Different distributions of a trait like
gender in the two arms possible
Randomizare stratificata

• A priori certain factors likely important


(e.g. Age, Gender)
• Randomize so different levels of the factor
are balanced between treatment groups
• Cannot evaluate the stratification variable
Randomizare stratificata

• For each subgroup or strata perform a


separate block randomization
• Common strata
 Clinical center, Age, Gender
• Stratification MUST be taken into
account in the data analysis!
Rezultat

• Introductory Statistical Definitions


• What is Randomization?
• Randomized Study Design
• Experimental vs. Observational
• Non-Randomized Study Design
• Stat Software, Books, Articles
Tipuri de studii randomizate

• Parallel Group
• Sequential Trials
• Group Sequential trials
• Cross-over
• Factorial Designs
Grup paralel

• Randomize patients to one of k


treatments
• Response
 Measure at end of study
 Delta or % change from baseline
 Repeated measures
 Function of multiple measures
Studiul Ideal - Gold Standard

• Double blind
• Randomized
• Parallel groups
2 studii

• Study 1
 A U.S. study (2000) compared 469 patients with brain cancer
to 422 patients who did not have brain cancer. The patients’
cell phone use was measured using a questionnaire. The
two groups’ use of cell phones was similar.

• Study 2
 An Australian study (1997) conducted a study with 200
transgenic mice. One hundred were exposed for two 30
minute periods a day to the same kind of microwaves with
roughly the same power as the kind transmitted from a cell
phone. The other 100 mice were not exposed. After 18
months, the brain tumor rate for the exposed mice was twice
as high as that for the unexposed mice.
Diferente?

• How do the two studies differ?


 Study 1

 Study 2
?

• Why do the results of different medical


studies sometimes disagree?

• Could the second study be performed


on human beings?
Evaluarea faptelor
• Suppose a friend recently diagnosed with
brain cancer was a frequent cell phone
user. Is this strong evidence that frequent
cell phone use increases the likelihood of
getting brain cancer?
 Informal observations of this type are called
_____________ _____________.
 You should rely on reputable research studies,
not anecdotes.
Cum putem obţine informaţii
• Observational Study
 The researcher observes values of the response and
explanatory variables for the sampled subjects without
imposing any treatments
 Example:
• Experiment
 The researcher assigns experimental conditions (also
called treatments) to subjects (also called experimental
units) and then observes outcomes on the response
variable.
 Treatments correspond to values of the explanatory
variable
 Example:
Tipuri de studii observationale
• Retrospective
 Observational studies that look back in time
• This is sometimes done to find risk factors for certain
diseases
• Cross-Sectional
 Observational studies that take a cross section
of the population at the current time
• Prospective
 Observational studies in which subjects are
followed into the future
Studii Experimentale /
Observaţionale
• In an observational study, there can always be
confusion variables affecting the results.
• It is easier to adjust for confusion variables in an
experiment.
• In general, we can study the effect of an explanatory
variable on a response variable more accurately with
an experiment than with an observational study.
Dezavantaje ale Experimentului

• It can be difficult to monitor subjects to ensure that they are


doing what they are told.

• They can take many years, even decades, to complete.

• Results of experiments that use animals do not


______________ to humans.

• They are unnecessary the question of interest does not involve


trying to assess _____________.
Design al colectării datelor pentru
studii observaţionale
• Simple Random Sampling (SRS)
 A simple random sample of n subjects from a population is
one in which each possible sample of that size has the
_______ chance of being selected.
Colectarea datelor în studii
observaţionale
• Stratified Sampling
 A stratified random sample divides the population into
separate groups, called ________, and then selects an SRS
from each stratum.
Colectarea datelor în studii
observaţionale
• Cluster Sampling
 A cluster random sample can be used if the target population
naturally divides into groups, each of which is representative of the
entire target population. In this method, a SRS of groups (or strata)
is taken. Every member of the selected groups is put into the
sample.
Colectarea datelor în studii observaţionale

• Systematic Sampling
 A systematic sample selects every kth person from
the sample frame. The researcher randomly
selects a number between 1 and k in order to know
which person to select first, then selects every kth
person after this.
Avantaje ale colectării
• Simple Random Sampling (SRS)
 It is the easiest most widespread form of sampling.
 Each subject has an _______ chance to be in the
sample.
 The sample enables us to determine how likely it is
that descriptive statistics (like the sample mean)
fall close to corresponding values for which we
would like to make inference (like the population
mean).
Eroarea în colectarea datelor
• A sampling method is _________ if
 The sample tends to favor some parts of the
population over others.
 In other words, the results from the sample are not
representative of the population.
• Obviously, __________ samples are our goal.
Tipuri de erori
• Undercoverage
 Occurs when a sampling frame leaves out some groups in
the population
• Nonresponse bias
 Occurs when some sampled subjects cannot be reached,
refuse to participate or fail to answer some questions
• Response bias
 Occurs when the subject gives an incorrect response or
when the question wording or the way the interviewer asks
the questions is confusing or misleading
Elemente pentru un studiu corect
• Control group
 Gives us something to compare against
 Enables us to control the __________ _______
• The placebo effect occurs when patients seem to improve
regardless of the treatment they receive.
• Randomization
 Eliminates ______ that can result when researchers assign
treatments to the subjects
 Balances the group on variables that you know affect the
response
 Balances the group on _________ variables that may be
unknown to you
Elemente pentru un studiu corect

• Blinding
 Increases reliability of the results
• _________-blind: subjects do not know the
treatment assignment
• _________-blind: neither the subjects nor those
in contact with the subjects know the treatment
assignment
Exemplu
• A pharmaceutical company has developed a new drug for treating
high blood pressure. To determine the effectiveness of the drug,
the company conducted an experiment in which subjects with a
history of high blood pressure were treated with the new drug.

• A later experiment randomly divided subjects with a history of


high blood pressure into two groups. Group A was treated with
the new drug as before. Group B received the most popular drug
on the market at that time. The subjects were unaware of which
treatment they received. 60% of the patients in Group A
improved, while 63% of the patients in Group B improved.

• The __________ experiment is better because


Exemplu
• To investigate whether antidepressants help smokers to quit smoking,
one study used 429 men and women who were 18 or older and had
smoked 15 cigarettes or more per day in the previous year. They were
all highly motivated to quit and in good health. They were assigned to
one of two groups: one group took an antidepressant called Zyban,
while the other group did not take anything. At the end of a year, the
study observed whether each subject had successfully abstained from
smoking.
Studii comparative randomizate
• Randomization ensures that the groups of subjects
are similar in all respects before the treatments are
applied.
• Using a control group for comparison ensures that
external influences operate equally on both groups.
• If the groups are large enough, natural differences in
subjects will average out.
• This means that there be little difference in the results
for the groups unless the treatments themselves
actually cause the difference.
Studii şi erori
• Types of studies:
 Observational studies and experiments
 Experiments control for lurking variables
• Sampling designs:
 SRS, stratified random samples and cluster samples
 SRS is the preferred method
• Potential sources of bias:
 Undercoverage
 Response bias
 Nonresponse bias
 Convenience sampling
 Voluntary response sampling
• Elements of good experiments:
 Control group, randomization and blinding
Precauţii
• If a group is underrepresented in the sample, we cannot
make inference about it.

• We must be careful when interpreting the results of


observational studies.

• For comparison of several treatments to be valid, you must


apply all treatments to similar groups of experimental units.

• Interesting questions are usually pretty tough to answer.


This is due in part to the fact that no single experiment or
observational study can determine causation.
Stop and Think!!!
•Write the study!
•Describe & classify the
variables.
•Instruments for measure?
•Bias?
•Prepare to analyze data!