Documente Academic
Documente Profesional
Documente Cultură
173
1. INTRODUO
Este artigo metodolgico pretende proceder com uma sntese explicativa sobre o que anlise de
contedo e, em especfico, como criar categorias analticas para aplicao neste tipo de pesquisa. O objetivo
deste artigo didtico, no trazer novas evidncias, abordagens ou aplicaes do mtodo4. Embora talvez
parea introdutrio queles experienciados na rea, tal contedo destinado a ps-graduandos e estudantes
recm-iniciados na pesquisa cientfica, em metodologia poltica ou na metodologia especfica e este o
pblico-alvo ao qual se destina. O objetivo do presente artigo , portanto, ser um guia prtico para jovens
Agradecemos aos pareceristas annimos da Revista Eletrnica de Cincia Poltica pelas sugestes e contribuies, bem como ao
fundamental trabalho do corpo editorial desta revista.
2
Mestre e doutorando em Cincia Poltica pela Universidade Federal do Paran (PPGCP-UFPR). Bolsista Capes. Contato:
mccarlomagno@gmail.com
3
Mestre e doutorando em Cincia Poltica pela Universidade Federal do Paran (PPGCP-UFPR). Contato: lrocha_87@yahoo.com.
br
4
Para novas abordagens sobre o mtodo, veja Hopkins & King (2010).
1
174
CARLOMAGNO, Mrcio C. & ROCHA, Leonardo C. Como criar e classificar categorias para fazer anlise de contedo: uma questo metodolgica
pesquisadores5.
As cincias sociais em geral e a cincia poltica em especfico sofrem no Brasil de uma deficincia
endmica de falta de compreenso sobre os seus mtodos de anlise (SOARES, 2005), embora tenhamos feito
grande progresso nas ltimas dcadas (BARBERIA, GODOY, BARBOZA, 2014; NEIVA, 2015). Ainda hoje
um problema da cincia poltica no Brasil a falta de compreenso mais intensa sobre mtodos.
A metodologia de anlise de contedo foi destacadamente desenvolvida durante a Segunda Guerra
6
Mundial , pela Diviso experimental para o estudo de comunicaes em tempos de guerra, do Congresso
dos Estados Unidos, sob coordenao de Harold Lasswell. A metodologia foi criada especialmente para sintetizar e compreender o contedo dos argumentos utilizados por jornais e propagandas inimigos, e, somente
aps isso, passou a ter aplicao em estudos acadmicos de comunicao poltica. Logo aps o fim da guerra,
foi lanado e tornou-se clssico o livro The language of politics: studies in quantitative semantics7, cuja
traduo chegou quase 40 anos depois ao Brasil, sem o seu subttulo (estudos em semntica quantitativa,
em traduo livre). Kimberly Neuendorf, autora de um dos mais importantes handbooks contemporneos sobre anlise de contedo, definiu Lasswell8 como muito possivelmente a figura mais influente do sculo XX
no desenvolvimento do estudo sistemtico de mensagens (NEUENDORF, 2002, p. 32, traduo livre)9 e o
da Vinci das cincias comportamentais (NEUENDORF, 2002, p. 34, traduo livre). importante ressaltar,
portanto, de antemo, o valor instrumental da metodologia10, criada para uma aplicao prtica11 e s depois
vastamente adotada pela academia.
Esta metodologia tem sido especialmente relevante para pesquisadores na rea da comunicao social, jornalismo, marketing, mdias sociais e correlatas, embora no apenas. Em fato, a anlise de contedo
pode ser realizada sobre qualquer tipo de ato enunciativo (mensagem), por qualquer meio.
Uma etapa especfica do processo global de anlise de contedo a fase de planejamento, coleta
e sistematizao dos dados (e, certamente, uma das mais importantes). As demais fases de cunho analtico
dependem de uma coleta realizada de modo adequado. Por isso este artigo aborda um dos aspectos centrais
desta fase, no a anlise de resultados propriamente dita ou o desenho de pesquisa12. Em especfico, como criar
Para mais, alm dos clssicos tratados aqui, dois bons artigos so Oliveira (2008) e Moraes (1999).
Embora algumas incurses iniciais j existissem desde os anos 1920, para estudo das comunicaes comunistas.
7
Outro clssico fundador da rea Bernard Berelson (1952), Content analysis in communication research, que no iremos tratar
aqui.
8
Para quem desejar saber mais sobre Lasswell, em portugus, uma alternativa Carvalho (2012).
9
No original: very possible the single most influential figure in the development of the systematic study of messages in the 20th
century
10
o prprio Lasswell quem faz questo de ressaltar este aspecto instrumental da metodologia: vale notar que os meios quantitativos para descrever a ateno prestam-se a fins muito prticos, alm dos cientficos. Um dos problemas mais cruciais na conduo
da guerra consiste em prever as aes do inimigo. O setor de informaes de qualquer Estado-Maior ou agncia de operaes est
permanentemente envolvido numa luta de crebros com o inimigo, cujo objetivo prever suas aes militares, diplomticas, econmicas e propagandsticas antes que ele as execute, bem como avaliar em que ponto um ataque pode causar-lhe maiores prejuzos.
Para tal fim, uma das importantes fontes de informao consiste naquilo que o inimigo dissemina atravs de seus canais de comunicao. (LASSWELL, 1982a [1949], p. 46)
11
Um exemplo de tal aplicao foi a utilizao deste recurso para condenao de inimigos internos durante a Guerra. Lasswell
comea um artigo pragmaticamente narrando o fato que, segundo ele, demonstrava a importncia da metodologia: Tem-se aceito
como provas, nos tribunais federais norte-americanos, fatos determinados atravs da anlise de contedo. Em todos os casos, o problema submetido justia consistia na deteco de propaganda em um veculo de comunicao pblica. O Departamento de Justia
fundamentou-se parcialmente em estudos quantitativos de contedo ao apresentar os argumentos do Governo (LASSWELL, 1982b
[1949], p. 163). Fica evidente sua preocupao de cincia aplicada, inclusive para fins forenses, no somente abstrata, e por isso a
necessidade de profundo rigor metodolgico.
12
Para chegar at o momento do qual trata este artigo, voc deve ter passado por algumas etapas lgicas, um tanto bvias: a) saber
o que deseja pesquisar, ter definido seu objeto e recorte temporal. b) saber como a verificao do contedo que voc ir fazer poder
5
6
175
Vale destacar desta citao de Janis dois elementos centrais desta prtica: a ideia de classificao e
de categorias apropriadas. O que so categorias apropriadas e o que as constitui como tal ser abordado na
confirmar ou negar suas hipteses. Estas etapas fazem parte da metodologia de pesquisa em sentido muito mais amplo, por isso no
nos deteremos nelas. Sabendo que voc quer investigar o contedo de algo (o tipo de artigo publicado numa revista; os temas mais
abordados por um candidato em uma campanha; as notcias em destaque em um jornal ou o que for), como fazer isso? Como criar
categorias funcionais para isso?
13
Acreditamos que a aderncia dos socilogos brasileiros a Bardin, na segunda metade do sculo XX e que permaneceu at hoje,
pode ser atribuda, ao menos em parte, ao desejo de no alinhar-se com um analista norte-americano, em um contexto de polarizao
ideolgica, uma vez que Lasswell trabalhou para o governo dos Estados Unidos, com finalidades polticas.
14
Dar os crditos a quem os merece, isto , aos criadores da metodologia, no implica negar a importncia fundamental de novas
tcnicas surgidas nas ltimas dcadas, em especial, os aspectos estatsticos e abordagens computacionais que esto promovendo
uma verdadeira revoluo no campo.
15
importante no confundir anlise de contedo com anlise do discurso. Esta ltima uma abordagem filosfica que busca
compreender a origem dos enunciados, sua insero em dados contextos e a produo de significados. Possui nas correntes russa
(BAKHTIN, 2006) e francesa (PCHEUX, 2009) seus principais baluartes. Algumas pessoas utilizam o termo anlise de contedo
do discurso, para anlises de contedo aplicadas, por exemplo, a discursos polticos. Esta uma redundncia desnecessria, j que
a anlise de contedo feita para ser aplicada em quaisquer mensagens, incluso discursos, genericamente falando.
176
CARLOMAGNO, Mrcio C. & ROCHA, Leonardo C. Como criar e classificar categorias para fazer anlise de contedo: uma questo metodolgica
Importante no confundir: embora a anlise de valncia utilize um tipo de anlise de contedo, estas no so sinnimos. Para
quem quiser saber mais sobre valncias, vale conferir o eletrizante debate entre Miguel (2015), Feres Jnior (2016) e Miguel (2016).
177
seu sentido mais amplo, mesmo quando no chamada por este nome, como, por exemplo, em estudos sobre o
contedo substantivo de propostas de leis, como em Mesquita et al (2014).
Em comum em todas estas pesquisas, h uma caracterstica que importante ressaltar. A questo
quanto natureza deste tipo de anlise. Ela quantitativa, a despeito de equvocos reiterados acerca desta
questo.17 Justamente por trabalhar com caractersticas e qualidades dos contedos, comum a tentao de alguns chamarem isto de uma anlise qualitativa18. Especialmente porque em certos flancos da academia brasileira (na rea de humanas) existe resistncia e at preconceito contra o termo quantitativo. Algumas pessoas
podem achar que quantitativo refere-se somente quilo que mede apenas e to somente quantidades (como a
frequncia simples do nmero de curtidas em uma pgina do Facebook ou do nmero de matrias publicadas
por um jornal) e que, quando se coletam dados que se referem a qualidades, como, por exemplo, o vis positivo ou negativo de matrias jornalsticas, os assuntos/temas de um programa televisivo ou os argumentos
utilizados em algum meio, ento, por se referirem a qualidades deste objeto, o estudo seria qualitativo. No .
Como dois autores clssicos deixam claro: os procedimentos de anlise de contedo resolvem adequadamente o problema de descrever o quadro de ateno em termos quantitativos. (LASSWELL, 1982a
[1949], p. 46) e uma caracterstica que distingue a anlise de contedo das outras tcnicas descritivas das comunicaes o seu aspecto quantitativo. (KAPLAN & GOLDSEN, 1982, p. 77). Como se percebe, segundo
Kaplan & Goldsen, ser quantitativa a prpria definio da natureza da anlise de contedo isto para no
mencionar que o prprio ttulo do artigo (Por que ser quantitativista?) de Lasswell j indica seu argumento19.
Em fato, cabe deixar claro: a designao se seu mtodo quantitativo ou qualitativo se refere a como
voc sistematiza os dados com os quais trabalha, no a natureza de sua anlise. No importa que, por exemplo,
ao identificar os argumentos presentes em determinada mensagem, voc esteja verificando qualidades deste
objeto. Se voc sistematiza (e de alguma forma quantifica) estas informaes em uma planilha, banco de dados
ou em uma folha de caderninho, esta pesquisa , portanto, quantitativa-categrica.
3. COMO CRIAR CATEGORIAS
Da citao de Janis apresentada na seo anterior destacamos o conceito central de categorias apropriadas, fundamental para a prtica da anlise de contedo. Mas o que so categorias apropriadas? O que as
constitui como tal?
17
Como j salientamos, esta a abordagem aqui defendida, a partir do recorte dos autores tratados, no a nica existente, remanescendo um longo debate sobre a questo nas cincias sociais. Veja Riffe, Lacy & Fico (2005), para uma defesa recente sobre a
natureza quantitativa deste tipo de anlise.
18
Parece ser demasiadamente longa a lista de autores que insistem em chamar anlise de contedo de qualitativa. Entre eles,
podemos citar: Mozzato & Grzybovski, 2011; Silva, Gobbi e Simo, 2005; Moraes, 1999; Caregnato & Mutti, 2006. Vale pontuar
que por vezes a anlise de contedo recebe o nome qualitativo por motivos distintos. Nas cincias sociais, a confuso se deve em
parte por uma inveno de Bardin, para quem a anlise de contedo quantitativa seria apenas aquela que trabalhasse com frequncia, ao passo que a que associasse diferentes categorias seria qualitativa (BARDIN, 2011 [1977], p. 144-146). Apesar da falta de
lgica (e da evidente falsidade, luz da explicao da Janis), tal citao vastamente repetida por seus seguidores. J no campo da
economia, administrao e correlatos (como Silva & Foss, 2013), o termo qualitativo usado em contraposio quantitativo
em sentido estrito, que refere-se to somente a valores contnuos. Este uso compreensvel e at justificvel. Em fato, o termo mais
tecnicamente correto no seria nem qualitativo nem quantitativo, mas, como utilizado por Oliveira (2008), anlise categorial ou
anlise categrica (embora tambm esta autora chame de qualitativo). Isso se deve porque se utilizam categorias para compor a
anlise. Estas categorias so quantificveis, portanto, uma anlise quantitativa. Contudo, elas no so escalas contnuas (como um
ndice que vai de zero a um), no sendo aplicveis a elas o mesmo tipo de tratamento estatstico usado para dados numricos puros.
19
Apesar de Lasswell defender suas posies, importante pontuar que ele no um sectrio como alguns pregam a seu respeito. O
prprio reconhece a necessidade e o espao tambm para anlises tericas e no quantitativas: Isto no implica, obviamente, que
os mtodos no-quantitativos devam se abandonados. Pelo contrrio, h necessidade de uma teoria mais sistemtica e de intuies
mais inspiradas a fim de aproveitar na prtica as potencialidades plenas da preciso. Como o revela a histria da quantificao (na
economia, por exemplo), ocorre uma interao permanente e proveitosa entre teoria, intuio, impresso e preciso. (LASSWELL,
1982a [1949], p. 48)
178
CARLOMAGNO, Mrcio C. & ROCHA, Leonardo C. Como criar e classificar categorias para fazer anlise de contedo: uma questo metodolgica
Existem algumas regras fundamentais que precisam ser seguidas em uma pesquisa que utilize anlise
de contedo, especialmente ao criar as categorias com as quais voc vai trabalhar. Estas mesmas regras lgicas
valem, tambm, para a criao de categorias em termos mais gerais, para quaisquer estudos, ainda que no
aplicadas anlise de contedo. As descrevemos didaticamente, a seguir.
Regra 1: Regras claras de incluso e excluso nas categorias
Devem existir regras formais, claras, objetivas e escritas (formalizadas por completo, no que usualmente chamado livro de cdigos ou dicionrio) sobre a incluso e excluso de determinados contedos
nas categorias criadas. Em definio, as regras de uma anlise de contedo especificam quais os sinais que
devem ser classificados e em que categorias. Essas regras so, com efeito, regras semnticas para a linguagem
da comunicao a ser analisada. (JANIS, 1982 [1949], p. 55)
Por mais intuitivo que possa parecer, quais so os limites de dada categoria devem ser claros e formalizados. Dito de outra forma, a primeira regra quase tautolgica: absolutamente necessria a prpria
existncia de regras (regras para incluso de cada contedo em cada categoria). A ausncia desta regra leva ao
problema de informaes de incluso/excluso incompletas ou insuficientes. s vezes estas regras existem,
mas so dbias, o que gera erros de classificao e interpretao dos dados. Estes problemas esto intimamente relacionados ao problema da objetividade da classificao, como argumentaremos na regra 5.
Derivao natural disto est a necessidade de publicizao aos leitores das regras de incluso utilizadas. Se a primeira regra do clube da luta no falar sobre o clube da luta as coisas so opostas quando se
trata de anlise de contedo (ou qualquer procedimento cientfico em geral). Em fato, voc precisa falar sobre
suas categorias. O significado destas categorias deve ser explicitado aos leitores. No adianta os ter durante
a coleta, mas no deixar claro no paper, artigo ou outra produo intelectual. Este , tambm, um elemento
importante para propiciar a eventual replicabilidade20 (KING, 1995, 2015) do estudo, caracterstica central na
definio do que cincia.
Podemos exemplificar a partir da pesquisa de Lasswell (1982b [1949]), em que este queria detectar
se os jornais britncios, durante a segunda guerra mundial, apresentavam argumentos favorveis ou desfavorveis Alemanha Nazista, Unio Sovitica e aos Estados Unidos. Para isso, o autor precisou definir o que
considerava posies favorveis ou desfavorveis. Uma regra de incluso/excluso falha seria aquela que no
explicitasse a compreenso ou definio exata que os analistas tinham por posies favorveis ou desfavorveis ao governo. Lasswell, no entanto, gasta espao considervel de seu artigo discutindo sua definio e apresenta oito tipos de testes lgicos (elementos de caracterizao de comportamentos) diferentes que indicavam
se a mensagem poderia ou no incorrer naquilo que procuravam classificar. Assim, ele deixa claros a definio
e os limites de suas categorias.
Regra 2: As categorias precisam ser mutuamente excludentes (exclusividade)
O contedo no pode, sob nenhuma hiptese, ser passvel de classificao em mais de uma categoria. Isso remete regra nmero 1, que diz que a definio das categorias deve ser clara. O que est em uma
categoria, no pode estar em outra. Um determinado contedo no pode ser passvel de ser classificado em
20
Replicabilidade a caracterstica de uma pesquisa que possa ser reproduzida ou duplicada por outros pesquisadores, em outras condies. Ver King (1995, 2015).
179
uma ou outra categoria, a depender da interpretao do analista. As categorias no podem ter elementos que
se sobreponham ou sejam redundantes, que possibilite que as mensagens (contedo) se encaixem em uma ou
outra categoria. A quebra desta regra levaria ausncia de confiabilidade (regra 5). Como lembramos na regra
1, estas regras precisam ser muito bem definidas.
Klaus Krippendorff define que exclusividade mtua se refere habilidade de uma linguagem de
dados fazer claras as distines entre o fenmeno a ser codificado. Nenhuma unidade de anlise pode se encaixar em duas ou mais categorias. (KRIPPENDORFF, 2004, p. 132)21. J Kimberly Neuendorf argumenta
que deve existir apenas uma categoria apropriada para cada unidade codificada. Se existir a possibilidade de
mltiplas categorias, ento estas devem ser divididas em medidas separadas. (NEUENDORF, 2002, p. 119)22
Vamos nos valer do exemplo dado pela prpria Neuendorf em sua obra. Digamos que voc queira
descobrir as estratgias de promoo de determinados produtos (Neuendorf exemplifica a partir de web banners, mas o argumento pode ser utilizado para qualquer outro meio). Para isso, criou as seguintes categorias:
i) sem estratgia de promoo; ii) mais informacional do que emocional; iii) mais emocional do que informacional; iv) demonstrao de produto; v) soluo de problemas; vi) reputao da marca; vii) comparao
de produtos. Bom, esta uma categorizao ruim, pois as categorias no so mutuamente excludentes. Uma
dada propaganda poderia facilmente ser codificada em uma ou mais das categorias listadas, ao mesmo tempo.
Um modo mais correto neste caso, argumenta a autora, seria coletar cada uma destas informaes em variveis separadas (presena ou ausncia de cada um dos indicadores) e depois montar estes tipos, a partir dos
resultados empricos..
Sobre os problemas fundamentais gerados por categorias no exclusivas, vale a pena conferir a acidez de Krippendorff:
difcil solucionar uma situao na qual duas ou mais categorias carecem de exclusividade mtua. A
bem intencionada prtica de adicionar categorias como ambguo ou aplicvel a duas ou mais categorias a um conjunto de categorias com sobreposio no altera a indistino bsica das categorias; isto
incentiva a indeciso de parte dos codificadores e raramente rende uma varivel suficientemente confivel. Quando uma anlise de contedo usa tais categorias, revela mais sobre suas prprias concepes
obscuras do que sobre as propriedades do texto, e enviesam seus resultados de pesquisa em direo a
fenmenos facilmente descritveis. No existe nenhum remdio verdadeiro para concepes ambguas.
(KRIPPENDORFF, 2004, p. 132, traduo livre)23
Um problema correlato, mas distinto, que pode ocorrer na pesquisa emprica que o analista se depare com a presena de mais de um contedo em uma mesma mensagem. Por exemplo, imagine a anlise de
discursos de um poltico. As falas usualmente tm um tema central, mas tambm temas secundrios. Nosso
hipottico candidato pode falar sobre uma proposta de poltica pblica (social, econmica etc) e aproveitar
para dizer que seu adversrio foi ou vai ser contra tais projetos. O analisa, neste caso, poder ficar na dvida
se classifica como proposta de poltica pblica ou como ataque aos adversrios. A soluo a criao de
No original: Mutually exclusive refers to the ability of a data language to make clear distinctions among the phenomena to be
recorded. No recording unit may fall between two categories or be represented by two distinct data points.
22
No original: There should be only one appropriate code for each and every unit coded. If there is the possibility of multiple codes,
then these ought to be broken down into separate measures.
23
No original: It is more difficult to resolve a situation in which two or more categories lack mutual exclusivity. The well-intended
practice of adding categories such as undecidable ambiguous or applicable to two or more categories to sets of categories with
overlapping meanings does not alter the categories fundamental indistinctiveness; it invites indecision on the part of coders and
rarely renders a variable sufficiently reliable. When content analysts use such categories, they reveal more about their own unclear
conceptions than about the properties of texts, and they bias their research results in the direction of easily describable phenomena.
There is no real remedy for ambiguous conceptions
21
180
CARLOMAGNO, Mrcio C. & ROCHA, Leonardo C. Como criar e classificar categorias para fazer anlise de contedo: uma questo metodolgica
outra varivel, nomeada, por exemplo, Tema_2, para obter os temas secundrios24. A criao de variveis
suplementares muitas vezes necessria para contemplar situaes assim e aceitvel. Mas importante voc
notar a diferena. Neste caso, no se trata de categorias dbias, criadas de forma errada (que o analista fique
em dvida se cabe em uma ou em outra), mas de dar soluo para uma caracterstica plural da mensagem.
Regra 3: As categorias no podem ser muito amplas. Ou: no coloque coisas diferentes no mesmo saco (Homogeneidade)
Se as categorias devem ser mutuamente excludentes (regra 2), outra regra que as categorias devem
ser estritas, homogneas. Isto , elas no devem ser to amplas ao ponto de serem capazes de abarcar coisas
muito diferentes em uma mesma categoria, sob pena de no ter significado prtico para o estudo.
Aqui, a definio do metodlogo Kenneth Bailey essencial para resumir tanto esta quanto a regra
anterior:
A citao de Bailey nos diz, fundamentalmente, que, ao mesmo tempo que as categorias devem ser
distintas entre si, no podendo se confundir, os contedos pertencentes a cada categoria devem ser prximos,
similares.
Vamos a um exemplo? Imagine que voc est analisando as mensagens transmitidas pelos candidatos
durante as eleies. Pode ser emitidas nas propagandas televisivas, nas mdias sociais, em palanques ou onde
for. Voc quer saber sobre o que eles falam durante a campanha eleitoral e para isso criou (apenas) quatro
grandes categorias: policy (propostas de polticas pblicas), construo da prpria imagem, campanha negativa (ataques a adversrios) e agenda (divulgao de eventos etc). Verificando os resultados, voc descobre que
todos falaram mais sobre propostas de polticas pblicas (policies) e em nveis iguais. Pronto, s isso. E agora?
Por voc ter criado uma categoria ampla demais (propostas de polticas), com coisas distintas no mesmo agrupamento, voc perdeu os detalhes que poderiam interessar. Neste caso, teria sido mais pertinente dividir esta
categoria em polticas econmicas, sociais e por a vai, conforme pertinente26. Assim voc poderia saber se o
candidato A falou mais de economia, enquanto o B mais de sade e educao, por exemplo.
Regra 4: as categorias devem contemplar todos contedos possveis, e outro precisa ser residual (exaustividade)
Depois de criadas as categorias, usual a criao de uma categoria outro. Por mais precisas que
Na hora de rodar os testes estatsticos dos dados, estas devem ser tratadas como duas variveis distintas (tema principal e tema
secundrio, neste exemplo). Agreg-las, de modo que o total ultrapasse 100%, implicaria em prejuzos lgicos compreensibilidade
da comparao e da pesquisa.
25
No original: we generally seek to minimize within-group variance, while maximizing between-group variance. This means that
we arrange a set of entities into groups, so that each group is as different as possible from all other groups, but each group is internally as homogeneous as possible. By maximizing both within-group homogeneity and between-group heterogeneity, we make groups
that are as distinct (nonoverlapping) as possible, with all members within a group being as alike as possible.
26
Em fato, o uso de subgrupos de categorias a abordagem mais apropriada, uma vez que te permite um grau maior de mensurao
e, se for o desejo para a pesquisa, a posterior agregao em categorias principais.
24
181
sejam suas categorias, sempre h algum contedo que no se encaixa em nenhuma para isto serve esta categoria. Contudo, ela precisa ser residual, isto , apenas sobras. Uma categoria outro 27 (ainda que contenha
material muito disperso entre si) que rivalize com demais categorias de contedo indica problemas na criao
e existncia das suas categorias de classificao (regras 1, 2 e 3).
Se h muitos contedos que no se encaixam em nenhuma categoria, ento estas categorias talvez
estejam erradas. Dito de outro modo, as categorias criadas precisam esgotar28 o contedo que voc est analisando. A esta regra os tericos do o nome formal de exaustividade. Novamente podemos recorrer s
palavras de Bailey:
As classes formadas precisam ser tanto exaustivas quanto mutuamente exclusivas. Isto significa que se
existem N casos para serem classificados, deve haver uma classe apropriada para cada um destes
(exaustividade), mas apenas uma classe correta para cada, com nenhum caso sendo membro de duas
classes (exclusividade mtua). Assim, deve haver uma classe (mas apenas uma) para cada um dos N
casos. (BAILEY, 1994, p. 3, traduo livre, grifos no original)29
O que o autor chama classes, ou mesmo tratou por grupos anteriormente, evidentemente, so as
categorias com as quais estamos lidando. Perceba que a citao diz respeito tanto regra nmero 2, quanto
4, dada que estas questes esto profundamente imiscudas.
Vamos a um exemplo sobre exaustividade. Digamos que voc queira categorizar os discursos dos
deputados federais que votaram na admissibilidade do processo de impeachment contra a presidente Dilma
Rousseff, em abril de 2016. Neste exemplo, seu interesse de pesquisa era saber a natureza dos argumentos
proferidos no momento do voto. Voc criou suas categorias antes, a partir do que j sabia previamente (outros
estudos nos quais voc se baseou, sobre outras votaes). Voc sabia, ento, que os discursos poderiam ter
duas grandes naturezas argumentativas: razes tcnicas (jurdicas) ou polticas. Voc at dividiu estas duas
razes em subgrupos, para captar bem o cenrio. Criou, por exemplo, categorias para crise econmica, crise
poltica, corrupo etc. Mas, no momento da votao, como foi vastamente noticiado, uma parcela considervel dos deputados proferiu o voto dedicando-o aos prprios familiares (pelos meus filhos: pela minha neta
etc). Sua categorizao, neste caso, no foi exaustiva, pois no previa valores morais, categoria na qual estes
discursos poderiam se enquadrar. Neste caso hipottico, sua categoria outro provavelmente teria superado
as de razes tcnicas ou mesmo as de razes polticas, indicando existir um problema com a categorizao.
Neste exemplo, ns j sabemos o resultado geral (as citaes famlia) antes do comeo da classificao, de modo que podemos ajustar e adequar as categorias. Mas, muitas vezes em estudos empricos de
anlise de contedo, talvez voc s descubra um fenmeno como este no decorrer da coleta de dados. No caso
de decidir, j com a coleta em andamento, pela criao de uma nova categoria pois as anteriores no davam
conta de um tipo de mensagem especfica, preciso rever e ajustar o contedo j classificado anteriormente,
para que metade do banco de dados no seja classificado com uma regra e outra parte com outra regra.
Vale aqui o registro de abordagem feita por Kaplan e Goldsen (1982, p. 79) com a utilizao, alm da categoria outro, da categoria ininteligvel, para distinguir o que efetivamente era outro tipo de contedo e o que era contedo que no pde ser acessado
ou compreendido. Embora tal abordagem no esteja em voga atualmente, a consideramos altamente vlida.
28
No propriamente uma regra, mas igualmente importante: quanto menos categorias, melhor para proceder com as anlises, especialmente em termos de testes estatsticos. Trabalhar com mais de 10 categorias potencialmente inviabiliza a compreenso de um
comportamento lgico do objeto estudado. preciso, portanto, encontrar um ponto de equilbrio.
29
No original: the classes formed must be both exhaustive and mutually exclusive. This means that if N persons are to be classified,
there must be an appropriate class for each (exhaustivity), but only one correct class for each, with no case being a member of two
classes (mutual exclusivity). Thus, there must be one class (but only one) for each of the N persons.
27
182
CARLOMAGNO, Mrcio C. & ROCHA, Leonardo C. Como criar e classificar categorias para fazer anlise de contedo: uma questo metodolgica
E ainda:
O primeiro requisito de uma tcnica que se prope a descrever qualquer conjunto de caractersticas
o de que os resultados tenham alto grau de confiabilidade, isto , que observadores diferentes relatem
a mesma coisa. No caso dos resultados da anlise de contedo, a confiabilidade pode ser atestada pela
determinao do grau de correlao entre as frequncias obtidas quando diferentes analistas estudam o
mesmo contedo independentemente. [...] Diz-se que um instrumento de mensurao tem validade32
se mede o que efetivamente se prope a medir; diz-se que este instrumento possui confiabilidade se
apresenta os mesmos resultados consistentemente. (JANIS, 1982 [1949], pp. 54-56)
Em resumo, a regra da objetividade que os mesmos dados devem ser passveis de classificao igual
por analistas diferentes. A replicao de uma pesquisa elemento central em qualquer pesquisa cientfica e,
Para quem estiver interessado em classificaes, em sentido mais amplo (no pela criao manual de categorias que tratamos
aqui), em especial mtodos automatizados de classificao, poder encontrar contedo interessante em Figueiredo Filho, Silva e
Rocha, 2012 (sobre clusters), Figueiredo Filho et al, 2013 (sobre anlise de componentes principais) e Figueiredo Filho et al, 2014
(sobre anlise fatorial).
31
O mtodo mais rigoroso para coleta e classificao dos dados (embora s vezes no utilizado por falta de recursos humanos nas
pesquisas), como usado por Lasswell e colegas, que dois ou mais analstas diferentes (que no se comuniquem) codifiquem o
mesmo contedo separadamente. Aps isso, podem ser feitos testes para verificar o grau de confiabilidade (congruncia) das classificaes. Lombard, Snyder-Duch & Bracken (2002) argumentam que a simples porcentagem de acordncia/discordncia entre os
codificadores (como s vezes relatado em certas pesquisas) insuficiente, apontando para alternativas de testes estatsticos destinados a este fim. Sobre o nvel de confiabilidade, os autores reportam que coeficientes acima de .90 so aceitveis em todas situaes
e, abaixo disto mas acima de .80 aceitveis somente em alguns estudos. Softwares e pacotes estatsticos (como o SPSS, mas no
apenas) fornecem recursos especficos destinados a verificar o grau de consistncia do contedo classificado por distintos codificadores. Em estudos mais rigosos, do ponto de vista metodolgico, obrigatrio reportar no artigo o valor dos testes de confiabilidade.
32
Validade outro conceito fundamental na pesquisa cientfica, mas no parte do recorte principal deste artigo. Como definido
por Janis, se refere se o indicador utilizado realmente retrata aquilo que se est analisando. Por exemplo, Robert Dahl, em seu
clssico livro, prope utilizar liberdade de se opor ao governo e oportunidade de participar do mesmo para medir distintos graus
de democracia (DAHL, 1997 [1971]). Se por outro lado, hipoteticamente, algum se propuser a medir democracia apenas por um
indicador de liberdade econmica, este no ser um instrumento vlido, pois no mede inteiramente aquilo que se prope. Para
uma profunda discusso sobre o conceito de validade aplicado anlise de contedo, em relao s mltiplas leituras possveis que
um dado analista pode fazer de determinado texto (e como resolver isso), recomendamos fortemente a leitura de Janis (1982 [1949]).
Para uma sintese recente sobre esta questo, veja Adcock & Collier (2001).
30
183
se esta replicao no possvel por ser subjetiva, ela simplesmente no se enquadra no conceito de cincia.33
Ento, fica como lio de vida para quem se proponha a fazer cincia (seja poltica, seja da comunicao, seja social): banir a palavra subjetivo de vossas vidas. Como nos ensina Kaplan e Goldsen (1982 [1949]),
se algo subjetivo, ento no cientfico. Ponto, pargrafo.
Uma questo: o equilbrio entre comparabilidade e adaptabilidade
Esta no uma regra, mas um ponto de tenso, sempre a ser resolvido: qual o ponto de equilbrio
entre adaptabilidade e comparabilidade? Isto , seguir um modelo de categorias j utilizado pela literatura (garantindo a comparabilidade) ou adaptar/criar categorias especficas, para o estudo que est sendo conduzido?
Outros vieram antes de voc e provavelmente j conduziram pesquisas em sua rea, de modo que
j existem classificaes prximas ao seu objeto de estudo. Comparabilidade entre distintas pesquisas um
elemento central no processo cientfico. Para isso, necessria a manuteno de um corao mais ou menos
similar de categorias. Lembre-se que seu estudo ter mais visibilidade se seus resultados puderem ser comparados com demais estudos (KING, 1985, 2015). A incomunicabilidade de pesquisas que, tendo o mesmo
objeto, utilizam tipologias distintas um problema recorrente em diversas reas e linhas de pesquisa da cincia
poltica.
No entanto, a necessidade de comparabilidade no deve limitar seu escopo de pesquisa. Cada pesquisa tem seus objetivos e o conjunto de categorias criado deve responder questo de pesquisa de seu autor.
Simplesmente seguir um modelo pronto mesmo quando ele no se adequa ou no atende s necessidades da
pesquisa sendo proposta atitude pouco imaginativa ou propositiva.
Se a categorizao deve, de fato, atender aos interesses da questo de pesquisa do investigador, um
acordo mnimo com a literatura imprescindvel para que as pesquisas possam ser comparveis. Se, por exemplo, na antropologia isto no seria um problema (j que cada objeto nico e as concluses s so vlidas para
aquele caso), um dos objetivos da cincia poltica a extrapolao de suas concluses, isto , a formulao
de explicaes gerais para grandes fenmenos. Para que isto ocorra, fundamental que os estudos possam
dialogar. Se fsicos no teriam este tipo de problema dificilmente cada um deles categorizaria um tomo de
formas diferentes os cientistas sociais precisam passar por esta etapa de acordncia metodolgica entre os
pares. Como diz Howard Becker:
A cincia s pode fazer progresso quando os cientistas concordam quanto ao aspecto de um problema e de sua soluo isto , quando empregam categorias de uso consagrado. Se cada um tiver uma
idia diferente sobre os tipos de entidades que o mundo composto, sobre os tipos de perguntas e
respostas que fazem sentido, cada um estar realizando uma coisa diferente, e isso no constituir
coisa alguma. (BECKER, 2007, p. 117)
preciso, portanto, um equilbrio delicado entre a manuteno de categorias (a fim da comparabilidade com estudos da rea) e adaptao de categorias para pesquisas especficas, quando necessrias. Mas
preciso, como ocorre na boa cincia, construir a partir do j existente.
Esta uma perspectiva muito estrita de cincia, adotada aqui. Outras perspectivas so possveis, mas tal discusso epistemolgica
no o foco deste estudo. Tais concepes relativsticas de cincia so, a partir da perspectiva adotada (e amplamente referendada
pela corrente majoritria da comunidade cientfica), equivocadas.
33
CARLOMAGNO, Mrcio C. & ROCHA, Leonardo C. Como criar e classificar categorias para fazer anlise de contedo: uma questo metodolgica
184
6. CONSIDERAES FINAIS
Neste artigo metodolgico sintetizamos os aspectos bsicos do que anlise de contedo e como proceder para criar categorias funcionais para aplicao neste tipo de abordagem. Nos baseamos nos criadores da
metodologia, Harold Lasswell e seus colegas norte-americanos, bem como em metodlogos contemporneos,
ressaltando sua contribuio central para o campo.
Acreditamos que este artigo se apresenta como uma ferramenta didtica til, especialmente para pesquisadores em fase inicial que possuam o interesse pela aplicao da anlise de contedo em suas pesquisas.
Resumimos em cinco aspectos principais os elementos fundamentais para a criao e classificao de categorias.
Em termos simples: a) preciso existir regras claras sobre os limites e definio de cada categoria;
b) as categorias devem ser mutuamente exclusivas (o que est em uma categoria, no pode estar em outra); c)
as categorias devem ser homogneas (no ter coisas muito diferentes entre si, no mesmo grupo); d) preciso
que as categorias esgotem o contedo possvel (no sobrem contedos no contedos que no se encaixem em
alguma categoria); e) preciso que a classificao seja objetiva, possibilitando a replicao do estudo.
Estas mesmas regras lgicas valem, tambm, para a criao de categorias e a classificao de atributos de quaisquer objetos de pesquisa (no apenas mensagens), em termos mais gerais, para outros estudos,
ainda que no aplicados anlise de contedo. Ou seja, ainda que o leitor discorde da perspectiva terico-metodolgica adotada na primeira parte do artigo, poder fazer uso das regras sintetizadas na segunda parte para
adequadamente conduzir suas pesquisas.
Estes so os aspectos fundamentais da classificao e categorizao em anlise de contedo clssica,
construda manualmente. H muitos outros tpicos e problemticas em aberto nesta seara, sobre os quais no
tocamos. Nos ltimos anos, tem ocorrido verdadeira revoluo na rea. Com o desenvolvimento do big data
e tcnicas de data mining novas aboragens tm surgido para anlise de contedo automatizada. Por exemplo,
Gary King, de Harvard, em dois estudos (HOPKINS & KING, 2010; KING, PAN & ROBERTS, 2013), criou
um mtodo para coleta e classificao automatizada dos textos. H uma longa lista de estudos que propem
novas abordagens a partir de mtodos computacionais para anlise de textos, ou mesmo abordagens hibridas
(LEWIS, ZAMITH, HERMIDA, 2013).
A anlise de contedo uma tcnica vastamente utilizada nas cincias sociais que, quando feita
corretamente, tem o potencial de revelar muitos aspectos sobre os objetos analisados. Apesar de ter sido desenvolvida para estudos de comunicao social e historicamente utilizada nestes a metodologia tambm
pode ser aplicada em uma longa srie de distintos estudos. Mas, para isto, o pesquisador deve estar imbudo de
rigor metodolgico e, nas palavras de Harold Lasswell, essencial que a anlise seja conduzida com esprito
cientfico e mediante o emprego de procedimentos objetivos (LASWEELL, 1982b [1949], p. 165).
Referncias bibliogrficas
ADCOCK, R.; COLLIER, D. 2001. Measurement Validity: A Shared Standard for Qualitative and Quantitative Research.The American Political Science Review,95(3), 529-546.
AGGIO, C. 2015. Os candidatos ainda evitam a interao? Twitter, Comunicao Horizontal e Eleies
Brasileiras. EComps (Braslia), v. 18, p. 122.
ALD, A.; MENDES, G. G. ; FIGUEIREDO, M. 2007. Tomando Partido: Imprensa e poltica nas eleies
185
186
CARLOMAGNO, Mrcio C. & ROCHA, Leonardo C. Como criar e classificar categorias para fazer anlise de contedo: uma questo metodolgica
187
LOMBARD, M.; SNYDER-DUCH, J.; BRACKEN, C.C. 2002. Content Analysis in Mass Communication Assessment and Reporting of Intercoder Reliability.Human Communication Research, Vol. 28 No.
4, 587604.
MADEIRA, A.B.; LOPES, M.; GIAMPAOLI, V.; SILVEIRA, J. 2011. Anlise proposicional quantitativa
aplicada pesquisa em administrao. RAE. So Paulo, v.51 n.4, 396-410.
MESQUITA, L; SILOTTO, G; LUZ, J; HUBERT, P. 2014. Emendas individuais e concentrao de votos:
uma anlise exploratria. Teoria & Pesquisa, v.23, n.2.
MIGUEL, L.F. 2015. Quanto vale uma valncia? Revista Brasileira de Cincia Poltica, n17, pp. 165-178.
______________. 2016. Uma resposta. Revista Brasileira de Cincia Poltica, n19. Braslia, janeiro - abril
de 2016, pp. 299-301.
MINTZ, A. 1982 [1949]. A factibilidade do emprego de amostras na anlise de contedo. In: LASSWELL,
H; KAPLAN, A. (org.) A linguagem da poltica. Braslia: Editora da Universidade de Braslia.
MORAES, R. 1999. Anlise de contedo. Revista Educao, Porto Alegre, v. 22, n. 37, p. 732.
MOZZATO, A. R.; GRZYBOVSKI, D. 2011. Anlise de contedo como tcnica de anlise de dados qualitativos no campo da administrao: potencial e desafios. RAC, Curitiba, v. 15, n. 4, pp. 731-747.
NEIVA, Pedro. 2015. Revisitando o calcanhar de aquiles metodolgico das cincias sociais no brasil. Sociologia, problemas e prticas, n. 79, pp. 65-83.
NEUENDORF, K. 2002. The content analysis guidebook. Thousand Oaks, California: Sage Publications,
Inc.
NICOLAS, M.A.; BRAGATTO, R.C.; SAMPAIO, R.C. 2013. Internet and Politics studies in Brazil: mapping the characteristics and disparities of the research field. Brazilian Political Science Review, v. 7, p. 114140.
OLIVEIRA, D. C. 2008. Anlise de contedo temtico-categorial: uma proposta de sistematizao. Rev.
enferm. UERJ, Rio de Janeiro, 2008 out/dez; 16(4):569-76.
PCHEUX, M. 2009. Semntica e discurso: uma crtica afirmao do bvio. Campinas: Editora Unicamp.
PIMENTEL, A. 2001. O mtodo da anlise documental: seu uso numa pesquisa historiogrfica.Cadernos
de Pesquisa, n. 114, novembro.
RECUERO, R.; ZAGO, G.; BASTOS, M.T. 2014.O discurso dos #ProtestosBR:anlise de contedo do
Twitter.Galxia (So Paulo), Dez 2014, vol.14, no.28, p.199-216.
RIFFE, D.; LACY, S.; FICO, F:G. 2005.Analyzing media messages: using quantitative content analysis in
research.Mahwah, New Jersey: Lawrence Erlbaum Associates, Inc. / Taylor & Francis e-Library.
SAMPAIO, R. C.. 2012. Quo deliberativas so discusses na rede? Um modelo de apreenso da deliberao online. Revista de Sociologia e Poltica, v. 20, p. 121-139.
SAMPAIO, R.C.; BARROS, S.A.R.; MORAIS, R. 2012. Como avaliar a deliberao online? Um mapeamento de critrios relevantes. Opinio Pblica, v. 18, p. 470-489.
SILVA, C. A comunicao partidria online: Os websites num contexto no eleitoral. 2012. Dissertao
(Mestrado em Cincia Poltica) Universidade de Aveiro.
SILVA, C. R.; GOBBI, B. C., SIMO, A. A. 2005. O uso da anlise de contedo como uma ferramenta
para a pesquisa qualitativa: descrio e aplicao do mtodo. Organ. rurais agroind., Lavras, v. 7, n. 1, p.
70-81.
188
CARLOMAGNO, Mrcio C. & ROCHA, Leonardo C. Como criar e classificar categorias para fazer anlise de contedo: uma questo metodolgica
SILVA, A. H.; FOSS, M. I. T. 2013. Anlise de contedo: exemplo de aplicao da tcnica para anlise de
dados qualitativos. 2013. In: IV Encontro de Ensino e Pesquisa em Administrao e Contabilidade. Braslia,
DF.
SILVA, D. C.; RIBEIRO, R. A.; CARVALHO, T. C. O. 2015. A anlise de contedo de pronunciamentos
oficiais como metodologia interpretativa da poltica externa brasileira. Revista Eletrnica de Cincia Poltica, vol. 6, n. 2, 2015.
SOARES, G.A.D. 2005. O calcanhar metodolgico da cincia poltica no brasil. Sociologia, problemas e
prticas, n. 48, 2005, pp. 27-52.
VACCARI, C. 2008. Italian parties websites in the 2006 elections. European Journal of Communication, v.
23, n. 1, p. 9-77
VILELA, E.; NEIVA, P. 2011. Temas e regies nas polticas externas de Lula e Fernando Henrique: comparao do discurso dos dois presidentes.Rev. Bras.Polt. Int.54 (2): 70-96.