Sunteți pe pagina 1din 72

sid.inpe.br/mtc-m19/2010/10.27.12.

54-RPQ

ANALISE DE PADROES EM CHAMADAS TELEFONICAS

Giscard Fernandes Faria

Relatrio nal da disciplina Princ o pios a Aplicaes de Minerao de Dados co ca (CAP-359) do Programa de Ps-Graduao em Computao Aplicada, ministrada o ca ca pelo professor Rafael Santos.

URL do documento original: <http://urlib.net/8JMKD3MGP7W/38FUMP2 >

INPE So Jos dos Campos a e 2010

PUBLICADO POR: Instituto Nacional de Pesquisas Espaciais - INPE Gabinete do Diretor (GB) Servio de Informao e Documentao (SID) c ca ca Caixa Postal 515 - CEP 12.245-970 So Jos dos Campos - SP - Brasil a e Tel.:(012) 3208-6923/6921 Fax: (012) 3208-6919 E-mail: pubtc@sid.inpe.br CONSELHO DE EDITORACAO E PRESERVACAO DA PRODUCAO INTELECTUAL DO INPE (RE/DIR-204): Presidente: Dr. Gerald Jean Francis Banon - Coordenao Observao da Terra (OBT) ca ca Membros: Dra Inez Staciarini Batista - Coordenao Cincias Espaciais e Atmosfricas (CEA) ca e e Dra Maria do Carmo de Andrade Nono - Conselho de Ps-Graduao o ca a Dr Regina Clia dos Santos Alval - Centro de Cincia do Sistema Terrestre (CST) e a e Marciana Leite Ribeiro - Servio de Informao e Documentao (SID) c ca ca Dr. Ralf Gielow - Centro de Previso de Tempo e Estudos Climticos (CPT) a a Dr. Wilson Yamaguti - Coordenao Engenharia e Tecnologia Espacial (ETE) ca Dr. Horcio Hideki Yanasse - Centro de Tecnologias Especiais (CTE) a BIBLIOTECA DIGITAL: Dr. Gerald Jean Francis Banon - Coordenao de Observao da Terra (OBT) ca ca Marciana Leite Ribeiro - Servio de Informao e Documentao (SID) c ca ca Deicy Farabello - Centro de Previso de Tempo e Estudos Climticos (CPT) a a REVISAO E NORMALIZACAO DOCUMENTARIA: Marciana Leite Ribeiro - Servio de Informao e Documentao (SID) c ca ca Yolanda Ribeiro da Silva Souza - Servio de Informao e Documentao (SID) c ca ca EDITORACAO ELETRONICA: Vivca SantAna Lemos - Servio de Informao e Documentao (SID) e c ca ca

sid.inpe.br/mtc-m19/2010/10.27.12.54-RPQ

ANALISE DE PADROES EM CHAMADAS TELEFONICAS

Giscard Fernandes Faria

Relatrio nal da disciplina Princ o pios a Aplicaes de Minerao de Dados co ca (CAP-359) do Programa de Ps-Graduao em Computao Aplicada, ministrada o ca ca pelo professor Rafael Santos.

URL do documento original: <http://urlib.net/8JMKD3MGP7W/38FUMP2 >

INPE So Jos dos Campos a e 2010

ii

Quando ests certo, ningum se lembra; quando ests errado, ningum esquece.
Provrbio irlands

iii

iv

RESUMO Atualmente so realizadas no mundo mais que um bilho de chamadas telefnicas todos os dias. Assim o registro destas chamadas so armazenados em equipamentos da rede de telefonia e no final so utilizados principalmente para cobrana. Contudo quando tendo todos esses registros agrupados possvel realizar um estudo aprofundado do comportamento de cada assinante; bem como encontrar relaes entre os diversos assinantes e fluxo de trfego na rede de telefonia.

vi

ANALISING PATTERNS IN TELEPHONE CALLS

ABSTRACT The World wide population generate nowadays more than one billion of phone calls every day. All those call records are stored in network equipments and after all are used mostly for billing purpose only. However, putting all those calls together allows to perform a deep study of the behavior of each telephone subscriber, find out relationship between subscrber and the network traffic flow as well.

vii

viii

LISTA DE FIGURAS Pg. Figura 1 - Tipo de Cobrana x Categoria do Assinante .............................. 16 Figura 2 - Tipo de Cobrana x Horrio da Chamada ................................... 17 Figura 3 - Tipo de Cobrana x Durao da Chamada ................................. 18 Figura 4 - Tipo de Cobrana x Tipo da Chamada ........................................ 19 Figura 5 - Tipo de Cobrana X Classe da Chamada .................................... 20 Figura 6 - Categoria do Assinante A x Horrio da Chamada ...................... 21 Figura 7 - Categoria do Assinante x Durao da Chamada ........................ 22 Figura 8 - Categoria do Assinante x Tipo da Chamada .............................. 23 Figura 9 - Categoria do Assinante x Tipo da Chamada .............................. 24 Figura 10 - Categoria do Assinante x Tipo de Acesso ................................ 25 Figura 10 Horrio da Chamada x Tipo da Chamada ................................. 26 Figura 11 Horrio da Chamada x Tronco de Entrada ............................... 27 Figura 12 Horrio da Chamada x Tronco de Sada ................................... 28 Figura 13 Tipo da Chamada x Tipo de Servio ......................................... 29 Figura 14 Tipo da Chamada x Tipo de Acesso ......................................... 30 Figura 15 Classe da Chamada x Tronco de Entrada ................................ 31 Figura 16 Classe da Chamada x Tronco de Sada .................................... 32 Figura 17 Classe da Chamada x Cdigo de Falha .................................... 33 Figura 18 Classe da Chamada x Tipo de Servio ..................................... 34 Figura 19 Classe da Chamada x Tipo de Acesso ..................................... 35 Figura 8 - Grafo de Relao dos Assinantes ............................................... 42

ix

LISTA DE TABELAS Pg.

Tabela 1 - Tipos de CDRs ..................................... Erro! Indicador no definido. Tabela 2 - Campos dos CDRs............................... Erro! Indicador no definido. Tabela 3 - Campos do CDR final ..................................................................... 6 Tabela 4 - Campos do CDR aps Seleo ........... Erro! Indicador no definido. Tabela 5 - Tipos de Dados por Campos .............. Erro! Indicador no definido. Tabela 6 - Tarifas Telefnicas .............................. Erro! Indicador no definido. Tabela 7 - Atributos do Cluster I .......................... Erro! Indicador no definido. Tabela 8 - Atributos Classificadores ................... Erro! Indicador no definido.

xi

xii

LISTA DE SIGLAS E ABREVIATURAS

INPE Instituto Nacional de Pesquisas Espaciais SID TDI SPG Servio de Informao e Documentao Teses e Dissertaes Internas Servio de Ps-Graduao

VoIP Voice Over IP ITU International Telecomunications Union

CDR Call Detail Record CRM Customer Relationship Management Q&A PBX Quality Assurance Private Branch Exchange

xiii

xiv

SUMRIO Pg.

1 2 3 4 5 6 7 8 9 10 11

INTRODUO ................................................................................ 1 TELEFONIA .................................................................................... 2 INFORMAES CONTIDAS NOS CDRs ...................................... 4 SELEO DE DADOS ................................................................... 9 PR-PROCESSAMENTO DOS DADOS ...................................... 12 MINERAO AD HOC DOS DADOS .......................................... 16 CLUSTERIZAO ........................................................................ 37 MINERAO VIA CLASSIFICAO ........................................... 39 RELAO ENTRE ASSINANTES ............................................... 41 CONCLUSO ............................................................................... 45 PRXIMOS PASSOS ................................................................... 49

xv

xvi

1 INTRODUO

Comunicao trata-se de de uma das caractersticas mais antigas do mundo animal (isso real, estudos j mostram que mesmo macacos e outros animais possuem um meio efetivo de comunicao apesar de no to complexo ou avanado quanto dos seres humanos); o modelo de comunicao do Homem evoluiu em muito no decorrer de sua histria, passando por rudos, expresso corporal, desenhos e por fim a criao do alfabeto. Em paralelo foram criadas tambm redes de comunicao, que consiste em criar uma infraestrutura ou modelos que permitia a transmisso de informaes de modo eficiente, ntegro e seguro, estas redes tambm evoluram no decorrer de nossa histria; inicialmente os meios eram restritos a grupos que estavam prximos, depois foram criadas estruturas para o envio e recebimento de mensagens (fossem elas escritas em pedra, madeira ou papel), e por fim o modelo de comunicao atual que consiste em conectarem-se pessoas praticamente em tempo real para que sejam transmitidas as informaes. Este artigo possui como principal objetivo apontar (mesmo que de forma simplificada) algumas estratgias bsicas para que se possam obter informaes estratgicas analisando os dados gerados durante a comunicao entre duas ou mais pessoas. Devido restrio de acesso aos dados de chamadas telefnicas (j que o sigilo telefnico garantido por lei), foram utilizados nesta pesquisa os dados coletados durante um dia para uma nica central de telefone (equipamento responsvel por controlar a chamada telefnica); tambm todos os nmeros de telefone aqui utilizados so ficttcios e foram alterados para que oculta-se a verdadeira identidade dos assinantes.

2 TELEFONIA

O conceito de Telefonia, nada mais que uma rede de comunicao que fornece infra-estrutura para que as pessoas possam se comunicar de maneira efetiva e praticamente instntanea independente de localidade e distncia entre os interessados. Atualmente, com o surgimento da Internet e as tecnologias VOIP (Voice over IP), o conceito de telefonia ainda mais abrangente, pois envolve no somente o ato de se comunicar atravs de um telefone, mas tambm a troca de dados dos mais diversos (incluindo voz, video, mensagens de texto, arquivos, etc). No existe dvida alguma hoje, que as operadoras de Telefonia (empresas que provm a infra-estrutura para o uso de telefone) sero tambm as provedoras da infra-estrutura para que sejam transmitidos tambm quaisquer outros tipos de dados futuramente. Estudos do ITU (International Telecommunications Union) datados de 2008 mostram que 60% da populao mundial utilizam a Internet como meio de comunicao, e o que chama mais ateno que 97% da populao mundial fazem uso da Rede de Telefonia mvel (comunicao atravs de celulares). fcil, portanto, perceber que os dados gerados a partir destas redes so no somente extremamente volumoso, como tambm de extrema importncia e riqueza j que os mesmos apontam o comportamento de grande parte da populao, ao menos no que diz respeito em modo de se comunicar. Os dados das chamadas, e que so gerados durante a comunicao seja por celulares, computadores ou telefones convencionais so denominados CDR (Call Detail Record). Os CDRs so coletados, e utilizados principalmente pelas operadoras para que seja possvel efetuar uma cobrana pelo servio prestado ao assinante (pessoa que utiliza a rede para se comunicar); no entanto os mesmos no esto restritos a emisso de faturas, os mesmos contm informaes da Rede (como por exemplo, motivo de falha para uma chamada no completada, rotas de comunicao utilizadas, etc). 2

3 INFORMAES CONTIDAS NOS CDRs

Como comentado anteriormente, os CDRs so utilizados para armazenar o registro de uma sesso (ou chamada) de comunicao entre assinantes. Contudo, por existirem diversos meios de comunicao (e.g.: telefones fixos, celulares, computadores, etc), as informaes contidas nos CDRs podem variar (e de fato variam) de acordo com a necessidade de cada meio de utilizado. Alm disso, mesmo quando se trata de meios de comunicao idnticosm os dados contidos nos CDRs tambm podem variar (seja por deciso e estratgia da operadora ou do fornecedor do equipamento onde as chamadas so controladas). Neste artigo, sero retratadas as informaes adquiridas de CDRs do equipamento de um fornecedor em especfico, para uma operadora em especfico e tambm para uma tecnologia em especfico (telefonia fixa). Para o caso anlisado neste artigo, foi possvel perceber trs variantes de CDRs (ou seja, os CDRs tambm podem ser distintos dentro de uma mesma operadora, para um mesmo meio de comunicao onde todas as chamadas passam por um mesmo equipamento), so elas:

Tabela 1 - Tipos de CDRs Tipo de CDR 80 bytes Descrio Contm uma quantidade restrita de dados, com o objetivo de diminuir espao de armazenagem em disco (utilizados para chamadas comuns entre assinantes). Contm todos os dados (utilizados para chamadas comuns entre assinantes). Contm todos os dados (utilizados para chamadas via rede inteligente, por exemplo: 0500, 0800, etc).

128 bytes 192 bytes

Cada um dos CDRs mencionados na tabela acima, possuem diversos campos (que nada mais so que os dados das chamadas). Est fora do escopo 4

deste artigo entrar em detalhe e explicar o significado de cada campo, contudo para que se tenha uma idia geral podes citar alguns exemplos:

Tabela 2 - Campos dos CDRs Tipo de CDR 80 bytes 128 bytes Qtd. Campos 18 31 Exemplos Assinante Originante Hora da Chamada Assinante Originante Hora da Chamada Tipo do Acesso Assinante Originante Hora da Chamada Tipo do Acesso Identificador do Digito de Extenso

192 bytes

45

A tabela acima no possui como objetivo esclarecer o significados dos campos dos CDRs, o importante de se notar na mesma que existem campos que so exclusivos de alguns CDRs, e que tambm existem campos que so comum a todos eles. A importncia desta propriedade, consiste no modelo aplicado para uma primeira filtragem dos dados a serem observados em uma anlise, em suma foram inicialmente utilizados apenas os dados que so comum a todos os tipos de CDRs.

Com base no critrio de interseco anteriormente apresentados, teramos no final o conjunto eles: , composto por 18 (dezeoito) campos, so

Tabela 1 - Campos do CDR Campo Nmero de A Nmero de B Tipo de Cobrana Categoria do Assinante A Descrio Assinante que iniciou a chamada telefnica Assinante que recebeu a chamada telefnica Chamada normal ou cobrar. Nenhuma Assinante Comum Assinante com Tarifao Especial Equipamento de Manuteno Telefone Pblico Local Telefonista Equipamento de Comunicao de Dados Telefone Pblico Interurbano Chamada Transferida Dia em que a chamada foi realizada Horrio em que a chamada foi realizada (pode ser nenhum se a chamada no foi completada) Tempo que a chamada durou (pode ser nenhum se a chamada no foi completada) Chamada no Completada Chamada Comum Chamada Estendida Chamada Estendida (fim) Contador de CDRs que a chamada foi bilhetada Nmero do tronco por onde a chamada chegou central Nmero do circuito (do tronco) por onde a chamada chegou central Nmero do tronco por onde a chamada saiu da central Nmero do circuito (do tronco) por onde a chamada saiu da central Chamada completada sem erro Chamada completada com erro No completada B no atende B ocupado Timeout no tronco de entrada Congestionamento no destino Congestionamento na origem Timeout no junto de sada Erro no tronco de sada A desligou Nmero mudou Falha em B (tipo 10 ou 15) 6 Continua

Data da Chamada Hora da Chamada Durao da Chamada Tipo da Chamada

Contador de Chamada Estendida Tronco de Entrada Circuito de Entrada Tronco de Sada Circuito de Sada Classe da Chamada

Tabela 3 - Concluso Cdigo de Falha da Chamada Nenhum cdigo (chamada correta) FDS=6 Nmero de A menor que mnimo Nmero de A maior que mximo Durao maior que mximo Assinante de Tarifao especial Equipamento em manuteno Telefone pblico Telefonista Equipamento de Comunicao de Dados Outras categorias de assinante Sem informao Voz 64 Kbps (dados) 3,1Khz Sem informao Analgico Digital Identificador nico do CDR

Tipo de Servio

Tipo do Acesso

Nmero Sequncial

perceptvel que entender detalhadamente do que se trata cada campo, um trabalho especializado e de responsabilidade do engenheiro de telecomunicaes (por exemplo, o Nmero de A possui um limite mximo de tamanho, o mesmo valido para o nmero de B). No entanto, grandes partes dos valores so de conhecimento geral a todos os assinantes que utilizam uma rede de telefonia o que vai facilitar o entendimento deste artigo.

4 SELEO DE DADOS

Os dados de chamadas telefnicas conseguidos para esse experimento consistem; como comentado anteriormente, de chamadas telefnicas

realizadas por uma nica operadora em uma nica central de uma fornecedora em especfico durante o perodo de um nico dia. Apesar de extremamente limitado e focado, o volume do dia chegou a 216.223 chamadas. O Alto volume de dados, somados a extensa quantidade de atributos exigiria uma grande capacidade de processamento para efetuar anlise e similaridades de dados atravs das mais diversas tcnicas de Data Mining. Portanto, mesmo que tenhamos efetuado uma reduo de atributos (ao criar um conjunto final apenas considerando a interseco de todos os tipos de CDR) ainda se faz necessrio realizar uma pr-analise para maior reduo de dados com nenhum ou pouco valor. Primeiramente foi eliminado o campo que contm a Data da Chamada em que a chamada foi efetuada (apesar de se tratar de um atributo importante para qualquer anlise de CDR), para o conjunto de dados em questo o mesmo no possui valor j que todas as chamadas foram efetuadas no mesmo dia. Em seguida foi eliminado o campo que contm o Nmero Sequncial dos CDRs, j que este atributo distinto para todo e qualquer chamada o mesmo no permitir criar correlaes com outros dados. A mesma lgica aplica-se aos Circuitos de Entrada e Sada, analisando os mesmos possvel verificar que o mesmo no se repete e, portanto, impedem que seja criada uma correlao (esse atributo em especfico poderia ser descartado mesmo que algumas poucas repeties ocorressem, j que os circuitos so utilizados ou de forma aleatria ou sequncial em uma central telefnica). Os campos nmero de A e nmero de B possuem um comportamento similar (ou seja, em sua maioria no se repetem) e, portanto dificilmente sero correlacionados com os outros campos; no entanto, esses atributos no sero 9

removidos totalmente. Resumindo, eles sero removidos durante uma anlise de data mining, no entanto sero utilizados para outra anlise de padres que consiste em encontrar ciclos de chamadas entre assinantes (ou seja, assinantes que possuem uma rede de relacionamento em comum). Finalmente, pode-se excluir o campo que possui o Contador de Chamadas Estendidas, para isso basta acumular a durao das chamadas no campo Durao da Chamada e descartar o mesmo. Aps todas as excluses, fica-se disponvel nos CDRs os seguintes atributos (o que totaliza 13 campos): Tabela 2 - Campos do CDR aps Seleo Campo Nmero de A Nmero de B Tipo de Cobrana Categoria do Assinante A Descrio Assinante que iniciou a chamada telefnica Assinante que recebeu a chamada telefnica Chamada normal - 0 Chamada a cobrar - 1 Nenhuma ? Assinante Comum 01 Assinante com Tarifao Especial 02 Equipamento de Manuteno 03 Telefone Pblico Local 04 Telefonista 05 Equipamento de Comunicao de Dados - 06 Telefone Pblico Interurbano - 07 Chamada Transferida 11 Horrio em que a chamada foi realizada (pode ser nenhum se a chamada no foi completada). Sem informao ? Super reduzida S Reduzida R Normal N Diferenciada D Tempo que a chamada durou (pode ser nenhum se a chamada no foi completada) Chamada no Completada ? Chamada Comum 0 Chamada Estendida 1 Chamada Estendida (fim) 2 Nmero do tronco por onde a chamada chegou central Nmero do tronco por onde a chamada saiu da central Continua

Horrio da Chamada

Durao da Chamada Tipo da Chamada

Tronco de Entrada Tronco de Sada

10

Tabela 4 Concluso Classe da Chamada Chamada completada sem erro 10 Chamada completada com erro 20 No completada 44 B no atende 31 B ocupado 32 Timeout no tronco de entrada 40 Congestionamento no destino 43 Congestionamento na origem 46 Timeout no junto de sada 48 Erro no tronco de sada 49 A desligou 50 Nmero mudou - 51 Falha em B (tipo 10 ou 15) 52 Nenhum cdigo (chamada correta) ? FDS=6 03 Nmero de A menor que mnimo 04 Nmero de A maior que mximo 05 Durao maior que mximo 06 Assinante de Tarifao especial 08 Equipamento em manuteno 09 Telefone pblico 10 Telefonista 11 Equipamento de Comunicao de Dados 12 Outras categorias de assinante 13 Sem informao 000 Voz 001 64 Kbps (dados) - 002 3,1Khz 003 Sem informao 00 Analgico 01 Digital - 02

Cdigo de Falha da Chamada

Tipo de Servio

Tipo do Acesso

11

5 PR-PROCESSAMENTO DOS DADOS

Antes que seja iniciada a anlise dos dados, ainda se faz necessrio a definio de alguns outros itens, o principal deles consiste em como ser definido o tipo de cada dado. Basicamente pode-se optar por dois tipos distintos cada um com sua vantagem e desvantagem. O primeiro tipo seriam os dados numricos, onde cada atributo pode ser um valor inteiro (ou real para outros casos) e que varia continuamente ou discretamente em um intervalo pr-definido. Enquanto o segundo trata-se dos dados literais, onde cada atributo possui um conjunto de valores onde apenas um ser atribudo (e.g., Sexo: Masculino ou Feminino). Para os atributos ps-seleo poderamos optar pelo seguintes tipos de dados: Tabela 5 - Tipos de Dados por campos Campo Nmero de A Nmero de B Tipo de Cobrana Categoria do Assinante A Horrio da Chamada Durao da Chamada Tipo da Chamada Tronco de Entrada Tronco de Sada Classe da Chamada Cdigo de Falha da Chamada Tipo de Servio Tipo do Acesso Tipo de Dado Literal Literal Literal Literal Literal ou Numrico Literal ou Numrico Literal Literal Literal Literal Literal Literal Literal

Percebe-se que a maioria dos campos (ou atributos) s podem assumir valores literais (por pertencerem a uma classe pr-definida em especfico). No 12

entanto, dois campos chamam a ateno por parecerem a primeira vista numrico e, no entanto foram descritos na tabelas anterior como podendo ser tanto numrico quando literal. Atributos relacionados ao tempo (como hora) geralmente so numricos e contnuos, contudo no contexto de telefonia o mesmo pode ser facilmenten transformado para literal, a vantagem desta transformao consiste na simplificao e reduo do domnio de valores do campo. Quando utilizado em chamads telefnicas, existem basicamente quatro tarifas de cobranas que so relacionadas com horrios, so elas: Tabela 6 - Tarifas Telefnicas Horrio 00:00 s 06:00 00:06 s 07:00 21:00 s 24:00 07:00 s 09:00 12:00 s 14:00 18:00 s 21:00 09:00 s 12:00 14:00 s 18:00 Tarifa Super Reduzida Reduzida Normal

Diferenciada

Independente do horrio que se realizou a chamada, no final o impacto no comportamento do assinante ser dado pela tarifa a ser cobrada - claro que esta simplificao reduz o escopo da anlise, por exemplo, no se pode analisar comportamento de ligaes com base em perodos do dia no entanto a reduo simplifica em muito a utilizao do campo em si e permite fazer uma anlise quanto a cobrana de forma direta e a baixo custo computacional. Outro atributo a ser modificado, consiste no atributo de Durao da Chamada, as cobranas feitas pelas empresas prestadoras de servio de telefonia ocorrem por minuto, o que permite descartar a quantidade de segundos despendida por chamada, esta simplificao permite, por exemplo, um maior agrupamento na durao das chamadas e do mesmo modo que no atributo anterior, reduz algumas outras possibilidades de anlise o que 13

simplifica a utilizao do campo e permite uma anlise com menor custo computacional. Por fim, existe outro grupo de dados que devem ser pr-processados antes que possa ser utilizado, so eles o Nmero de A e Nmero de B. Em um CDR de uma chamada telefnica, se o mesmo assinante inicia uma chamada telefnica ou recebe uma chamada telefnica, os valores guardados no campo so distintos. Por exemplo, vamos supor que o assinante Emanuel cujo nmero de telefone 5555-3333 pertencente cidade de So Paulo realizada uma ligao; em seu CDR vai aparecer o campo Nmero de A com o seguinte valor 1155553333 (e.g., o cdigo de rea de SP 11 adicionado do nmero de telefone), j quando Emanuel atende uma chamada telefnica interurbano de sua namorada que est em So Jos dos Campos atravs da operadora Super Telecom, no CDR vai aparecer o campo Nmero de B com o seguinte valor 0371155553333 (e.g., 0 indicando iterurbano, 37 o cdigo da operadora Super Telecom, 11 a rea da regio, e por fim o nmero de Emanuel). Para cada tipo de chamada temos um Nmero de B dinmico, enquanto o Nmero de A permance esttico para qualquer chamada feita por Emanuel. Exemplos de outras chamadas so as locais, locais a cobrar, interurubano a cobrar. Apesar de mais complexa, existe uma regra bem simples que simplifica a relao entre o Nmero de A e o Nmero de B; o campo Nmero de A sempre vai conter o cdigo de area da regio mais o nmero final do assinante, e o Nmero de B sempre vai conter no final da String o cdigo de rea da regio mais o nmero final do assinante; e aqui onde se torna possvel verificar se um assinante que realizou uma chamada tambm o mesmo que recebeu outra. O processo de simplificao das relaes entre Nmero de A e Nmero de B vo bem alm (por exemplo temos as chamadas internacionais, alm de muitas outras), e a simplificao acima mencionada por um lado reduz em muito a complexidade na manipulao dos assinantes, contudo por outro lado no permite anlises mais profundas como por exemplo tipo de uso das

14

chamadas com base no cdigo da operadora (este tipo de anlise fica para um futuro trabalho).

15

6 MINERAO AD HOC DOS DADOS Nesta etapa foi realizada uma anlise customizada para cada atributo, examinando assim todos os outros pares, com o intuito de encontrar alguma relao entre a distribuo. Esta no de forma alguma a anlise ideal, pois a mesma deve ser feita artesanalmente pessoas, no entanto est anlise cuidadosa permitiu encontrar alguns padres importantes no uso da rede de telefonia.

Analisando Tipo de Cobrana (Eixo X)


Categoria do Assinante (Eixo Y)

Figura 1 - Tipo de Cobrana x Categoria do Assinante

Atravs do grfico plotado possvel verificar que:

No so realizadas chamads a cobrar local atravs de telefones pblicos; No entanto o volume de chamadas a cobrar interurbano pelos telefones pblicos bem alto;

Telefonistas e equipamentos de testes no fazem chamadas cobrar (o que j era esperado).

16

Os valores na legenda esto descritos na tabela Erro! Fonte de referncia no encontrada.

Horrio da Chamada (Eixo Y)

Figura 2 - Tipo de Cobrana x Horrio da Chamada

Atravs do grfico plotado possvel verificar que:

A maioria das chamadas a cobrar realizada nos horrios mais custosos, ou seja, no horrio super reduzido existem poucas chamadas a cobrar.

Os valores na legenda esto descritos na tabela Erro! Fonte de referncia no encontrada.

17

Durao da Chamada (Eixo Y)

Figura 3 - Tipo de Cobrana x Durao da Chamada

Atravs do grfico plotado possvel verificar que: S existem chamadas a cobrar com baixas duraes;

Chamadas comuns esto mais concentradas em baixas duraes.

Os valores na legenda esto descritos na tabela Erro! Fonte de referncia no encontrada.

18

Tipo de Chamada (Eixo Y)

Figura 4 - Tipo de Cobrana x Tipo da Chamada

Atravs do grfico plotado possvel verificar que:

No existem chamadas a cobrar estendidas (o que est de acordo com a anlise anterior).

Os valores na legenda esto descritos na tabela Erro! Fonte de referncia no encontrada.

19

Classe da Chamada (Eixo Y)

Figura 5 - Tipo de Cobrana X Classe da Chamada

Atravs do grfico plotado possvel verificar que: A maior parte das chamadas a cobrar completada; As que no so completadas se devem ao fato do nmero chamado no estar disponvel para atender; O que mostra ainda um grande aceito dos usurios da rede de telefonia em atender chamadas cobrar. Os valores na legenda esto descritos na tabela Erro! Fonte de referncia no encontrada.

20

Analisando Categoria do Assinante A (Eixo X)


Horrio da Chamada (Eixo Y)

Figura 6 - Categoria do Assinante A x Horrio da Chamada

Atravs do grfico plotado possvel verificar que: O uso de telefones pblicos para chamadas interurbanas so menores nos horrios mais reduzidos; Servios de transferncia de chamadas s so utilizados em horrios comerciais, o que indica que o servio no utilizado em contexto pessoal, mas trabalho apenas; Chamadas para telefonistas ocorrem apenas em horrios diferenciados; Equipamentos de manuteno s so utilizados em horrios comerciais (como j era esperado). Os valores na legenda esto descritos na tabela Erro! Fonte de referncia no encontrada.

21

Durao da Chamada (Eixo Y)

Figura 7 - Categoria do Assinante x Durao da Chamada

Atravs do grfico plotado possvel verificar que: Apenas assinantes comuns fazem chamadas com grande durao. Os valores na legenda esto descritos na tabela Erro! Fonte de referncia no encontrada.

22

Tipo de Chamadas (Eixo Y)

Figura 8 - Categoria do Assinante x Tipo da Chamada

Atravs do grfico plotado possvel verificar que: Apenas assinantes comuns fazem chamadas estendidas (o que est de acordo com a anlise anterior). Os valores na legenda esto descritos na tabela Erro! Fonte de referncia no encontrada.

23

Classe da Chamada (Eixo Y)

Figura 9 - Categoria do Assinante x Tipo da Chamada

Atravs do grfico plotado possvel verificar que: Chamadas locais de telefones pblicos no completados se devem ao fato do assinante B no estar disponvel ou ento por desistncia do assinante realizando a chamada; Equipamentos de manuteno e chamadas a telefonistas sempre so completadas. Os valores na legenda esto descritos na tabela Erro! Fonte de referncia no encontrada.

24

Tipo de Acesso (Eixo Y)

Figura 10 - Categoria do Assinante x Tipo de Acesso

Atravs do grfico plotado possvel verificar que: Todos os telefonistas e equipamentos de manuteno esto conectados aos acessos analgicos; Todo equipamento de comunicao de dados esto conectados aos acessos digitais. Os valores na legenda esto descritos na tabela Erro! Fonte de referncia no encontrada.

25

Analisando o Horrio da Chamada (Eixo X)


Tipo da Chamada (Eixo Y)

Figura 10 Horrio da Chamada x Tipo da Chamada

Atravs do grfico plotado possvel verificar que: Chamadas realizadas em horrio de tarifao diferenciado nunca so estendidas; Chamadas em horrio normais estendem mais que no horrio super reduzido. Os valores na legenda esto descritos na tabela Erro! Fonte de referncia no encontrada.

26

Tronco de Entrada (Eixo Y)

Figura 11 Horrio da Chamada x Tronco de Entrada

Atravs do grfico plotado possvel verificar que: Chamadas realizadas em horrios de tarifao Reduzidos ou Super Reduzido no permeiam todos os entroncamentos disponveis, ou seja, existe um determinado grupo de assinantes que nunca realizam chamadas nestes horrios. Os valores na legenda esto descritos na tabela Erro! Fonte de referncia no encontrada.

27

Tronco de Sada (Eixo Y)

Figura 12 Horrio da Chamada x Tronco de Sada

Atravs do grfico plotado possvel verificar que: Chamadas realizadas em horrios de tarifao Reduzido no permeiam todos os entroncamentos disponveis, ou seja, existe um determinado grupo de assinantes que nunca so chamados neste horrio ou existe alguma configurao que no permite. Os valores na legenda esto descritos na tabela Erro! Fonte de referncia no encontrada.

28

Analisando o Tipo da Chamada (Eixo X)


Tipo de Servio (Eixo Y)

Figura 13 Tipo da Chamada x Tipo de Servio

Atravs do grfico plotado possvel verificar que: Grande parte das chamadas estendidas utilizam o servio de 64Kbps, o que mostra que grande parte destas chamadas so utilizadas para se conectar na internet; Contudo, pode-se perceber que algumas chamadas estentidas ainda utilizam canais simples de voz, mostrando que algumas conexes de dados esto restritas a canis de 56Kbps. Os valores na legenda esto descritos na tabela Erro! Fonte de referncia no encontrada.

29

Tipo deAcesso (Eixo Y)

Figura 14 Tipo da Chamada x Tipo de Acesso

Atravs do grfico plotado possvel verificar que: Todas as chamadas estentidas so realizadas atravs de acessos analgicos. Os valores na legenda esto descritos na tabela Erro! Fonte de referncia no encontrada.

30

Analisando Classe da Chamada (Eixo X)


Tronco de Entrada (Eixo Y)

Figura 15 Classe da Chamada x Tronco de Entrada

Atravs do grfico plotado possvel verificar que: Chamadas no completadas por timeout no juntor de sada no permeiam todos os entroncamentos; Chamadas no completadas por erro B10/B15 acontecem em um conjunto restrito de entroncamentos; Os valores na legenda esto descritos na tabela Erro! Fonte de referncia no encontrada.

31

Tronco de Sada (Eixo Y)

Figura 16 Classe da Chamada x Tronco de Sada

Atravs do grfico plotado possvel verificar que: Chamadas no completadas por timeout no juntor de sada acontecem a um conjunto restrito de entroncamentos, os mesmos podem estar com algum defeito ou sobrecarga. Os valores na legenda esto descritos na tabela Erro! Fonte de referncia no encontrada.

32

Cdigo de Falha da Chamada (Eixo Y)

Figura 17 Classe da Chamada x Cdigo de Falha

Atravs do grfico plotado possvel verificar que: Existem assinantes que discam um nmero antigo (sete dgitos) ao invs de utilizar o novo de oito dgitos, o que acarreta em erro da chamada por nmero alterado; Boa parte das falhas por timeout no juntor de sada se deve ao fato de atrasos por parte do assinante ao digitar o nmero do telefone completo. Os valores na legenda esto descritos na tabela Erro! Fonte de referncia no encontrada.

33

Tipo de Servio (Eixo Y)

Figura 18 Classe da Chamada x Tipo de Servio

Atravs do grfico plotado possvel verificar que: Chamadas que utilizam canais 64Kbps so menos afetadas por erros de no completamento, o que permite uma melhor qualidade de atendimento do assinante. Os valores na legenda esto descritos na tabela Erro! Fonte de referncia no encontrada.

34

Tipo de Acesso (Eixo Y)

Figura 19 Classe da Chamada x Tipo de Acesso

Atravs do grfico plotado possvel verificar que: Chamadas realizadas por acesso digital no possuem falha de erro nos juntores de entrada nem sada, ou seja, possuem melhor qualidade de atendimento aos assinantes. Os valores na legenda esto descritos na tabela Erro! Fonte de referncia no encontrada.

35

36

7 CLUSTERIZAO

A formao de cluster atravs da correlao de dados uma tcnica bastante utilizada na minerao de dados; foram ento realizadas duas tentativas de formao de clusters distintas com os registros de CDRs descritos anteriormente.

Cluster I Na primeira tentativa de clusterizao foram utilizados todos os atributos, exlcuindo-se o Nmero de A e Nmero de B, pois de conhecimentos que ambos os atributos possuem uma alta covarincia j que estamos manipulando bilhetes de apenas um dia de chamada, e a quantidade de assinantes que chamadas repetidas tendem a no ser muito grande considerando um nico dia. O mesmo argumento vlido para a excluso dos Troncos de Entrada e Tronco de Sada. A tabela abaxio descreve os atributos utilizados na primeira tentativa de formao de clusters: Tabela 7 - Atributos do Cluster I Campo Tipo de Cobrana Categoria do Assinante A Horrio da Chamada Durao da Chamada Tipo da Chamada Classe da Chamada Cdigo de Falha da Chamada Tipo de Servio Tipo do Acesso Foi utilizado ento o algoritimo Simple EM (Expectation Maximization), contudo no final chega-se a um resultado de instncias.

37

38

8 MINERAO VIA CLASSIFICAO

Inicialmente os dados coletados atravs das chamadas CDRs no possuiam nenhuma classe, o que implica em um primeiro momento na impossiblidade de se utilizar qualquer algoritimo supervisionado de classificao. No entanto, podemos facilmente criar classes para as chamdas, basta que se selecione qualquer um dos atributos utilizando o mesmo como a classe final da instncia. bviamente nem todos os atributos podem ser utilizados como classes, a tabela abaixo possui o atributo bem como uma breve descrio se o mesmo pode ou no ser utilizado como classe da instncia: Tabela 8 - Atributos Classificadores Campo Nmero de A Descrio No ser classe, pois o mesmo descreve o assinante em si. Nmero de B No ser classe, pois o mesmo descreve o assinante em si. Tipo de Cobrana Ser classe, aponta todas as chamadas cobrar ou normal. Categoria do Ser classe, aponta todas as classes de assinantes. Assinante A Horrio da Ser classe, pois o mesmo aponta o tipo de tarifao Chamada da chamada. Durao da No pode ser classe, atributo numrico muito Chamada extenso, conteria milhares de classes. Tipo da Chamada Ser classe, pois o mesmo aponta o tipo da chamada. Tronco de No ser classe, pois descreve um tronco em si. Entrada Tronco de Sada No ser classe, pois descreve um tronco em si. Classe da Ser classe, pois o mesmo aponta a classe da Chamada chamada. Cdigo de Falha Ser classe, pois o mesmo aponta a classe da falha. da Chamada Tipo de Servio Ser classe, pois o mesmo aponta a classe do servio. Tipo do Acesso Ser classe, pois o mesmo aponta a classe do acesso. 39

Para todas as classificaes foi utilizado rvores de decises (Pruned C4 trees), pois grande parte dos atributos se tratam de literais, o que melhor manipulado por rvores. Outro ponto consiste na facilidade de visualizao do resultado, permitindo depurar e at mesmo ajudar no ajuste dos parmetros de classificao para alcanar resultados melhores (exluindo ou no os atributos que pouco afetam a separao/classificao).

40

9 RELAO ENTRE ASSINANTES

Nesta etapa foi realizada uma anlise das chamadas em comuns realizadas entre os assinantes telefnicos. A idia principal consistiu em criar um grafo direcionado, onde os vrtices representam os assinantes e as arestas ligaes feitas entre assinantes; tendo o grafo em mos possvel analisar e encontrar a ocorrncia de vrios subgrafos. Estes subgrafos mostram conjuntos de assinantes que possuem chamadas em comum entre eles, e pode representar alguma forma de relacionamento entre os mesmos. Como o volume de chamadas extremamente grande foram aplicados alguns filtros com o intuito de diminuir computacionalmente os recursos necessrios para a anlise dos dados (alguns desses filtros no seriam muito teis para um volume maior de dados), o objetivo diminuir o nmero de assinantes (ou vrtices do grafo) bem como tambm diminuir o nmero de relaes (ou arestas do grafo):

1. O primeiro filtro consistiu em fazer uma varredura por todos os CDRs e selecionar como assinante candidatos apenas aqueles cujos nmero de lista realizou pelo menos uma chamada telefnica e tambm receberam pelo menos uma nica chamada telefnica. Todos os outros assinantes (sejam os que s realizaram chamadas telefnicas, ou s receberam chamadas telefnicas) simplesmente no podem fazer parte de um grupo de relao, pois isso seria impossvel. Percebe-se que este filtro pouco til para uma base de dados reais, onde todos os assinantes recebem e realizam pelo menos uma chamada telefnica em um perodo (de um ms, por exemplo); 2. O Segundo filtro consiste em apenas criar uma nica aresta entre dois assinantes no importanto se entre eles foram realizadas uma nica ou centenas de chamads. Como nesta anlise optou-se por encontrar apenas assinantes relacionados, a fora da relao entre eles no traz nenhuma 41

importncia para a anlise; 3. O terceiro filtro consistiu em remover todos os assinantes (ou vrtices) que no se relacionam (no recebem nem realizam chamadas) com nenhum outro assinante da lista obtida do primeiro filtro.

No final, tem-se uma lista extremamente reduzida, onde constam apenas os assinantes que realmente possuem alguma possibilidade de se relacionarem com quais outros. Apenas como exemplo, inicialmente tinha-se uma lista com cerca de 150.000 assinantes; com a aplicao do primeiro filtro esta lista foi reduzida para 528 assinantes, e aps a aplicao do ltimo filtro chegamos a um nmero de 223 assinantes. Obtendo-se o grafo final (onde vrtices so assinantes e chamadas entre assinantes so arestas), foi possvel desenhar o mesmo, resultando na figura abaixo:

Figura 8 - Grafo de Relao dos Assinantes

Analisando a figura possvel apontar algumas estratgias de como utilizar as informaes obtidas, os itens abaixo possuem uma descrio das mesmas: 1. Existem grupos de assinantes que realizam chamadas entre si, a partir deste grupo possvel criar promoes instigando os mesmos a 42

utilizarem mais o telefone para se comunicarem; 2. Existem assinantes que realizam chamadas para alguns assinantes, contudo o mesmo no recebe muitas ligaes de volta destes outros assinantes; assim possvel realizar promoes que facilite o assinante que no retornam chamadas a faz-las; 3. Existem assinantes que recebem vrias ligaes de outros assinantes, pode-se oferecer a este assinante um servio do tipo chamada em espera, correio de voz ou at mesmo algum plano onde o mesmo recebe mais bonus pela quantidade de chamadas atentidas; 4. Existem assinantes que se comportam como centro de atendimento de chamadas, pode ento ser oferecido a estes assinantes servios de chamdas 0800 (para o caso de empresas) ou ento um servio de PBX ou Contact Center; 5. Existem conjuntos de assinantes que esto conectados de alguma forma em subgrafos, alm disso, estes subgrafos no possuem todos os ns conectados entre si; o que permite sugerir uma tentativa de conexo entre esses assinantes (totalmente ou parcialmente) seja atravs de um promoo ou informando o mesmo sobre um nmero de lista que est presente no crculo de seus amigos e que, no entanto o mesmo no possui o contato.

Lembrando que tendo um grafo direcionado montado das chamadas telefnicas, possvel utilizar qualquer algoritimo de minerao de dados ou da teoria dos grafos para que se encontre qualquer realao existente no mesmo. Este artigo se limitou em uma anlise visual do grafo, apenas com o intuito de demonstrar e provar que a partir dos grafos das chamadas telefnicas possveis obter diversos resultados bem como caractersticas dos assinantes; contudo isso praticamente nada se comparado com todas as informaes que podem ser realmente extradas.

43

44

10 CONCLUSO

A anlise de dados das chamadas telefnicas muito pouco ou quase nada explorada nos dias atuais. Grande parte dos trabalhos voltados para a rea consite em acompanhamentos simplificiados, como por exemplo: Acompanhamento de volume de chamadas Segmentao dos clientes Criao de modelo de vendas por segmentos As anlises mencionadas anteriormente utilizam-se muito pouco ou nada das tcnicas e modelos de minerao de dados estudados e desenvolvidos. Grandes partes dessas anlises consistem em anlise estatistica de comportamento com base em nmero de chamadas por perodo de tempo, ou na melhor das hipteses tcnicas de clustering tambm baseada na durao das chamadas realizadas pelos assinantes. Existe um estudo mais elaborado, onde foram anlisados registros de clientes de operadoras utilizando regresso ordinria [1], neste estudo os pesquisadores conseguem mostrar que possvel detectar padres de rotatividade de clientes das operadoras de telefonica mvel, e que portanto, possvel tomar medidas para que se diminua a taxa de clientes que cancelam seu contrato com uma operadora para aventurar-se em outra. No entanto o estudo no se utilizou dos CDRs, e sim de dados pr-processados e classificados pelas operadoras como clientes que cacelaram seu contrato ou no. Enfim, grande parte da dificuldade em se estabelecer e analisar os CDRs consiste no carater sigiloso da informao do mesmo (j que em praticamente todos os pases no mundo os acessos a chamadas telefnicas so confidenciais por lei, e s podem ser acessados mediante requisio judicial), seguido pelo grande volume de dados obtidos, e que requer altssimo custo computacional para a anlise. Um ponto extremamente importante na anlise dos CDRs consiste em compilar os atributos e dados obtidos para que 45

seja possvel gerar um novo conjunto de dados contendo apenas os atributos especficos para uma anlise em especfico; a idia de manter todos os atributos dos CDRs para que seja possvel realizar uma minerao de dados mais ampla na esperana de que possa ser encontradas um maior nmero de relao fantasioso e incompatvel com os recursos computacionais disponveis atualmente. perceptvel tambm que a restrio de acesso aos dados, limita em muito a poder que uma comunidade de pesquisadores pode despender em cima do assunto para que sejam criadas ferramentas poderosas, e por fim que alcance resultados que venham a agradar qualquer Diretor da rea de CRM ou Relao com os Clientes de uma empresa prestadora de servio de telefonia, estamos a em um empasse (entre necessidade de mercado e restrio judicial) que pode ser facilmente contornado tomando-se como exemplo o estudo realizado pelos pesquisadores Rupesh K. Gopal e Saroj K. Meher [1], onde foram disponibilizadas pelas empresas prestadoras de servio de telefonia mvel no os dados detalhados de cada chamada mais um conjunto de dados compilados que permita de alguma forma a minerao de algumas informaes. Independente da utilizao ou no dos dados de CDRs para anlise de comportamento dos assinantes estarem sendo utilizadas ou no, fato que esta base de dados consiste em uma das maiores fontes de informao disponibilizadas atualmente - o sistema de telefonia ainda hoje o principal meio de comunicao entre as pessoas (seja para fins familiares, negcio, governamental, amigos, etc). Sistema esse que apesar de estar migrando de forma acelerada para o uso da rede de dados da Internet, no vai perder sua principal caracterstica que consiste na conexo entre duas ou mais pessoas para a troca de informao/mdia (voz, vdeo, fotos, etc). Esta convergncia da telefonia para a rede de internet deve trazer ainda mais assinantes para a comunidade, o que com certeza vai aumentar ainda mais a gerao de dados de registro destas chamadas e permitir uma anlise ainda maior. Outro ponto de destaque, cosiste no uso restrito dessa massa de dados 46

apenas as operadoras de servio de telefonia, tais dados podem ser utilizados por diversas outras institues que queiram explorar de forma mais apropriada a carteira de clientes existente (atravs de um melhor conhecimento de seu perfil) e at mesmo por orgos governamentais responsveis por regular e monitorar a qualidade do servio de telefonia nos pases, uma ferramenta com tal objetivo poderia se tornar facilmente um software de medio de qualidade no servio bem como um indicador de que clusulas contratuais aceitas pelas operadoras (e propostas) pelo governo esto sendo respeitadas e atendidas confirme previamente acordado. Ressaltando que para os testes realizados neste estudo de caso foram utilizados CDRs referentes a um nico dia de chaamada de uma nica central, o que implica num baixo volume de relaes que so realmente possveis, caso seja possvel conseguir uma base de dados mais volumosa englobando mais dias fica evidente que o nmero de relaes tendem a aumentar (ainda mais quando consideramos chamdas em comum entre assinantes).

47

48

11 PRXIMOS PASSOS Existe uma enorme gama de anlise que podem ser feitas nos dados de CDRs, de uma forma geral pode-se criar aplicaes baseadas nas seguintes perspectivas:

Operadora de Servio (CRM: segmentao, promoes, marketing direcionado). Operadora de Servio (Q&A: comportamento da rede, definio de gargalos, pontos de melhoria, expanso) Operadora de Servio (Segurana: deteco de fraudes no uso da rede) Governo (Q&A: verificao de qualidade do servio)

Qualquer que seja a perspectiva necessrio definir bem o escopo do tipo de anlise a ser realizada, pois tendo o escopo bem definido possvel reduzir em muito o grande volume de dados a ser manipulado. Uma segunda opo, no mais simples, consiste em realizar uma anlise generalizada e para que se atenda computacionalmente os recursos pode-se atacar o problema utilizandose de algoritimos de reconhecimento de padres que possam ser paralelizados e que permitam diluir o custo computacional em um cluster de computadores. O uso de CDRs focando o servio para governos ou grandes operadoras de servio uma das melhores opes devido ao grande volume de problemas e benefcios que podem ser garimpados. No entanto, este no o nico mercado que pode ser beneficiado de uma anlise de comportamento de assinantes atravs de CDRs; existem hoje, milhares de centrais telefnicas espalhadas pelo mundo, essas centrais no so utilizadas para prover servio pblico de telefonia, mas sim para prover servio privado para uma empresa ou instituo qualquer. Essas centrais de menor porte e robustez suportam um servio de telefonia centralizado e so conhecidas como PBX (Private Branch Exchange). Os PBXs geram um volume de CDRs muito menor quando comparado as centrais de telefonia pblica concessionadas nacionalmente ( 49

claro que o volume varia de acordo com o nmero de funcionrios da empresa, mas mesmo uma empresa muito grande no chega perto de atingir a quantidade de habitantes de uma cidade de pequeno porte). Um menor

volume de CDRs significa uma reduo exponencial do custo computacional para a anlise dos CDRs, assim possvel anlisar comportamento dos funcionrios quanto ao uso do telefone bem como relao da empresa com seus clientes e fornecedores. Uma outra oportunidade a ser explorada consiste na anlise de CDRs gerados em sistema de contact center (onde so realizadas vendas, marketing e atendimento de reclamao dos clientes); possvel utilizar os CDRs destes sistemas para que sejam encontrados padres de

comportamento tanto dos clientes que se relacionam com a empresa bem como dos funcionrios responsveis em atender com qualidade os clientes. Pode-se tambm combinar os dados de CDRs com outros atributos dos assinantes de telelfonia que no estejam diretamente atrelado as chamadas (ou uso de mdia) realizadas. Por exemplo, pode-se adicionar dados como servios contratados (BINA, transferncia de chamada, etc), quantas vezes colocado crdito no celular por ms (ou valor pago pela conta), etc. Caso no seja possvel realizar uma anlise mais complexa dos padres, pode-se utilizar algoritimos mais simples, bem como o uso da estatstica para acompanhamento personalizado de cada assinante (ou funcionrio, cliente, fornecedor, etc.) e assim acompanhar a frequncia de uso do servio (ou contato e fora do relacionamento). Assim possvel enviar notificaes ou alertar quando um assinante est diminuindo em muito o uso da rede (o que pode significar uma mudana de operadora ou reduo do custo por algum motivo) ou ento at mesmo alertar quando um assinante passa a utilizar a rede em demasia, extrapolando seu comprtamento natural (o que pode significar fraude ou clonagem do aparelho). Finalmente, fica a sugesto para que se utilize os CDRs com a finalidade de criar um egine de classificao e priorizao de telefones, assim como o google capaz de apontar sites, fotos, vdeos e priorizar esses itens utilizando 50

algoritimos especficos; porque no utilizar a rede de telefonia como uma pgina amarela informatizada. Pode-se construir uma rede onde o volume de chamadas possa ser utilizado como score/rating de um estabelecimento comercial, assim fica mais fcil indicar a algum realizando uma busca qual o melhor estabelecimento seja para pedir uma pizza ou alugar um buffet para que seja realizada a festa de aniversrio dos filhos. No se deve esquecer tambm do mais importante, hoje estamos vivendo uma revoluo tecnolgica onde a rede de telefonia e a rede de dados (Internet) esto se convergindo e cada vez mais se tornando uma nica grande rede. Isso significa que em poucos anos, sendo assim, as informaes geradas pelos CDRs e tambm pelo acesso s pginas Web vo possuir uma maior interligao entre si, e uma extensa gama de novas anlise de padres poder ser realizada, visualizando assim e servios a serem oferecidos nunca imaginados antes.

51

52

REFERNCIAS BIBLIOGRFICAS GOPAL, R. K.; MEHER, S. K. Customer churn time prediction in mobile telecommunication industry using ordinal regression. In: ADVANCES IN KNOWLEDGE DISCOVERY AND DATA MINING, PACIFIC-ASIA CONFERENCE, PAKDD 2008, 12., 2008, May 20-23, Osaka, Japan. Proceedings Osaka: Springer, 2008. v. 5012, p 884-889. DOI: 10.1007/9783-540-68125-0_88. 2008. Lecture Notes in Computer Science.

53

S-ar putea să vă placă și