Sunteți pe pagina 1din 6

AplicacindeAlgoritmosGenticosenlaFragmentacinVerticalyasignacin simultaneaenBasesdeDatosDistribuidas RodrigoPeraltaGonzlez AlumnoIngenieraCivilInformtica UniversidadCatlicadelMaule Talca,Chile rodrigoperaltag@gmail.

com

Resumen. Actualmenteseproducequecadavezmaslasempresasseencuentranabarcandoterritorios geogrficamenteseparadosporlocual,estasposeensucursalesendiferenteslugares.Pero estas empresas necesitan compartir la informacin, es por esto y al actual avance tecnolgico que se pueden utilizar y aplicar las bases de datos distribuidas. Para ser diseadassenecesitatiempoyesfuerzopuestomanunarduotrabajoenlaproduccindela fragmentacinyubicacindelainformacin.Enestetrabajosepresenta unAlgoritmo Genticoparalaresolucindedichastareas,esteataca,simultneamente,elproblemade fragmentarverticalmenteyasignarlosfragmentosalossitiosdemaneraptima.Puesla naturalezaevolutivadelAlgoritmoGenticopermiteresolverenparalelolafragmentacin ylaasignacin:problemasqueguardanunarelacinnolinealentreellos.

Palabras clave: Bases de Datos, Distribucin, Fragmentacin, Algoritmos Genticos, Atributos,Transaccin.

1.Introduccin

En la bases de datos distribuidos, se trata de realizar de manera ptima la fragmentacindelosatributos,puesesteproblemasesumaalosyapresentadosalrealizar unabasededatosclsica.Cabedestacarqueelpropsitodelasbasesdedistribuidases mejorarelrendimientoglobaldelsistema. El diseo de la distribucin, a su vez, est compuesto de la fragmentacin (proceso mediante el cual una relacin global es descompuesta en fragmentos horizontales y/o verticales) y de la asignacin de los

fragmentosalosdiversossitiosdelared.Enestetrabajosepresentaraunasolucinala fragmentacinverticalyalaasignacindelosfragmentos,cabedecirquelafragmentacin verticalatiendealagrupamientodedatosenfuncindeatributosoconjuntosdeellosyla asignacin,porsuparte,serefierealproblemadeubicarlosfragmentos(yaseanverticales uhorizontales)demaneraqueelaccesoalainformacinsehagadelamejormanera posible. Tpicamente,loscriteriosquedeterminansilafragmentacinylaasignacinson ptimas se establecen de manera independiente. Por ello, es frecuente que se trate de optimizar endos pasos.Enel primero sebuscala fragmentacin ms ptima y,en el segundo,sebuscaubicarlosfragmentosobtenidosenelpasoanterior[CERI84]delamejor manera. Elpropsitofundamentalderealizarladistribucinesmejorarelrendimientoglobal delsistemaporloquetantolafragmentacincomolaubicacindelosfragmentosenlared debenestarfuertementeligadosconlosrequerimientos delsistemamismo.Estoes,las decisionesdequfragmentosformarydndeubicarlosdebensertomadasdeacuerdocon elusoquelasdiferentestransaccionesinduzcanenlosatributosdelarelacin,puesde acuerdoalosaccesosaestosylastransaccionesquesehacen,sedebetomarencuentapara ladistribucinylocalizacindelosdiferentesatributos[NAVA89]. 2.DesarrollodelAlgoritmoGentico Alrealizarunalgoritmogenticoloprimeroqueserequiereesdeterminarenqu espacioseencuentranlasposiblessolucionesalproblemaquesepretenderesolver.Peroel algoritmo opera sobre cdigos genticos, sobre genotipos que se debern inducir al espaciodesoluciones.Esdecir,esnecesario codificar dealgunamaneraeldominiodel problema para obtener estructuras manejables que puedan ser manipuladas por el AlgoritmoGenetico[MUTH83]. EstetrabajopresentaunAlgoritmoGentico(AG)diseadoparalafragmentacin vertical y asignacin simultanea en Bases de Datos Distribuidas. En el diseo de este algoritmoseutilizMATLAB6.5,ademsdela seleccinproporcional[BACK96],el cruzamiento simple y la mutacin uniforme [KURI99]. Algunos de los parmetros utilizados son:Probabilidad decruzamiento=0.85, Probabilidad demutacin=0.005 yy Nmerodegeneracionesaejecutarse=100.LaestructuradelAGeslasiguiente:

2.1.Representacindelassoluciones. Cuandosefragmentademaneraverticalsetienendistintasformasdedividiruna relacin dematributos.Cadaunadeesasopcionestienequeserrepresentadaconuna

cadenadelongitudfinitasobrealgnalfabetofinito[GOLD89],tomandoencuentalas caractersticas del problema que se est resolviendo. En este casolos atributos de una relacinyelsitioalcualsernasignadosstosdebensercodificados.Paralocualseutilizo un vector de enteros de longitud igual al numero de atributos y los nmeros que se encuentraenelvectoreselfragmentodondeestacadaunodelosatributo. Esdecirestevectortendrnmerosde1astaN,dondeNindicaenquefragmento seencuentraelatributoiesimodelvector.Deestamaneraelvectorsiguienterepresentara unaposiblesolucincon10atributosyunaredde5sitios. (5243133524) Estarepresentacinesadecuadaparaesteproblemayaquelasolucinincluyetanto la divisin de la relacin en subrelaciones como su asignacin a un sitio de la red simultneamente.

SitioAtributosenelFragmento 1 5 2 2 9 3 4 6 7 4 3 1 0 5 1 8 2.2.Poblacininicial. Acadapuntoselellamaindividuoyalconjuntodepuntosselellamapoblaciny esnecesariocrearunapoblacininicialparaelarranquedelalgoritmogentico.Eneste trabajolapoblacininicial,estacreadaalasardemaneraaleatoria,paralocualseutilizoun conjunto devectores enteros comolos delaseccin2.1,eltamao deestaesde100 individuos. 2.3.Funcindeevaluacin. Lafuncinobjetivo,sedefineenfuncindelatareadeoptimizacinquesedesea realizar.Enestecaso,elobjetivodefragmentaryasignarfragmentoseslaminimizacinde losaccesosremotos.Lafuncindeevaluacinpropuestaes. EP(i)=ER2

Estacalculaelcostodeaccederaatributosremotosrelevantesyparaellousala matrizdeusodeatributos(MUA)[MUTH93].Paracalcularloscostos,sedebeanalizar cadaunadelastransacciones,encadaunodelosfragmentos,ysecalculadelasiguiente manera


E2 R =

Dondeqteslacantidaddeaccesoalosatributosdelfragmentoi,|Ritk|eselnumero deatributosrelevantesdelosotrosfragmentosqueseaccedanenlatransaccintyn ritkes el numero total de atributos en los fragmentos. indica el mnimo de valor de la transaccin.Unejemplodeestaeslasiguiente: Atributos Trans A1A2A3A4A5 T1 0q10q1q1 T2 q2q2q20q2 T3 q300q3q3 T4 0q4q400 Lafuncinobjetivousadaenestealgoritmoes: fitness(i)=65000EP(i) 2.3.1MatrizdeusodeAtributos(MUA). Esta matriz utilizada en el desarrollo del algoritmo gentico, nos indica las diferentestransaccionesquesehacenyelnmerodeaccesoacadaunodelosatributos. Puesparapoderencontrarlamejoralternativadefragmentacinverticalyasignacinde losatributossedebeconsiderarlosaccesosalosdiferentesatributosdecadaunodelos fragmentos. Trans. Atri. T1 T2 T3 T4 T5 1 25 0 0 0 25 2 0 50 0 35 25 3 0 50 0 0 25 4 0 0 25 0 0 5 25 0 0 0 25 6 0 0 25 0 0 7 25 0 0 35 25 8 0 50 0 35 25 9 0 50 0 0 25 10 0 0 25 0 0

T6 T7 T8

25 0 0

0 0 0

0 25 15

0 0 15

25 0 0

0 0 15

0 0 0

0 0 0

0 25 15

0 0 15

2.4EjemplodeSolucin Elalgoritmomostraracomoresultadofinallaposicindelosatributosencadauno delosdiferentesfragmentos. Fragmento1:23 Fragmento3:1 Fragmento4: 56 Fragmento6:4 Fragmento7:710 Fragmento9:89

4.Conclusiones Se puede establecer que la naturaleza evolutiva del Algoritmos Genticos, nos permite atacar varias problemticas a la vez como es en el caso de este trabajo la fragmentacinverticalylaasignacinsimultanea.Puesademsnospermiteestablecerde mejormaneralaestructuradelosdiferentesproblemas,comosedaenestecasoconun simplevectorsepuederepresentarlaposiblesolucin. Durantetodoestetrabajosehablolodifcilderealizarlafragmentacinverticalyla asignacininstantnea,pueselalgoritmogenticomostrserunaalternativafactiblepara aplicarseenlasolucindeproblemasdefragmentacindeBDDenlosqueseconsiderala fragmentacinverticalylareplicacindedatos. Adems podemos decir que la metodologa planteado en este trabajo puede utilizarse en problemas ms generales, sin producirse cambios significativos. Por lo estudiadodealgoritmosgenticosyporlogeneralquesuelenserestos. 5.Referencias [BACK96] Back,T.EvolutinaryAlgorithmsinTheoryandPractice.Oxford UniversityPress.1996.

[CERI84]

CeriStefanoandGiuseppePelagatti.DistributedDatabase,Principles &Systems.McGrawHill.1984. Goldberg,D.E.GeneticAlgorithmsinSearch,Optimization,and MachineLearning.AddisonWesley.1989. Kuri,A.AComprehensiveApproachtoGeneticAlgorithmsin OptimizationandLearning.TheoryandApplications.Vol1. Foundations.IPN1999. MuthurajR.,S.Chakravarthy,R.VaradajanandS.B.Navathe.A FormalApproachtotheVerticalPartitioningProbleminDistributed DatabaseDesign.ProcedingIEEE,1993. NavatheS.AndM.Ra.VerticalPartitioningforDatabaseDesign:A GraphicalAlgorithm.ACM1989. OzsuTamerM.AndPatrickValduriez.PrinciplesofDistributed DatabaseSystems.PrenticeHall.1997.

[GOLD89]

[KURI99]

[MUTH93]

[NAVA89]

[OZSU97]

S-ar putea să vă placă și